Od polj do diskov
RAID (redundant array of independent disks) je kratica, ki označuje več diskov, povezanih v eno virtualno polje – zunanje naprave jih tako zaznavajo kot en velik disk. Različna polja se označujejo s številkami v imenu, izjema je le način JBOD, Just a Bunch of Drives, ki diskov sploh ne poveže v polje, temveč prikaže vsakega zase.
Čeprav NASi podpirajo tudi RAID 0, ga ne svetujemo. Ta piše izmenično na dva diska – to sicer zveča hitrost zapisovanja in branja, a tudi podvoji možnosti izgube podatkov, saj ob prenehanju delovanja enega diska izgubimo vse podatke.
Bistveno pripravnejši je RAID 1, pri katerem se podatki vzporedno pišejo na sodo število diskov (največkrat dva). Praviloma ga uporabljamo pri vseh napravah NAS, ki imajo prostora za dva diska, uporablja pa se tudi v osebnih računalnikih za zagotavljanje nemotenega delovanja tudi takrat, ko eden izmed diskov odpove. Kot pri vseh klasičnih oblikah RAID morajo biti diski enake velikosti, drugače se pri večjem disku koristi le toliko prostora, kolikor je velik najmanjši disk.
Čim dražja je naprava, tem več ima vmesnikov. USB 3.0 postaja praktično obvezen, eSata pa vse bolj izginja. Zmogljivejše naprave imajo po dva gigabitna omrežna priključka, nastavimo lahko, da delujeta oba vzporedno (za višjo hitrost) ali pa da drugi prevzame promet ob prekinitvi povezave pri prvem.
Razlika v velikosti ventilatorja je lahko zelo velika. Večji ventilatorji so načeloma tišji.
Za večja polja se največkrat uporablja RAID 5. Ta načeloma ponuja redundanco enega diska, zanj pa v polju potrebujemo vsaj tri diske. Če imamo torej tri diske po 2 TB, bo za en disk prostora namenjeno redundanci, uporabnega prostora pa bo torej 4 TB. Največje število diskov, ki jih imamo lahko združene v RAID 5, je omejeno le s strani krmilnika, a se z večanjem števila diskov višajo dostopni časi (torej je polje počasnejše), obenem pa se tudi dviguje nevarnost odpovedi več diskov hkrati (kot se je zgodilo nam v uvodnem primeru). RAID 5 predstavlja dobro razmerje med izkoriščenim prostorom, ki je na voljo za podatke, hitrostjo pisanja in branja ter varnostjo podatkov.
Delovanje polja RAID 5 na prvi pogled sicer ni najbolj logično (torej da lahko 4 TB podatkov zavarujemo z diskom velikosti 2 TB), a je še kar enostavno. Ko zapišemo dva enako velika podatka na prva dva diska v polju, se na tretjega zapiše rezultat logične operacije XOR med tema dvema podatkoma (slednja sta, seveda, sestavljena iz ničel in enic). Ob odpovedi kateregakoli od teh treh diskov lahko tako iz drugih dveh izračunamo manjkajoči podatek. Krmilnik te podatke zaradi hitrosti izmenično zapisuje na vse diske, je pa RAID 5 za krmilnik kljub temu nekoliko zahtevnejši kot RAID 1.
Pri najcenejših modelih moramo napravo za vgradnjo in menjavo diskov ugasniti in odpreti ohišje, boljši modeli pa uporabljajo sistem nosilcev, omogočajo pa menjavo diskov ob nepretrganem delovanju naprave.
Se pa pri poljih RAID 5 pojavlja vse več težav, za kar so odgovorni predvsem današnji večji diski (zmogljivosti več TB). Ko disk zaradi odpovedi delovanja zamenjamo, mora krmilnik polje znova vzpostaviti – torej na novo izračunati vse manjkajoče podatke. To lahko pri velikih diskih traja tudi kak dan, medtem pa se dogaja zelo veliko branja po preostalih diskih v polju. S tem intenzivnim branjem se poveča možnost, da ravno med vnovičnim vzpostavljanjem polja »mrkne« še kateri izmed preostalih diskov – s tem pa seveda izgubimo vse podatke. Podobno se lahko zgodi, če je na kakem (izmed sicer delujočih) diskov manjša napaka, ki prepreči vnovično vzpostavitev polja.
Rešitev je RAID 6, ki načeloma deluje zelo podobno kot RAID 5, le da ponuja redundanco za dva diska (in zanj potrebujemo vsaj 4 diske). Pri tem je sicer še malce zahtevnejši s stališča krmilnika, a so slednji danes že dovolj zmogljivi, da redko opazimo resno razliko v hitrosti. Seveda pa bomo glede na RAID 5 imeli še za en disk prostora manj.
Splošna omejitev vseh opisanih nivojev je v tem, da moramo uporabiti diske enakih velikosti, za povečevanje polja pa moramo slednjega povsem podreti in znova postaviti. Nekateri krmilniki sicer omogočajo povečevanje polja s postopno menjavo diskov, še vedno pa morajo biti na koncu vsi enako veliki. Ponujajo pa nekateri izdelovalci lastne rešitve, ki zaobidejo te omejitve.
Take rešitve trenutno ponujajo Netgear (imenujejo jo X-RAID 2), Synology (Synology Hibrid RAID), Drobo in LaCie (SimplyRAID). Pri vseh gre za razširitev klasičnega RAID 5 z Linuxovim LVM (Logical Volume Manager), ki diske navidezno razdeli na manjše segmente, ti pa se uporabijo v več poljih RAID 5. Če imamo torej dva diska, velika 3 TB, in dva, velika 2 TB, se ustvari eno polje štiri (navideznih) diskov po 2 TB in eno polje dveh (spet navideznih) diskov 1 TB. Polje lahko tako počasi večamo z menjavanjem manjših diskov. To sicer traja več ur (ali celo več deset ur), a zna biti predvsem za domače uporabnike kar koristno. Te oblike so resda malenkost počasnejše kot klasično polje RAID 5, a so naši preizkusi pokazali, da so odstopanja majhna (nekaj odstotkov), večina uporabnikov tega ne bo opazila. Qnap takega sistema še nima, ponujajo pa razširitev polja RAID (in tudi prehod iz ene oblike v drugo) s postopno menjavo vsakega izmed štirih diskov.
Kaj torej izbrati? Za uporabo v napravah NAS z dvema diskoma seveda RAID 1, za tiste, ki imajo po štiri diske, pa načeloma RAID 5. Če je možnost, domačim uporabnikom priporočamo uporabo prej opisane hibridne rešitve posameznih izdelovalcev, saj bomo lahko s časom nadgradili velikost polja. Resnejši uporabniki (podjetja) pa bodo hitro posegli po večjih napravah NAS, kjer je RAID 6 bolj smiseln. Seveda pa ne moremo dovolj poudariti, da NAS ni rešitev za varnostno kopiranje, ne glede na vrsto polja RAID. »Odleti« lahko namreč tudi kaj drugega, ne samo diski.
Kaj pa diski?
Na spletnih straneh izdelovalcev bomo našli kar nekaj priporočil o tem, katere oziroma kakšne diske uporabiti v teh napravah. Razlik med posameznimi modeli oziroma cenovnimi in zmogljivimi razredi je kar nekaj, seveda pa so na to vezane tudi cene posameznih modelov. Sami smo v okviru preizkusa NASov preizkusili tudi dva diska, namenjena prav napravam NAS.
Gre za WDjeva modela iz serije Red oznake WD10EFRX (sicer smo preizkušali z navadnimi diski serije Green – WD20EZRX), ki sta se kljub enaki hitrosti vrtenja (5400 RPM) in količini predpomnilnika (64 MB) izkazala za malenkost hitrejša. Razlike so resda majhne (nekaj odstotkov), je pa bila malenkost višja tudi poraba energije. Pomembneje pa je to, da imajo ti diski MTBF (Mean Time Between Failures) višji od diskov iz serije Green, namenjene namiznim računalnikom. Pri diskih je sicer zelo težko (če ne kar nemogoče) oceniti življenjsko dobo, podatek MTBF pa je kljub temu solidna iztočnica. Pri diskih serije Green nazivni čas med napakami 300.000 ur, pri seriji RED pa več kot trikrat toliko – milijon ur.
Zaradi cene in rednega izdelovanja varnostnih kopij (no, vsaj načeloma …) sami največkrat uporabljamo kar klasične diske, namenjeni uporabi v namiznih računalnikih. Smo pa pri zadnjem nakupu naprave NAS (konkretno model s šestimi diski) poleg nje naročili tudi diske iz WDjeve serije RED, kar vse bolj priporočamo tudi drugim. Ti diski so navsezadnje cenejši, kot so bili v preteklosti, razlike med njimi in cenejšimi diski so vse manjše. Diske podobne namembnosti imajo tudi drugi izdelovalci, denimo Seagateovi modeli z oznako NAS.
Odličen odprtokodni sistem FreeNAS ponuja vse, kar ponujajo drugi, prej kako funkcijo več kakor manj. Kljub dobremu vmesniku pa vendarle zahteva nekaj več dela in znanja.
Domača alternativa
Čeprav so se v zadnjih letih cene strežnikov NAS znižale, so te naprave za marsikoga še vedno predrage – sploh modeli s prostorom za štiri diske. Cene se gibljejo okoli štiristo evrov, seveda brez diskov. Ko vštejemo še te, pa hitro pristanemo tudi pri tisoč (ali več) evrih, za to ceno pa dobimo že presenetljivo spodoben računalnik.
Za potrebe strežnika NAS, ki bi si ga sestavili sami, v resnici ne potrebujemo zares hitrega računalnika. Najzmogljivejši tokrat preizkušeni strežniki uporabljajo Intelove procesorje Atom, zraven pa 1 ali največ 2 GB pomnilnika. Primerljivo zmogljiv rabljen namizni računalnik dobimo za dobrih sto evrov.
Za programsko plat priporočamo odprtokodni operacijski sistem FreeNAS, ki je zasnovan na operacijskem sistemu FreeBSD. Namestitev je sicer bolj linuxna, enako velja za osnovne nastavitve, a je dokumentacija dovolj jasna, da ne bi smelo povzročati pretiranih težav. Po prvih korakih lahko preklopimo v spletni vmesnik, podoben, kot ga poznamo iz drugih NAS naprav. Nastavitev in možnosti je zares veliko, vmesnik je zelo odziven, zahteva pa več privajanja in znanja kot samostojne NAS naprave (če ne zaradi drugega, že zaradi uporabe datotečnega sistema ZFS). Še posebej bomo »znanje« potrebovali, če bomo želeli postaviti polje RAID 5, saj sta v osnovi podprta le RAID 0 in 1, petka pa je na voljo kot dodatek. V duhu Linuxa ga moramo najprej sami prevesti.
Kombinacija FreeNAS in cenejšega računalnika je sicer dobra (predvsem cenejša) alternativa, ki pa zahteva več časa in znanja, obenem pa bo zavzela več prostora in oddajala več zvoka in toplote kot namenske rešitve. Za računalnikarje, ki se radi malo poigrajo, je kakor nalašč, za tiste, ki bi radi enostavnejšo rešitev, pa bodo namenske naprave kljub vsemu boljše.