Počítače Okna Internet

Rozpočet RAID. Testování výkonu. Výkon polí Raid 0 z jednoho disku

Pokud vás tento článek zajímá, pak jste se zjevně setkali nebo očekáváte, že se brzy setkáte s jedním z následujících problémů ve vašem počítači:

- zjevně není dostatek fyzického objemu pevného disku jako jednoho logického disku. Nejčastěji se tento problém vyskytuje při práci s velkými soubory (video, grafika, databáze);
- zjevně nedostatečný výkon pevného disku. Nejčastěji se tento problém vyskytuje při práci s nelineárními systémy pro úpravu videa nebo když velký počet uživatelů přistupuje k souborům na pevném disku současně;
- zjevně nedostatečná spolehlivost pevného disku. Nejčastěji k tomuto problému dochází, když potřebujete pracovat s daty, která se nikdy nesmí ztratit nebo která musí být uživateli vždy k dispozici. Smutná zkušenost ukazuje, že i to nejspolehlivější zařízení se někdy porouchá a zpravidla v tu nejméně vhodnou chvíli.
Tyto a některé další problémy lze vyřešit vytvořením systému RAID na vašem počítači.

Co je to "RAID"?

V roce 1987 publikovali Patterson, Gibson a Katz z Kalifornské univerzity v Berkeley A Case for Redundant Arrays of Inexpensive Disks (RAID). Tento článek popisoval různé typy diskových polí, zkráceně RAID – Redundant Array of Independent (nebo Inexpensive) Disks (redundantní pole nezávislých (nebo levných) disků). RAID je založen na následující myšlence: spojením několika malých a/nebo levných disků do pole můžete získat systém, který předčí ty nejdražší disky z hlediska objemu, rychlosti a spolehlivosti. Navíc z pohledu počítače takový systém vypadá jako jeden disk.
Víme, že MTBF pole disků se rovná MTBF jednoho disku děleného počtem disků v poli. V důsledku toho je MTBF pole pro mnoho aplikací příliš krátké. Diskové pole však může být tolerantní vůči selhání jednoho disku několika způsoby.

Ve výše uvedeném článku bylo definováno pět typů (úrovní) diskových polí: RAID-1, RAID-2, ..., RAID-5. Každý typ poskytoval odolnost proti chybám a také různé výhody oproti jedinému disku. Spolu s těmito pěti typy se stalo populární také neredundantní diskové pole RAID-0.

Jaké jsou úrovně RAID a kterou si mám vybrat?

RAID-0. Obvykle se definuje jako neredundantní skupina disků bez parity. RAID-0 se někdy nazývá "proužkovaný" ("pruhovaný" nebo "vesta") podle způsobu umístění informací na disky zahrnuté v poli:

Protože RAID-0 není redundantní, selhání jednoho disku způsobí selhání celého pole. Na druhou stranu RAID-0 poskytuje maximální rychlost výměny a efektivní využití místa na disku. Protože RAID-0 nevyžaduje složité matematické ani logické výpočty, jsou náklady na jeho implementaci minimální.

Rozsah: audio a video aplikace vyžadující vysokorychlostní nepřetržitý přenos dat, který nemůže zajistit jeden disk. Například studie provedené společností Mylex za účelem určení optimální konfigurace diskového systému pro nelineární stanici pro úpravu videa ukazují, že ve srovnání s jedním diskem poskytuje dvoudiskové pole RAID-0 o 96 % vyšší rychlost zápisu/čtení. tři disky - o 143 % (podle testu Miro VIDEO EXPERT Benchmark).
Minimální počet jednotek v poli „RAID-0“ jsou 2.

RAID-1. Běžněji známý jako „Mirroring“ je dvojice jednotek, které obsahují stejné informace a tvoří jednu logickou jednotku:

Záznam se provádí na oba disky v každém páru. Jednotky v páru však mohou provádět souběžné čtení. „Zrcadlení“ tedy může zdvojnásobit rychlost čtení, ale rychlost zápisu zůstává stejná. RAID-1 má 100% redundanci a selhání jednoho disku nevede k selhání celého pole – řadič jednoduše přepne operace čtení/zápisu na zbývající disk.
RAID-1 poskytuje nejvyšší výkon ze všech typů redundantních polí (RAID-1 - RAID-5), zejména ve víceuživatelském prostředí, ale nejhorší využití místa na disku. Protože RAID-1 nevyžaduje složité matematické ani logické výpočty, jsou náklady na jeho implementaci minimální.
Minimální počet jednotek v poli „RAID-1“ jsou 2.
Více polí RAID-1 lze zase zkombinovat do RAID-0 pro zvýšení rychlosti zápisu a zajištění spolehlivosti ukládání dat. Tato konfigurace se nazývá „dvouúrovňový“ RAID nebo RAID-10 (RAID 0+1):


Minimální počet jednotek v poli „RAID 0+1“ jsou 4.
Rozsah: levná pole, ve kterých je hlavní věcí spolehlivost ukládání dat.

RAID-2. Distribuuje data v proužcích o velikosti sektoru přes skupinu disků. Některé disky jsou určeny k ukládání ECC (Error Correction Code). Protože většina disků ve výchozím nastavení ukládá kódy ECC pro jednotlivé sektory, RAID-2 nabízí oproti RAID-3 jen malou výhodu, a proto není široce používán.

RAID-3. Stejně jako v případě RAID-2 jsou data distribuována do pruhů o velikosti jednoho sektoru a jeden z disků v poli je přidělen k ukládání informací o paritě:

RAID-3 se při detekci chyb spoléhá na kódy ECC uložené v každém sektoru. V případě selhání jednoho z disků je možné obnovit informace na něm uložené výpočtem exkluzivního OR (XOR) na základě informací o zbývajících jednotkách. Každá položka je obvykle distribuována mezi všechny jednotky, a proto je tento typ pole vhodný pro aplikace, které vyžadují intenzivní komunikaci s diskovým subsystémem. Protože každý I/O přistupuje ke všem diskům v poli, RAID-3 nemůže provádět více operací současně. Proto je RAID-3 dobrý pro jednouživatelské prostředí s jedním úkolem s dlouhými zápisy. Pro práci s krátkými nahrávkami je nutná synchronizace rotace diskových jednotek, protože jinak je nevyhnutelný pokles směnného kurzu. Používá se zřídka, protože. překonává RAID-5 z hlediska využití místa na disku. Realizace je nákladná.
Minimální počet jednotek v poli „RAID-3“ jsou 3.

RAID-4. RAID-4 je identický s RAID-3 kromě toho, že velikost pruhu je mnohem větší než jeden sektor. V tomto případě je čtení z jednoho disku (nepočítáme disk, který uchovává informace o paritě), takže lze provádět více čtení současně. Protože však každá operace zápisu musí aktualizovat obsah paritní jednotky, nelze provádět více operací zápisu současně. Tento typ pole nemá žádné výrazné výhody oproti poli RAID-5.
RAID-5. Tento typ pole se někdy nazývá „rotující paritní pole“. Tento typ pole úspěšně překonává nevýhodu vlastní RAID-4 – nemožnost současně provádět více operací zápisu. Toto pole, stejně jako RAID-4, používá pruhy velká velikost, ale na rozdíl od RAID-4 se informace o paritě neukládají na jeden disk, ale postupně na všechny disky:

Operace zápisu zpřístupňují jeden disk s daty a druhý disk s informacemi o paritě. Vzhledem k tomu, že informace o paritě pro různé pruhy jsou uloženy na různých jednotkách, je možné provádět více současných zápisů pouze ve vzácných případech, kdy jsou data nebo pruhy parity na stejné jednotce. Čím více jednotek v poli, tím méně často se umístění informačních a paritních pruhů shoduje.
Rozsah: spolehlivá pole velkého objemu. Realizace je nákladná.
Minimální počet jednotek v poli „RAID-5“ jsou 3.

RAID-1 nebo RAID-5?
Ve srovnání s RAID-1 využívá RAID-5 místo na disku ekonomičtěji, protože neukládá „kopii“ informací pro redundanci, ale kontrolní číslo. Díky tomu lze v RAID-5 kombinovat libovolný počet disků, z nichž pouze jeden bude obsahovat nadbytečné informace.
Ale vyšší efektivity využití místa na disku je dosaženo na úkor nižšího výměnného kurzu informací. Při zápisu informací do pole RAID-5 je nutné pokaždé aktualizovat informace o paritě. Chcete-li to provést, musíte určit, které paritní bity se změnily. Nejprve se přečtou staré informace, které mají být aktualizovány. Tyto informace se pak vynásobí XOR s nová informace. Výsledkem této operace je bitová maska, ve které každý bit =1 znamená, že paritní informace na odpovídající pozici by měla být nahrazena hodnotou. Potom se aktualizované informace o paritě zapíší do příslušného umístění. Proto pro každý požadavek programu na zápis informací RAID-5 provede dvě čtení, dva zápisy a dva XOR.
Efektivnější využití místa na disku (paritní blok je uložen místo kopie dat) něco stojí: generování a zápis paritních informací vyžaduje více času. To znamená, že rychlost zápisu na RAID-5 je nižší než na RAID-1 v poměru 3:5 nebo dokonce 1:3 (tj. rychlost zápisu na RAID-5 je 3/5 až 1/3 zápisu rychlost RAID-1). Z tohoto důvodu nemá smysl RAID-5 vytvářet softwarově. Nelze je také doporučit v případech, kdy je kritická rychlost zápisu.

Jakým způsobem implementovat RAID - softwarově nebo hardwarově?

Při čtení popisů různých úrovní RAID si všimnete, že nikde nejsou žádné specifické hardwarové požadavky, které by byly vyžadovány pro implementaci RAID. Z čehož můžeme usoudit, že vše, co je potřeba k implementaci RAID, je připojit požadovaný počet disků k řadiči dostupnému v počítači a nainstalovat do počítače speciální software. To je pravda, ale ne tak docela!
Skutečně existuje možnost softwarové implementace RAID. Příkladem může být OS Microsoft Windows NT 4.0 Server, který může implementovat softwarový RAID-0, -1 a dokonce RAID-5 (Microsoft Windows NT 4.0 Workstation poskytuje pouze RAID-0 a RAID-1). Toto řešení by však mělo být považováno za extrémně zjednodušené, neumožňující plně využít schopnosti pole RAID. Stačí říci, že se softwarovou implementací RAID je celá zátěž umístění informací na diskové jednotky, výpočtu řídicích kódů atd. padá na procesor, což přirozeně nezvyšuje výkon a spolehlivost systému. Ze stejných důvodů zde nejsou prakticky žádné servisní funkce a veškeré operace pro výměnu vadného disku, přidání nového disku, změnu úrovně RAID atd. jsou prováděny s úplnou ztrátou dat a s úplným zákazem provádění jakýchkoli jiné operace. Jedinou výhodou softwarové implementace RAID jsou minimální náklady.
- specializovaný řadič osvobozuje CPU od základních operací s RAID a účinnost řadiče je tím znatelnější, čím vyšší je úroveň složitosti RAID;
- řadiče jsou zpravidla vybaveny ovladači, které vám umožňují vytvořit RAID pro téměř jakýkoli populární operační systém;
- vestavěný BIOS řadiče a k němu připojené ovládací programy umožňují správci systému snadno připojovat, odpojovat nebo vyměňovat disky zahrnuté v RAID, vytvářet několik RAID polí, a to i různých úrovní, sledovat stav diskového pole , atd. S "pokročilými" ovladači lze tyto operace provádět "za běhu", tzn. bez vypnutí systémová jednotka. Mnoho operací lze provádět v " Pozadí", tj. bez přerušení dosavadní práce a to i vzdáleně, tzn. z jakéhokoli (samozřejmě, pokud máte přístup) pracoviště;
- řadiče mohou být vybaveny vyrovnávací pamětí ("cache"), do které je uloženo posledních pár bloků dat, což při častém přístupu ke stejným souborům může výrazně zvýšit rychlost diskového systému.
Nevýhodou hardwarového RAID je poměrně vysoká cena RAID řadičů. Na jednu stranu však musíte za vše zaplatit (spolehlivost, rychlost, obsluha). Na druhou stranu v poslední době s rozvojem mikroprocesorové technologie začala cena RAID řadičů (zejména nižších modelů) prudce klesat a stala se srovnatelnou s cenou běžných diskových řadičů, což umožňuje instalovat RAID systémy nejen v drahých sálových počítačích, ale také na serverech. vstupní úroveň a dokonce i pracovní stanice.

Jak vybrat model řadiče RAID?

Existuje několik typů řadičů RAID v závislosti na jejich funkčnosti, designu a ceně:
1. Řadiče disků s funkcí RAID.
Ve skutečnosti se jedná o obyčejný diskový řadič, který díky speciálnímu firmware BIOSu umožňuje spojovat disky do pole RAID, obvykle úrovně 0, 1 nebo 0 + 1.

Ultra (Ultra Wide) SCSI řadič od Mylex KT930RF (KT950RF).
Externě se tento řadič neliší od běžného SCSI řadiče. Veškerá "specializace" je v BIOSu, který je jakoby rozdělen na dvě části - "SCSI Configuration" / "RAID Configuration". Navzdory nízké ceně (méně než 200 $) má tento ovladač dobrou sadu funkcí:

- Kombinace až 8 disků v RAID 0, 1 nebo 0+1;
- Podpěra, podpora horká rezerva nahradit "za chodu" neúspěšný pohon;
- možnost automatické (bez zásahu obsluhy) výměny vadného pohonu;
- automatická kontrola integrity a identity (pro RAID-1) dat;
- přítomnost hesla pro přístup do systému BIOS;
- program RAIDplus poskytující informace o stavu disků v RAID;
- ovladače pro DOS, Windows 95, NT 3.5x, 4.0

Nyní se podívejme, jaké typy existují a jak se liší.

UC Berkeley představila následující úrovně specifikace RAID, které byly přijaty jako de facto standard:

  • RAID 0- vysoce výkonné diskové pole s stripingem, bez chybové odolnosti;
  • - zrcadlové diskové pole;
  • RAID 2 vyhrazeno pro pole, která používají Hammingův kód;
  • RAID 3 a 4- disková pole s stripingem a vyhrazeným paritním diskem;
  • - diskové pole s stripingem a "nepřiděleným paritním diskem";
  • - prokládané diskové pole pomocí dvou kontrolních součtů vypočtených dvěma nezávislými způsoby;
  • - Pole RAID 0 vytvořené z polí RAID 1;
  • - Pole RAID 0 vytvořené z polí RAID 5;
  • - pole RAID 0 vytvořené z polí RAID 6.

Hardwarový řadič RAID může podporovat několik různých polí RAID současně, jejichž celkový počet pevných disků nepřesahuje počet slotů pro ně. Zároveň je ovladač zabudovaný v základní desce, v nastavení BIOSu má pouze dva stavy (povoleno nebo zakázáno), takže nový pevný disk připojen k nepoužívanému konektoru řadiče, když aktivovaný režim RAID může být systémem ignorován, dokud není přidružen jako další JBOD (spanned) pole RAID skládající se z jednoho disku.

RAID 0 (pruhování - "střídání")

Režim, který maximalizuje výkon. Data jsou rovnoměrně rozmístěna po discích pole, disky jsou spojeny do jednoho, který lze rozdělit na více. Distribuované operace čtení a zápisu vám umožňují výrazně zvýšit rychlost práce, protože několik disků současně čte / zapisuje svou část dat. Uživateli je k dispozici celý objem disků, což ale snižuje spolehlivost ukládání dat, protože při poruše jednoho z disků je pole obvykle zničeno a obnova dat je téměř nemožná. Rozsah - aplikace, které vyžadují vysokou rychlost výměny disku, jako je nahrávání videa, střih videa. Doporučeno pro použití s ​​vysoce spolehlivými disky.

(zrcadlení - "zrcadlení")

pole dvou disků, které jsou navzájem úplnými kopiemi. Nezaměňujte s poli RAID 1+0, RAID 0+1 a RAID 10, která používají více než dva disky a sofistikovanější mechanismy zrcadlení.

Poskytuje přijatelnou rychlost zápisu a zvýšení rychlosti čtení při paralelizaci dotazů.

Má vysokou spolehlivost – funguje, dokud je funkční alespoň jeden disk v poli. Pravděpodobnost selhání dvou disků najednou se rovná součinu pravděpodobností selhání každého disku, tzn. výrazně nižší než pravděpodobnost selhání jediného pohonu. V praxi platí, že pokud jeden z disků selže, měla by být přijata naléhavá opatření – redundance by měla být znovu obnovena. Chcete-li to provést, s jakoukoli úrovní RAID (kromě nuly) se doporučuje použít horké náhradní disky.

Obdobně jako RAID10, varianta distribuce dat mezi disky, umožňující použití lichého počtu disků (minimální počet je 3)

RAID 2, 3, 4

různé možnosti pro distribuované úložiště s disky přidělenými pro paritní kódy a různé velikosti bloků. V současné době se prakticky nepoužívají z důvodu nízkého výkonu a nutnosti alokovat hodně místa na disku pro ukládání ECC a/nebo paritních kódů.

Hlavní nevýhodou RAID úrovní 2 až 4 je nemožnost provádět operace paralelního zápisu, protože pro ukládání paritních informací se používá samostatný paritní disk. RAID 5 tuto nevýhodu nemá. Datové bloky a kontrolní součty se cyklicky zapisují na všechny disky v poli, v konfiguraci disku nedochází k asymetrii. Kontrolní součty jsou výsledkem operace XOR (exkluzivní nebo). Xor má funkci, která umožňuje nahradit jakýkoli operand výsledkem a pomocí algoritmu xor, získáte jako výsledek chybějící operand. Například: a xor b = c(kde A, b, C- tři disky raidového pole), pokud A odmítne, můžeme ho získat tím, že ho dáme na jeho místo C a strávit xor mezi C a b: xor b = a. To platí bez ohledu na počet operandů: a xor b xor c xor d = e. Pokud selže C pak E zaujme jeho místo a xor jako výsledek dostaneme C: a xor b xor e xor d = c. Tato metoda v podstatě poskytuje odolnost proti chybám verze 5. K uložení výsledku xor je potřeba pouze 1 disk, jehož velikost se rovná velikosti jakéhokoli jiného disku v raidu.

Výhody

RAID5 se rozšířil především díky své nákladové efektivitě. Velikost diskového pole RAID5 se vypočítá pomocí vzorce (n-1)*hddsize, kde n je počet disků v poli a hddsize je velikost nejmenšího disku. Například pro pole čtyř 80GB disků bude celkový objem (4 - 1) * 80 = 240 GB. Na zápis informací na svazek RAID 5 se vynakládají další prostředky a výkon klesá, protože jsou vyžadovány další výpočty a operace zápisu, ale při čtení (ve srovnání se samostatným pevným diskem) je zisk, protože datové toky z několika disků pole mohou zpracovávat paralelně.

nevýhody

Výkon RAID 5 je znatelně nižší, zejména při operacích náhodného zápisu (zápisy v náhodném pořadí), při kterých výkon klesne o 10–25 % oproti výkonu RAID 0 (nebo RAID 10), protože vyžaduje více operací s diskem (každá operace zapisuje s s výjimkou tzv. full-stripe zápisů je server na řadiči RAID nahrazen čtyřmi - dvě čtení a dva zápisy). Nevýhody RAID 5 se objevují při poruše jednoho z disků - celý svazek přejde do kritického režimu (degradace), všechny operace zápisu a čtení jsou doprovázeny dalšími manipulacemi, výkon prudce klesá. V tomto případě je úroveň spolehlivosti snížena na spolehlivost RAID-0 s odpovídajícím počtem disků (tj. nkrát nižší než spolehlivost jednoho disku). Pokud dojde k poruše před kompletní obnovou pole nebo dojde k neopravitelné chybě čtení alespoň na jednom dalším disku, pak je pole zničeno a data na něm nelze obnovit konvenčními metodami. Je také třeba vzít v úvahu, že proces RAID Reconstruction (obnova dat RAID z důvodu redundance) po selhání disku způsobuje intenzivní čtecí zátěž z disků po mnoho hodin nepřetržitě, což může způsobit selhání kteréhokoli ze zbývajících disků. nejméně chráněnou dobu provozu pole RAID a také k detekci dříve nezjištěných chyb čtení ve studených datových polích (data, ke kterým se při běžném provozu pole nepřistupuje, archivovaná a neaktivní data), což zvyšuje riziko selhání při obnově dat.

Minimální počet použitých disků jsou tři.

RAID 6 - podobný RAID 5, ale má vyšší míru spolehlivosti - pro kontrolní součty je přidělena kapacita 2 disků, 2 součty jsou počítány pomocí různých algoritmů. Vyžaduje výkonnější řadič RAID. Zajišťuje provozuschopnost po současném selhání dvou disků - ochrana proti vícenásobnému selhání. K uspořádání pole jsou potřeba minimálně 4 disky. Použití RAID-6 obvykle způsobuje přibližně 10-15% pokles výkonu skupiny disků ve srovnání s RAID 5, což je způsobeno velkým množstvím zpracování pro řadič (potřeba vypočítat druhý kontrolní součet a číst a přepisovat více disku bloky, když je každý blok zapsán).

RAID 0+1

RAID 0+1 může v zásadě znamenat dvě možnosti:

  • dva RAID 0 jsou sloučeny do RAID 1;
  • tři nebo více disků jsou spojeny do pole a každý datový blok je zapsán na dva disky tohoto pole; tedy u tohoto přístupu, stejně jako u „čistého“ RAID 1, je užitečný objem pole poloviční z celkového objemu všech disků (pokud se jedná o disky stejné kapacity).

RAID 10 (1+0)

RAID 10 je zrcadlené pole, ve kterém jsou data zapisována postupně na několik disků, jako v RAID 0. Tato architektura je pole typu RAID 0, jehož segmenty jsou pole RAID 1 namísto jednotlivých disků. Pole této úrovně musí obsahovat alespoň 4 disky (a vždy sudé číslo). RAID 10 kombinuje vysokou odolnost proti chybám a výkon.

Tvrzení, že RAID 10 je nejspolehlivější možností pro ukládání dat, je zdůvodněno tím, že pole bude vyřazeno z provozu po výpadku všech disků ve stejném poli. Při selhání jednoho disku je pravděpodobnost selhání druhého ve stejném poli 1/3*100=33 %. RAID 0+1 selže, pokud selžou dva disky v různých polích. Pravděpodobnost selhání disku v sousedním poli je 2/3*100=66 %, ale protože disk v poli s již porouchaným diskem se již nepoužívá, je pravděpodobné, že další disk deaktivuje celé pole je 2/2 * 100 = 100 %

pole podobné RAID5, ale kromě distribuovaného úložiště paritních kódů se používá distribuce náhradních oblastí - ve skutečnosti se používá HDD, které lze přidat do pole RAID5 jako náhradní (taková pole se nazývají 5+ nebo 5+spare). V poli RAID 5 je náhradní disk nečinný, dokud jeden z primárních disků selže. pevné disky, zatímco v poli RAID 5EE je tento disk neustále sdílen se zbytkem HDD, což má pozitivní vliv na výkon pole. Například pole RAID5EE s 5 pevnými disky může provést o 25 % více I/O operací za sekundu než pole RAID5 se 4 primárními a jedním náhradním pevným diskem. Minimální počet disků pro takové pole jsou 4.

spojení dvou (nebo více, ale to se velmi zřídka používá) polí RAID5 do pruhu, tzn. kombinace RAID5 a RAID0, částečně korigující hlavní nevýhodu RAID5 - nízká rychlost zápis dat pomocí paralelního použití několika takových polí. Celková kapacita pole je snížena o kapacitu dvou disků, ale na rozdíl od RAID6 dokáže tolerovat pouze selhání jediného disku bez ztráty dat a minimální počet disků nutných k vytvoření pole RAID50 je 6. Spolu s RAID10 toto je nejvíce doporučená úroveň RAID pro použití v aplikacích, kde je vyžadován vysoký výkon kombinovaný s přijatelnou spolehlivostí.

sloučení dvou polí RAID6 do pruhu. Rychlost zápisu je přibližně dvojnásobná oproti rychlosti zápisu v RAID6. Minimální počet disků pro vytvoření takového pole je 8. Informace se neztratí, pokud selžou dva disky z každého pole RAID 6.

RAID 00


RAID 00 je velmi vzácný, setkal jsem se s ním na řadičích LSI. Skupina disků RAID 00 je rozložená skupina disků, která vytváří prokládanou sadu z řady
disková pole RAID 0. RAID 00 neposkytuje redundanci dat, ale spolu s RAID 0 nabízí nejlepší výkon ze všech úrovní RAID. RAID 00 rozděluje data na menší segmenty a poté rozkládá datové segmenty na každém disku ve skupině úložiště. Velikost každého datového segmentu je určena velikostí pruhu. RAID 00 nabízí vysokou šířku pásma. RAID 00 není odolný vůči chybám. Pokud selže disk ve skupině disků RAID 0, celý
virtuální disk (všechny disky spojené s virtuální disk) selže. Rozdělením velkého souboru na menší segmenty může řadič RAID používat oba SAS
řadič pro rychlejší čtení nebo zápis souboru. RAID 00 nepředpokládá, že výpočty parity komplikují operace zápisu. Díky tomu je RAID 00 ideální
aplikace, které vyžadují velkou šířku pásma, ale nevyžadují odolnost proti chybám. Může se skládat ze 2 až 256 disků.

Který je rychlejší RAID 0 nebo RAID 00?


Provedl jsem své testování popsané v článku o optimalizaci rychlosti SSD na řadičích LSI a získal jsem tato čísla na polích 6 SSD

Porovnání výkonu řešení stejné cenové hladiny

Zajímavý fakt: takzvaný Experience Index ve Windows 7, který hodnotí výkon hlavních PC subsystémů, pro typický SSD (solid-state drive) a zdaleka ne nejpomalejší (kolem 200 MB/s pro čtení a zápis , náhodný přístup - 0,1 ms) , vykazuje hodnotu 7,0, zatímco indexy všech ostatních subsystémů (procesor, paměť, grafika, herní grafika) ve stejných desktopových systémech založených na starších CPU (s průměrem 4 GB DDR3-1333 paměti na dnešní dobu a v průměru stejná herní grafická karta jako AMD Radeon HD 5770) jsou hodnoceny hodnotami výrazně vyššími než 7,0 (konkrétně 7,4-7,8; toto kritérium ve Windows 7 má logaritmickou stupnici, takže rozdíl v desetinách převádí do desítek procent absolutních hodnot). To znamená, že rychlý „domácí“ SSD na sběrnici SATA je podle Windows 7 úzkým hrdlem i v ne úplně špičkových stolních počítačích současnosti. Jaký by měl být (pobuřující?) výkon systémového disku, aby ho "velká a mocná" "sedmička" považovala za hodný zbytku komponent takového PC? .. :)

Tato otázka je zjevně řečnická, protože jen málo lidí se nyní při výběru konfigurace své plochy řídí „indexem zkušeností“ systému Windows 7. A SSD jsou již pevně zakořeněny v myslích uživatelů jako nealternativní možnost, pokud chcete z diskového subsystému vymáčknout maximum a získat pohodlnou práci „bez brzd“. Ale je tomu skutečně tak? Je Windows 7 sám ve svém hodnocení skutečné užitečnosti SSD? A existuje nějaká alternativa k SSD ve výkonných desktopech? Zvláště pokud nechcete opravdu vidět beznadějnou prázdnotu ve své peněžence ... Dovolujeme si nabídnout jednu z možnosti náhrady.

Jaké jsou hlavní nevýhody moderních SSD? Pokud nevezmeme v úvahu „dlouhohrající“ spory o jejich spolehlivost, životnost a degradaci v čase, pak jsou takové nedostatky vesměs dva: malá kapacita a poměrně vysoká cena. Průměrný 128 GB MLC SSD nyní stojí kolem 8 000 rublů. (cena v době psaní článku; samozřejmě velmi záleží na modelu, ale pořadí cen je zatím). To samozřejmě není 600 rublů za 1 GB, jako u paměti DDR3, ale o řád méně, ale stále zdaleka ne tak malé jako u tradičních magnetických pevných disků. Opravdu, velmi produktivní „sedmitisícovka“ 1 000 GB s maximální rychlostí čtení / zápisu asi 150 MB / s (což mimochodem není o moc méně než SSD za 8 tisíc rublů!) Nyní si můžete koupit méně než 2000 rublů. (například Hitachi 7K1000.C nebo něco korejského). Jednotková cena gigabajtu prostoru bude v tomto případě pouze 2 (dva) rubly! Cítíte rozdíl oproti SSD s jeho 60 rubly za gigabajt? ;) A je "propast" mezi nimi opravdu tak velká v typických desktopových aplikacích s velkým počtem po sobě jdoucích přístupů? Například při práci s videem, zvukem, grafikou atd. Koneckonců, typická rychlost sekvenčního čtení MLC SSD (160-240 MB/s) o mnoho nepřesahuje rychlost prvních 120 gigabajtů prostoru ve stejném " sedm tisíc terabajtů“ (150 MB / s). A pokud jde o rychlost sekvenčního zápisu, obecně mají přibližnou paritu (stejných 150 MB / s oproti 70-190 pro SSD). Ano, z hlediska doby náhodného přístupu jsou naprosto nesrovnatelné, ale přeci jen si na desktopu nestavíme server pro sebe.

Navíc pro stolní počítač je v současnosti stejných 128 GB extrémně frivolní objem (v 80 GB je to obecně směšné). Sotva se do něj vejde jeden nebo dva systémové oddíly s OS a hlavními aplikacemi. A kam uložit četné multimediální soubory? Kam dát hračky, z nichž každá nyní utáhne 5-20 GB rozbalené? Zkrátka bez normálního prostorného „šroubu“ stále nikde. Otázkou pouze je, zda to bude systémové nebo doplňkové v počítači.

Co když se přiblížíte z druhé strany? Protože bez pevného disku (pamatujte starou dobrou zkratku – harddisky, nebo prostě „pevné disky“) s PC kdekoli, tak proč je nespojit do pole RAID? Navíc mnozí z nás dostali jednoduchý RAID řadič vlastně „zdarma“ – v jižním můstku základních desek založených na čipsetech AMD, Intel nebo Nvidia. Například stejných 8 000 rublů nelze utratit za SSD, ale za 4 „terabajty“. Pojďme je spojit do pole (y) – nebudeme pak muset kupovat prostorný HDD pro ukládání dat, čili dokonce ušetříme. Nebo jako druhá možnost - spolu s nákupem jednoho SSD a jednoho 2-3 TB disku si můžete pořídit 4 disky po 1,5-2 TB ...

A co víc, řekněme, že čtyřdiskový RAID 0 bude mít nejen čtyřnásobnou kapacitu, ale také čtyřnásobnou lineární rychlost čtení/zápisu. A to už je 400-600 MB/s, což je jeden SSD stejnou cenu ani ve snu se mi nezdálo! Podle něj tedy takové pole bude fungovat mnohem rychleji než SSD alespoň, se streamováním dat (čtení/zápis/úprava videa, kopírování velkých souborů atd.). Je možné, že v jiných typických problémech osobní počítač takové pole se nebude chovat hůř než SSD - koneckonců procento sekvenčních operací v takových úlohách je velmi vysoké a náhodné přístupy se zpravidla provádějí na poměrně kompaktní části tak prostorné jednotky (stránkovací soubor, dočasný soubor editoru fotografií atd.), to znamená, že pohyb hlav uvnitř této sekce bude mnohem rychlejší, než je průměr disku - během několika milisekund), což se samozřejmě pozitivně projeví na jeho výkonu. Pokud je v OS také cacheováno vícediskové RAID pole, pak od něj můžete očekávat působivou rychlost i při operacích s malými datovými bloky.

Abychom ověřili naše předpoklady, otestovali jsme čtyřdisková pole RAID 0 a RAID 5 terabajtových disků Hitachi Deskstar E7K1000 s 7200 otáčkami za minutu a 32 MB vyrovnávací paměti. Ano, jsou poněkud pomalejší, pokud jde o rychlost desek, než novější a ty, které se v současnosti prodávají za 1800-1900 rublů za kus. Disky Hitachi 7K1000.C stejné kapacity. Jejich firmware je však lépe optimalizován pro disky v polích, takže s trochou nedostatku kýžených 600 MB/s pro maximální rychlost čtení 4diskového RAID 0 získáme lepší výkon v úlohách se značným počtem náhodné přístupy. A vzory, které jsme našli, lze rozšířit na pole rychlejších (a prostornějších) modelů disků od různých výrobců.

Při použití základních desek založených na čipsetech Intel s jižními můstky ICH8R/ICH9R/ICH10R (a novějšími) se domníváme, že je optimální uspořádat čtyři terabajtové disky následovně. Díky technologii Intel Matrix RAID z první poloviny objemu každého z disků vyrobíme 2 TB pole RAID 0 (aby jej bez speciálních triků pochopily i operační systémy pod Vistou), které nám poskytne nejvyšší výkon systémových oddílů, rychlý oběd aplikace a hry, stejně jako vysokorychlostní provozní práci s multimédii a dalším obsahem. A pro spolehlivější uložení pro nás důležitých dat zkombinujeme druhou polovinu objemu těchto disků do pole RAID 5 (mimochodem, výkon také není zdaleka nejhorší, jak uvidíme dále) . Tedy za pouhých 8 tisíc rublů. získáme jak superrychlý 2TB systémový disk, tak spolehlivý a prostorný 1,5TB „archivní“ svazek. Právě v této konfiguraci dvou polí, které jsme vytvořili s výchozími hodnotami, provedeme další testování. Zejména podezřelí hateři RAID5 na řadičích Intel však místo toho dokážou postavit RAID10 jedenapůlkrát menší - jeho výkon pro čtení dat bude nižší než u RAID5, při zápisu (s cachováním) jsou přibližně rovnocenné, ale spolehlivost a data bude lepší obnovitelnost při kolapsu pole (v polovině případů lze RAID10 oživit, pokud selžou i dva disky).

Nástroj Intel Matrix Storage Manager umožňuje povolit a zakázat ukládání do mezipaměti zápisu na těchto diskových polích pomocí operačního systému (tj. RAM PC), viz třetí řádek shora v pravém informačním poli na snímku obrazovky:

Ukládání do mezipaměti může výrazně urychlit provoz polí s malými soubory a datovými bloky a také rychlost zápisu do pole RAID 5 (což je někdy velmi kritické). Proto jsme pro přehlednost provedli testy s povoleným a zakázaným ukládáním do mezipaměti. Níže se také dotkneme problémů se zatížením procesoru s povoleným ukládáním do mezipaměti.

Testy jsme provedli na testovacím systému představujícím typický, nikoli nejvýkonnější desktop v moderní době:

  • procesor Intel Core 2 Duo E8400 (3 GHz);
  • 2 GB systémové paměti DDR2-800;
  • Deska ASUS P5Q-E založená na čipové sadě Intel P45 Express s ICH10R;
  • Video akcelerátor AMD Radeon HD 5770.

Systémový disk Seagate ST950042AS obsahoval Windows 7 x64 Ultimate a Windows XP SP3 Pro (testovaná pole a disky byly testovány v „čistém“ stavu). Jako benchmarky jsme použili ATTO Disk Benchmark 2.41, Futuremark PCMark05, Futuremark PCMark Vantage x86, Intel NAS Performance Toolkit 1.7 atd., na základě jejichž výsledků posoudíme rivalitu SSD s tradičním RAID. Testy byly provedeny pětkrát a výsledky byly zprůměrovány. Pro orientaci ve spodní části diagramů s výsledky testů jsou uvedeny údaje pro rychlý jeden disk Seagate Barracuda XT ST32000641AS s kapacitou 2 TB, tedy stejnou jako „systémový“ RAID 0 čtyř Hitachi Deskstar E7K1000 Námi testovaný HDE721010SLA330.

Čest levného, ​​ale velmi produktivního SSD s kapacitou 128 GB a cenou (v době psaní tohoto článku) v oblasti 8 000 rublů. chránil model PNY Optima SSD 128GB MLC. Pojďme se na to nejprve podívat blíže.

SSD PNY Optima 128GB Gen2

Číslo modelu P-SSD2S128GM-CT01 (firmware 0309) je typický 2,5" SATA SSD ve stylovém černém kovovém pouzdře o tloušťce 9,5 mm. Jeho výrobcem je společnost známější pro své flash disky a paměťové moduly.


PNYOptimaSSD 128GBMLC

Základem disku je flash paměť Intel 29F64G08CAMDB s MLC buňkami a řadičem JMicron JMF612, který tomuto SSD umožňuje pracovat nejen přes Serial ATA, ale také přes USB 2.0 (minikonektor druhého je umístěn vedle SATA portu v zadní konec pouzdra na disk).

To znamená, že tento disk SSD lze také použít jako přenosné úložiště odolné proti nárazům. Pravda, USB kabel není součástí balení. Ale cenu produktu nelze nazvat předraženou.


Řídicí deskaPNYOptimaSSD 128GBMLC

Výrobce u tohoto modelu slibuje rychlost čtení 235 MB/s a rychlost zápisu 150 MB/s (v praxi se ukázala být ještě o něco vyšší). Disková mezipaměť je 64 MB, integrovaná je podpora TRIM, odolnost proti nárazu je uváděna na 1500 g a rozsah provozních teplot je od -10 do +70 °C. Výrobce na tento model poskytuje 3letou záruku s MTBF 1,5 milionu hodin.

Mimochodem, neměli bychom se mýlit a považovat oblíbené MLC SSD založené na řadiči JMicron JMB612 za řešení „nižší třídy“. Jak je ukázáno, disky na tomto řadiči nevypadají v průměru o nic hůř než SSD podobné kapacity a ceny na řadičích od Indilinx (IDX110), Intel, SandForce (SF1222) a Samsung, dokonce je překonávají v řadě diskových benchmarků.

Výsledky testů

Maximální rychlost sekvenčního čtení a zápisu dat užitečného zatížení pro SSD PNY Optima 128GB podle výsledků testu ATTO Disk Benchmark 2.41 (zápis a čtení 256 MB souboru v blocích od 64 KB do 8 MB) byla 238 a 155 MB / s, což je o něco vyšší než hodnoty deklarované výrobcem (viz diagram).

Je zajímavé, že nízkoúrovňový test HD Tach RW 3.0, který využívá přístup k disku obcházení souborového systému, ukázal hodnoty 217 a 165 MB/s pro tyto dva parametry (viz graf). Pokud jde o dvojici námi testovaných čtyřdiskových polí RAID, RAID 0 vykazoval maximální rychlost čtení/zápisu velkých souborů pod 450 MB/s (to potvrzuje i graf HD Tach RW 3.0), což je dvoj až trojnásobek rychlejší než tento SSD! Pravda, povolit ukládání do mezipaměti (WC=ano na diagramech) Nástroje Windows poněkud snižuje rychlost sekvenčního zápisu i čtení, ale není tak kritická, aby to bylo možné považovat za nepřijatelné.

Pokud jde o RAID 5, organizovaný na druhé polovině našich testovacích pevných disků maximální rychlost sekvenční čtení tohoto pole přesahuje 270 MB/s (což je znatelně více než u jakéhokoli moderního magnetického pevného disku!), A rychlost sekvenčního zápisu je zásadně závislá na ukládání do mezipaměti ve Windows: bez něj sotva dosáhne zcela nepřijatelných 40-50 MB/s, pak jak se zvětší více než trojnásobně (viz také graf HD Tach RW 3.0), i když toho při čtení RAID 5 stále nedosahuje, jako tomu bylo u RAID 0. Ale v každém případě zde náš RAID 5 funguje znatelně rychleji než jedna „sedmitisícovka“ Seagate Barracuda XT.

Další významnou výhodou Windows cachování diskových polí je dramatické zrychlení práce s malými (méně než 64 KB) soubory a datovými bloky. To je jasně vidět z výsledků testu ATTO Disk Benchmark 2.41 (vertikály vlevo označují velikost datového bloku v KB; sloupce vpravo jsou hodnoty rychlosti v KB / s).


RAID 0 bez ukládání do mezipaměti


RAID 0 s ukládáním do mezipaměti


RAID 5 bez ukládání do mezipaměti


RAID 5 s mezipamětí

Jak je vidět, urychluje to práci nejen při psaní, ale i při čtení. Obecně platí, že použití ukládání do mezipaměti polí v OS je ve skutečnosti sine qua non, pokud na nich chcete dosáhnout dobrého výkonu nejen se streamovanými daty, ale ve všem ostatním (jako například systémový disk).

Fungování cachovacích operací s RAID přes RAM počítače (jak při čtení, tak při zápisu) názorně demonstruje následující schéma, které obvykle uvádíme jako ilustraci rychlosti diskového rozhraní (SATA, SAS atd.).

Rychlosti čtení z vyrovnávací paměti 3–5 GB/s jsou řádově stejné jako šířka pásma systémové paměti v počítači, jako je náš tester. Sběrnice DMI, přes kterou komunikuje jižní můstek čipsetů Intel se systémem, má mnohem nižší potenciál, který se v podstatě rovná sběrnici PCI Express x4 první generace (tj. 1 GB/s v jednom směru). Druhým užitečným závěrem z tohoto diagramu je, že u polí RAID (i bez ukládání do mezipaměti) se rychlost přenosu dat po sběrnici (několik sběrnic SATA) od hostitele k jednotkám podmíněně zvyšuje úměrně počtu disků v poli. A například u RAID 0 je mnohonásobně vyšší než rychlost výměny dat s jedním SSD na sběrnici SATA. Závěr je obecně zcela zřejmý.

Mimochodem, průměrná doba náhodného přístupu k polím (malé bloky) při čtení nezávisí na cachování Windows, ale při zápisu se výrazně mění (viz schéma). Navíc na ten nejjednodušší (softwarový) RAID 5 bez cachování je neslušně velký.

Pokud jde o otázku dodatečné zátěže procesoru z mezipaměti, ta jistě existuje, ale pro víceméně moderní desktopy ji nelze označit za příliš zatěžující. Pojďme se podívat na grafy využití CPU při spuštění stejného testu ATTO:

RAID 0
RAID 5
Grafy využití CPU bez ukládání do mezipaměti RAID

U RAID 0 i RAID 5 je využití procesoru pro čtení a zápis bez ukládání do mezipaměti Windows RAID několik procent. Pokud je povoleno ukládání do mezipaměti, pak na malých blocích narůstá zatížení CPU až o desítky procent, někdy i přes 50 % (levé části grafů níže).

RAID 0

RAID 5
Grafy zatížení CPU s mezipamětí RAID

Zajímavé je, že pro RAID 5 je zatížení procesoru o něco nižší než pro RAID 0 - zřejmě vyšší rychlost čtení / zápisu v druhém případě ovlivňuje. Navíc s rostoucí velikostí datových bloků se snižuje zatížení procesoru a blíží se tomu, kdy je u bloků o velikosti 64 KB a více zakázáno ukládání do mezipaměti. Samozřejmě je to jen odhad, ilustrace problematiky. Tento aspekt by mohl být prozkoumán pečlivěji, v „čisté formě“. Ale v tomto případě to pro nás není účelem článku, protože nás zde zajímá otázka, jaký je výkon pohonů.

Ty jsme hodnotili zejména komplexními testy, které simulují práci různých úloh pod Windows - PCMark Vantage, PCMark05 a Intel NAS Performance Toolkit. Podrobné výsledky pro každý vzor těchto testů jsou uvedeny v obecné tabulce. A v těle článku představíme pouze konečná schémata, která dávají představu o průměrném výkonu jednotek pod Windows.

V testu PCMark05 je tento model SSD méně než dvakrát rychlejší než 4diskový RAID 0. Ano, to je znatelná výhoda, ale ne tak fatální jako ve srovnání s jedním pevným diskem. Je zvláštní, že této výhody je dosaženo pouze ve třech z pěti vzorů PCMark05 (hlavně Spuštění systému Windows a aplikace), zatímco ve vzoru Virus Scan je náš RAID 0 o 10 % rychlejší než SSD a ve vzoru File Write je obecně rychlejší než SSD, více než třikrát!

Pole s mezipamětí zvyšuje jejich výkon v tomto benchmarku asi jedenapůlkrát, ačkoli jeden Seagate Barracuda XT je stále o něco rychlejší než zde testovaný RAID 5. Nenavrhovali jsme však, abyste tento RAID 5 používali pro hlavní systémové oddíly a běh. aplikací. ;) Ale při zápisu na tento "archivní" objem souborů (vzor File Write) je jeho rychlost jednoznačně vyšší než u jednoho disku.

V novějším testu PCMark Vantage pod Windows 7 je výhoda SSD oproti našim polím ohromující (v průměru nejméně třikrát). Je zřejmé, že vzory tohoto benchmarku velmi aktivně operují s pseudonáhodnými přístupy k diskům, ve kterých je SSD mimo konkurenci.

Analýza výsledků podle vzorů (viz tabulka) však ukazuje, že „ne všechno je Maslenica“ – v řadě úloh má náš RAID 0 nejen podobnou rychlost jako SSD (Movie Maker, tedy střih videa), ale také může výrazně překonat jeho (Media Center). Minimálně pro mediální centrum je tedy pole výnosnější než SSD (to platí i pro jeho mnohem větší kapacitu). Ukládání do mezipaměti zde také přidává 20–30 % k průměrnému výkonu polí, díky čemuž je i softwarový RAID 5 docela konkurenceschopný s jedním špičkovým dvouterabajtovým.

V novějším a podle nás realističtějším testu Intel NAS Performance Toolkit, který využívá trochu jinou filozofii benchmarkingu než „track“ PCMark – totiž přímou práci s souborový systém testované jednotky, spíše než přehrávání předem nahraných (na jiném systému) příkazů pro přístup k disku uvnitř předem vytvořeného dočasného souboru – situace ještě více upřednostňuje vícediskový RAID. Náš RAID 0 je zde v průměru před SSD nejen s cachováním (jedenapůlkrát!), ale i bez něj! A softwarový „archivační“ RAID 5 s mezipamětí je rychlejší než jeden disk Barracuda XT.

Při bližším zkoumání (viz tabulka) se ukazuje, že v 10 z 12 vzorů je RAID 0 v mezipaměti rychlejší než SSD! To platí také pro práci s videem a vytváření obsahu (tvorba obsahu), kancelářskou práci a zpracování fotografií (fotoalbum) a kopírování souborů. Pouze s přehráváním 4-stream videa a kopírováním adresáře s mnoha soubory z disku vyhrál SSD disk nad RAID 0 z tradičních pevných disků. V tomto optimistickém duchu dojdeme k závěru.

Závěr

Vlastně vše již bylo řečeno výše. Při správné volbě tradičních jednotek s magnetickými plotnami jsou jejich pole se 4 disky docela schopná argumentovat výkonem v typických úlohách stolního počítače s jedním SSD. stejné náklady! Navíc z hlediska ceny za gigabajt prostoru a z hlediska kapacity jsou taková pole nesrovnatelně výnosnější než disky SSD. A schopnost (v případě čipsetů Intel) vytvořit současně s rychlým RAID 0 na části HDD prostoru i prostorný chráněný „archivní“ RAID 5 pro ukládání nejdůležitějších dat nemá mezi SSD za adekvátní cenu obdoby. Výběr je tedy na vás. Jen nezapomeňte povolit ukládání do mezipaměti polí RAID pomocí příslušného nástroje pod Windows - bez toho nebude potěšení z používání produktivního, prostorného a ekonomického řešení na vašem počítači úplné.

A ještě pár poznámek – ke spotřebě energie a spolehlivosti těchto řešení. 0,5-3W spotřeby jednoho SSD se samozřejmě nedá srovnávat s 20-40W obžerstvím pole čtyř HDD. Neuvažujeme však o notebooku / nettopu, ale o plnohodnotném desktopu (jinak vlastně není potřeba takový RAID oplotit). Spotřebu je tedy nutné odhadnout celkově. A na pozadí mnohem větší obžerství typických desktopových procesorů (100-200 W spolu se základní deskou) a grafické karty (50-300 W) se pár desítek wattů navíc pro mechaniky vůbec nezdá jako plýtvání (pouze paranoik si ty kilowatthodiny navíc od nich spočítá na domácím elektroměru :)). Zvlášť když vezmete v úvahu, že ještě musíte koupit jeden nebo dva pevné disky na SSD (odhadem: 20W 8 hodin 30 dní = 4,8 kWh, tedy maximálně 15-20 rublů za elektřinu měsíčně navíc) . Pokud jde o spolehlivost obou řešení, lze na webu najít četné stížnosti na SSD, RAID na řadičích čipové sady a dokonce i na HDD, ačkoli výrobci za ně slibují milionové MTBF. Proto v každém případě nejlepší ochranu proti ztrátě dat je jejich pravidelné zálohování na nezávislá média. A na to by se nikdy nemělo zapomínat.

Pro svačinu - diagram, který geometricky průměruje výkon (v MB/s) testovaných disků pro všech 26 testovacích vzorů PCMark05 (5 vzorů), PCMark Vantage x86 (7 vzorů), Intel NAS Performance Toolkit (12 vzorů) a čtení / zápis velkých souborů v ATTO Disk Benchmark (2 vzory). Sledujte a přemýšlejte. ;)

Všechny moderní základní desky jsou vybaveny integrovaným RAID řadičem a špičkové modely mají dokonce několik integrovaných RAID řadičů. Jak moc jsou integrované řadiče RAID žádané domácími uživateli, je samostatná otázka. V každém případě moderní základní deska poskytuje uživateli možnost vytvořit pole RAID z více disků. Ne každý domácí uživatel však ví, jak vytvořit pole RAID, jakou úroveň pole zvolit a obecně má špatnou představu o výhodách a nevýhodách použití polí RAID.
V tomto článku vám poskytneme rychlý průvodce vytvářením polí RAID na domácích počítačích a na konkrétním příkladu vám ukážeme, jak si můžete sami otestovat výkon pole RAID.

Historie stvoření

Termín „RAID pole“ se poprvé objevil v roce 1987, kdy američtí vědci Patterson, Gibson a Katz z University of California Berkeley ve svém článku „A Case for Redundant Arrays of Inexpensive Discs, RAID“) popsali, jak tímto způsobem můžete kombinovat několik levných pevných disků do jednoho logického zařízení tak, aby výsledkem byla zvýšená kapacita a rychlost systému a výpadek jednotlivých disků nevedl k výpadku celého systému.

Od zveřejnění tohoto článku uplynulo více než 20 let, ale technologie pro budování polí RAID neztratila ani dnes svůj význam. Jediné, co se od té doby změnilo, je dekódování zkratky RAID. Faktem je, že zpočátku RAID pole nebyla vůbec stavěna na levné disky, a tak se slovo Inexpensive (levný) změnilo na Independent (nezávislé), což platilo spíše.

Princip fungování

RAID je tedy redundantní pole nezávislých disků (Redundant Arrays of Independent Discs), které je pověřeno úkolem poskytovat odolnost proti chybám a zlepšovat výkon. Tolerance chyb je dosažena redundancí. To znamená, že část diskové kapacity je přidělena pro servisní účely a stává se pro uživatele nedostupnou.

Zvýšení výkonu diskového subsystému zajišťuje současný provoz více disků a v tomto smyslu platí, že čím více disků v poli (do určité hranice), tím lépe.

Disky v poli lze sdílet pomocí paralelního nebo nezávislého přístupu. Při paralelním přístupu je diskový prostor rozdělen do bloků (pruhů) pro záznam dat. Podobně jsou informace určené k zápisu na disk rozděleny do stejných bloků. Při zápisu se jednotlivé bloky zapisují na různé disky a na různé disky se zapisuje více bloků současně, což vede ke zvýšení výkonu při operacích zápisu. Potřebné informace se také čtou v samostatných blocích současně z více disků, což rovněž přispívá k růstu výkonu úměrně počtu disků v poli.

Je třeba poznamenat, že model paralelního přístupu je implementován pouze za podmínky, že velikost požadavku na zápis dat je větší než velikost samotného bloku. Jinak je prakticky nemožné zapisovat několik bloků paralelně. Představte si situaci, kdy velikost jednoho bloku je 8 KB a velikost požadavku na zápis dat je 64 KB. V tomto případě jsou zdrojové informace rozděleny do osmi bloků po 8 kB. Pokud existuje pole čtyř disků, pak lze současně zapisovat čtyři bloky, neboli 32 KB. Je zřejmé, že v uvažovaném příkladu bude rychlost zápisu a čtení čtyřikrát vyšší než při použití jednoho disku. To platí pouze pro ideální situaci, nicméně velikost požadavku není vždy násobkem velikosti bloku a počtu disků v poli.

Pokud je velikost zaznamenaných dat menší než velikost bloku, pak je implementován zásadně odlišný model - nezávislý přístup. Tento model lze navíc použít i tehdy, když je velikost zapisovaných dat větší než velikost jednoho bloku. Při nezávislém přístupu jsou všechna data konkrétního požadavku zapsána na samostatný disk, to znamená, že situace je stejná jako při práci s jedním diskem. Výhodou modelu nezávislého přístupu je, že pokud přijde více požadavků na zápis (čtení) současně, všechny se vykonají na samostatných discích nezávisle na sobě. Tato situace je typická například pro servery.

V souladu s různými typy přístupu existují různé typy polí RAID, které se obvykle vyznačují úrovněmi RAID. Kromě typu přístupu se úrovně RAID liší ve způsobu umístění a vytvoření redundantních informací. Redundantní informace mohou být umístěny na vyhrazeném disku nebo distribuovány na všechny disky. Existuje mnoho způsobů, jak tyto informace generovat. Nejjednodušší z nich je plná duplikace (100% redundance) neboli zrcadlení. Kromě toho se používají kódy pro opravu chyb a výpočet parity.

Úrovně RAID

V současné době existuje několik úrovní RAID, které lze považovat za standardizované, jsou to RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5 a RAID 6.

Používají se také různé kombinace úrovní RAID, což umožňuje kombinovat jejich výhody. Obvykle se jedná o kombinaci nějaké vrstvy odolné proti chybám a nulové úrovně používané ke zlepšení výkonu (RAID 1+0, RAID 0+1, RAID 50).

Všimněte si, že všechny moderní RAID řadiče podporují funkci JBOD (Just a Bench Of Disks), která není určena pro vytváření polí – poskytuje možnost připojení jednotlivých disků k RAID řadiči.

Je třeba poznamenat, že řadiče RAID integrované na základních deskách domácích počítačů nepodporují všechny úrovně RAID. Dvouportové řadiče RAID podporují pouze úrovně 0 a 1, zatímco řadiče RAID s velkým počtem portů (například 6portový řadič RAID integrovaný do jižního můstku čipové sady ICH9R/ICH10R) podporují také úrovně 10 a 5.

Kromě toho, pokud mluvíme o základních deskách založených na čipsetech Intel, pak také implementují funkci Intel Matrix RAID, která umožňuje vytvářet na několika pevné disky x současně matice RAID několika úrovní, přičemž každé z nich alokuje část diskového prostoru.

RAID 0

RAID úrovně 0, přísně vzato, není redundantní pole, a proto neposkytuje spolehlivost ukládání dat. Přesto je tato úroveň aktivně využívána v případech, kdy je potřeba zajistit vysoký výkon diskového subsystému. Při vytváření pole RAID úrovně 0 se informace rozdělí do bloků (někdy se těmto blokům říká pruhy (stripe)), které se zapisují na samostatné disky, to znamená, že se vytvoří systém s paralelním přístupem (pokud se ovšem blok velikost to umožňuje). Díky možnosti souběžného I/O z více disků poskytuje RAID 0 nejrychlejší přenosové rychlosti dat a maximální efektivitu místa na disku, protože není vyžadován žádný úložný prostor s kontrolním součtem. Implementace této úrovně je velmi jednoduchá. RAID 0 se používá především v oblastech, kde je vyžadován rychlý přenos velkého množství dat.

RAID 1 (zrcadlený disk)

RAID úrovně 1 je dvoudiskové pole se 100% redundancí. To znamená, že data jsou jednoduše zcela duplikována (zrcadlena), díky čemuž je velmi vysoká úroveň spolehlivost (stejně jako náklady). Všimněte si, že implementace vrstvy 1 nevyžaduje předchozí rozdělení disků a dat do bloků. V nejjednodušším případě dvě jednotky obsahují stejné informace a jsou jednou logickou jednotkou. Když selže jeden disk, plní své funkce jiný (což je pro uživatele naprosto transparentní). Obnova pole se provádí jednoduchým zkopírováním. Tato úroveň navíc zdvojnásobuje rychlost čtení informací, protože tuto operaci lze provádět současně ze dvou disků. Takovéto schéma pro ukládání informací se používá především v případech, kdy je cena zabezpečení dat mnohem vyšší než náklady na implementaci úložného systému.

RAID 5

RAID 5 je diskové pole odolné proti chybám s distribuovaným úložištěm kontrolních součtů. Při zápisu je datový tok rozdělen do bloků (pruhů) na úrovni bajtů a současně zapsán na všechny disky v poli v cyklickém pořadí.

Předpokládejme, že pole obsahuje n disky a velikost pruhu d. Za každou část n–1 vypočítá se kontrolní součet pruhů p.

Proužek d1 nahrané na prvním disku, pruh d2- na druhém a tak dále až k pruhu d n–1, který je napsán na ( n–1) disk. Další n kontrolní součet zápisu na disk p n a proces se cyklicky opakuje od prvního disku, na který je proužek zapsán d n.

Proces nahrávání (n–1) pruhy a jejich kontrolní součet se vyrábí současně pro všechny n disky.

Pro výpočet kontrolního součtu se na zapisované datové bloky používá bitová operace XOR. Ano, pokud existuje n pevné disky, d- datový blok (proužek), pak se kontrolní součet vypočítá podle následujícího vzorce:

p n = d 1 d2 ... d 1–1.

V případě poruchy kteréhokoli disku lze data na něm obnovit z řídicích dat a z dat zbývajících na zdravých discích.

Pro ilustraci uvažujme bloky o čtyřech bitech. Předpokládejme, že existuje pouze pět disků pro ukládání dat a zápis kontrolních součtů. Pokud existuje posloupnost bitů 1101 0011 1100 1011, rozdělená do bloků po čtyřech bitech, pak je pro výpočet kontrolního součtu nutné provést následující bitovou operaci:

1101 0011 1100 1011 = 1001.

Kontrolní součet zapsaný na disk 5 je tedy 1001.

Pokud selže jeden z disků, například čtvrtý, pak blok d4= 1100 bude nečitelný. Jeho hodnotu však lze snadno obnovit z kontrolního součtu a z hodnot zbývajících bloků pomocí stejné operace XOR:

d4 = d1 d2d4p 5.

V našem příkladu dostaneme:

d4 = (1101) (0011) (1100) (1011) = 1001.

V případě RAID 5 jsou všechny disky v poli stejně velké, ale celková kapacita diskového subsystému dostupná pro zápis je snížena právě o jeden disk. Pokud má například pět disků 100 GB, pak skutečná velikost pole je 400 GB, protože 100 GB je přiděleno pro informace o paritě.

RAID 5 může být postaven na třech nebo více pevných discích. S rostoucím počtem pevných disků v poli se snižuje redundance.

RAID 5 má architekturu nezávislého přístupu, která umožňuje provádět více čtení nebo zápisů současně.

RAID 10

RAID 10 je kombinací úrovní 0 a 1. Minimálním požadavkem pro tuto úroveň jsou čtyři disky. V poli RAID 10 se čtyřmi disky jsou spojeny v párech do polí úrovně 0 a obě tato pole jsou logické disky jsou sloučeny do pole úrovně 1. Je také možný jiný přístup: zpočátku se disky spojí do zrcadlených polí úrovně 1 a poté se logické disky založené na těchto polích sloučí do pole úrovně 0.

Intel Matrix RAID

Uvažovaná pole RAID úrovní 5 a 1 se doma používají zřídka, což je způsobeno především vysokou cenou takových řešení. Nejčastěji u domácích PC se používá pole úrovně 0 na dvou discích. Jak jsme již uvedli, RAID úrovně 0 neposkytuje zabezpečení úložiště, a proto jsou koncoví uživatelé postaveni před volbu: vytvořit rychlé, ale ne spolehlivé pole RAID úrovně 0, nebo zdvojnásobit náklady na místo na disku, - RAID-a pole úrovně 1, které poskytuje spolehlivost ukládání dat, ale neposkytuje významný nárůst výkonu.

K vyřešení tohoto obtížného problému Intel vyvinul Intel Matrix Storage Technology, která kombinuje výhody polí Tier 0 a Tier 1 na pouhých dvou fyzických discích. A abychom zdůraznili, že v tomto případě nemluvíme pouze o poli RAID, ale o poli, které kombinuje fyzické i logické disky, používá název technologie místo slova „pole“ slovo „matice“.

Co je tedy dvoudisková matice RAID založená na technologii Intel Matrix Storage Technology? Základní myšlenkou je, že pokud má systém více pevných disků a základní desku s čipovou sadou Intel, která podporuje Intel Matrix Storage Technology, je možné rozdělit diskový prostor na více částí, z nichž každá bude fungovat jako samostatné pole RAID.

Zvažte jednoduchý příklad pole RAID se dvěma 120GB disky. Kterýkoli z disků lze rozdělit na dva logické disky, každý například 40 a 80 GB. Dále lze dva logické disky stejné velikosti (například 40 GB každý) spojit do matice RAID úrovně 1 a zbývající logické jednotky do matice RAID úrovně 0.

V zásadě lze pomocí dvou fyzických disků také vytvořit pouze jednu nebo dvě matice RAID úrovně 0, ale nelze získat pouze matice úrovně 1. To znamená, že pokud má systém pouze dva disky, pak technologie Intel Matrix Storage umožňuje vytvářet následující typy matic RAID:

  • jedna matice úrovně 0;
  • dvě matice úrovně 0;
  • matice úrovně 0 a matice úrovně 1.

Pokud jsou v systému nainstalovány tři pevné disky, lze vytvořit následující typy matic RAID:

  • jedna matice úrovně 0;
  • jedna matice úrovně 5;
  • dvě matice úrovně 0;
  • dvě matice úrovně 5;
  • matice úrovně 0 a matice úrovně 5.

Pokud jsou v systému nainstalovány čtyři pevné disky, je navíc možné vytvořit matici RAID úrovně 10 a také kombinace úrovně 10 a úrovně 0 nebo 5.

Od teorie k praxi

Pokud se budeme bavit o domácích počítačích, tak nejoblíbenější a nejoblíbenější jsou pole RAID úrovně 0 a 1. Použití RAID polí tří a více disků v domácích PC je spíše výjimkou z pravidla. Je to dáno tím, že na jedné straně rostou náklady na pole RAID úměrně s počtem disků v něm zapojených a na straně druhé má pro domácí počítače prvořadý význam kapacita diskového pole. a ne jeho výkon a spolehlivost.

Proto v následujícím budeme uvažovat pole RAID úrovně 0 a 1 založená pouze na dvou discích. Účelem naší studie bude porovnání výkonu a funkčnosti polí RAID 0 a 1 založených na několika integrovaných řadičích RAID a také studium závislosti rychlostních charakteristik pole RAID na velikosti pruhu.

Faktem je, že ačkoliv by se teoreticky při použití pole RAID 0 měla rychlost čtení a zápisu zdvojnásobit, v praxi je nárůst rychlostních charakteristik mnohem méně mírný a u různých řadičů RAID je odlišný. Totéž platí pro pole RAID úrovně 1: přestože by se teoreticky měla rychlost čtení zdvojnásobit, v praxi není vše tak plynulé.

Pro naše srovnávací testování Pro RAID řadiče jsme použili základní desku Gigabyte GA-EX58A-UD7. Tato deska je založena na čipsetu Intel X58 Express s jižním můstkem ICH10R, který má integrovaný šestiportový SATA II RAID řadič podporující úrovně RAID 0, 1, 10 a 5 s funkcí Intel Matrix RAID. Na desce Gigabyte GA-EX58A-UD7 je navíc integrován řadič GIGABYTE SATA2 RAID, na jehož základě jsou implementovány dva porty SATA II se schopností organizovat pole RAID úrovní 0, 1 a JBOD.

Deska GA-EX58A-UD7 dále integruje řadič Marvell 9128 SATA III, na jehož základě jsou implementovány dva porty SATA III se schopností organizovat pole RAID úrovní 0, 1 a JBOD.

Deska Gigabyte GA-EX58A-UD7 má tedy tři samostatné RAID řadiče, na jejichž základě můžete vytvářet RAID pole úrovně 0 a 1 a vzájemně je porovnávat. Připomeňme, že standard SATA III je zpětně kompatibilní se standardem SATA II, takže na základě řadiče Marvell 9128, který podporuje disky SATA III, můžete také vytvářet pole RAID pomocí disků SATA II.

Testovací stojan měl následující konfiguraci:

  • procesor - Intel Core i7-965 Extreme Edition;
  • základní deska - Gigabyte GA-EX58A-UD7;
  • Verze systému BIOS - F2a;
  • pevné disky- dva disky Western Digital WD1002FBYS, jeden disk Western Digital WD3200AAKS;
  • integrované řadiče RAID:
  • ICH10R,
  • GIGABYTE SATA2,
  • Marvell 9128;
  • paměť - DDR3-1066;
  • velikost paměti - 3 GB (tři moduly po 1024 MB);
  • operační režim paměti - DDR3-1333, tříkanálový provozní režim;
  • grafická karta - Gigabyte GeForce GTS295;
  • zdroj - Tagan 1300W.

Testování probíhalo pod kontrolou operačního sálu systémy Microsoft Windows 7 Ultimate (32bitová verze). Operační systém byl nainstalován na disk Western Digital WD3200AAKS, který byl připojen k portu řadiče SATA II integrovanému do jižního můstku ICH10R. Pole RAID bylo osazeno na dvou discích WD1002FBYS s rozhraním SATA II.

Pro měření rychlostních charakteristik vytvořených RAID polí jsme použili utilitu IOmeter, která je průmyslovým standardem pro měření výkonu diskových systémů.

Nástroj IOmeter

Jelikož jsme tento článek pojali jako svého druhu uživatelskou příručku pro tvorbu a testování RAID polí, bylo by logické začít popisem utility IOmeter (Input / Output meter), která, jak jsme již poznamenali, je jakýmsi průmyslový standard pro měření výkonu diskových systémů. Tato utilita je zdarma a lze jej stáhnout z http://www.iometer.org.

Nástroj IOmeter je syntetický test a umožňuje vám pracovat s pevnými disky, které nejsou rozděleny do logických oddílů, takže můžete testovat disky bez ohledu na strukturu souborů a snížit vliv operačního systému na nulu.

Při testování je možné vytvořit specifický přístupový model, neboli „vzor“, který umožňuje specifikovat výkon konkrétních operací pevným diskem. V případě vytvoření konkrétního přístupového modelu je povoleno změnit následující parametry:

  • velikost požadavku na přenos dat;
  • náhodné/sekvenční rozdělení (v %);
  • rozdělení operací čtení/zápis (v %);
  • počet jednotlivých paralelně probíhajících I/O operací.

Nástroj IOmeter nevyžaduje instalaci do počítače a skládá se ze dvou částí: samotného IOmeter a Dynamo.

IOmeter je ovládací část programu s uživatelským grafickým rozhraním, které vše umožňuje potřebná nastavení. Dynamo je generátor zátěže, který nemá rozhraní. Při každém spuštění IOmeter.exe se také automaticky spustí generátor zatížení Dynamo.exe.

Abyste mohli začít pracovat s programem IOmeter, stačí spustit soubor IOmeter.exe. Otevře se hlavní okno programu IOmeter (obr. 1).

Rýže. 1. Hlavní okno programu IOmeter

Nutno podotknout, že utilita IOmeter umožňuje testovat nejen lokální diskové systémy (DAS), ale také síťové disky (NAS). Lze jej například použít k testování výkonu diskového subsystému serveru (souborového serveru) pomocí několika síťových klientů. Některé karty a nástroje v okně nástroje IOmeter se proto konkrétně týkají nastavení sítě programy. Je jasné, že při testování disků a RAID polí nebudeme tyto vlastnosti programu potřebovat, a proto nebudeme vysvětlovat účel všech záložek a nástrojů.

Po spuštění programu IOmeter se tedy na levé straně hlavního okna (v okně Topologie) zobrazí stromová struktura všech běžících generátorů zátěže (instancí Dynama). Každá spuštěná instance generátoru zatížení Dynamo se nazývá manažer. Program IOmeter je navíc vícevláknový a každé jednotlivé vlákno instance generátoru zatížení Dynamo se nazývá Worker. Počet běžících Workerů vždy odpovídá počtu jader logických procesorů.

V našem příkladu je pouze jeden počítač se čtyřjádrovým procesorem, který podporuje technologii Hyper-Threading, takže je spuštěn pouze jeden manažer (jedna instance Dynama) a osm (podle počtu jader logického procesoru) Workerů.

Ve skutečnosti pro testování disků v tomto okně není potřeba nic měnit ani přidávat.

Pokud zvýrazníte název počítače ve stromové struktuře spouštěných instancí Dynama pomocí myši, pak v okně cílová tab cíl disku zobrazí se všechny disky, disková pole a další jednotky (včetně síťových) nainstalované v počítači. To jsou mechaniky, se kterými program IOmeter umí pracovat. Média mohou být označena žlutou nebo modrou barvou. Žlutá označuje logické oddíly médií a modrá označuje fyzická zařízení, na kterých nejsou vytvořeny logické oddíly. Logický oddíl může, ale nemusí být přeškrtnutý. Faktem je, že aby program mohl pracovat s logickým oddílem, musí být nejprve připraven tak, že na něm vytvoříte speciální soubor, jehož velikost se rovná kapacitě celého logického oddílu. Pokud je logický oddíl přeškrtnutý, znamená to, že oddíl ještě nebyl připraven k testování (bude připraven automaticky v první fázi testování), ale pokud oddíl přeškrtnutý není, znamená to, že soubor již byl vytvořen na logickém oddílu, zcela připraven k testování.

Všimněte si, že navzdory podporované schopnosti pracovat s logickými oddíly je optimální testovat disky, které nejsou rozděleny na logické oddíly. Logický oddíl disku můžete odstranit velmi jednoduše - prostřednictvím modulu snap-in Správa disků. Pro přístup k němu stačí kliknout. klikněte pravým tlačítkem myši myš na ikonu počítač na ploše a v nabídce, která se otevře, vyberte položku Spravovat. V otevřeném okně počítačový management na levé straně vyberte Úložný prostor a v něm - Správa disků. Poté na pravé straně okna počítačový management zobrazí se všechny připojené disky. Kliknutím pravým tlačítkem na požadovaný disk a výběrem ze zobrazené nabídky Smazat svazek..., můžete odstranit logický oddíl na fyzickém disku. Připomeňme, že když odstraníte logický oddíl z disku, všechny informace na něm jsou odstraněny bez možnosti obnovení.

Obecně platí, že pomocí nástroje IOmeter můžete pouze testovat prázdné disky nebo disková pole. To znamená, že nemůžete testovat disk nebo diskové pole, na kterém je nainstalován operační systém.

Takže zpět k popisu nástroje IOmeter. V okně cílová tab cíl disku musíte vybrat disk (nebo diskové pole), který bude testován. Dále musíte kartu otevřít Specifikace přístupu(obr. 2), na kterém bude možné stanovit testovací scénář.

Rýže. 2. Otevřete kartu Specifikace nástroje IOmeter

V okně Specifikace globálního přístupu existuje seznam předdefinovaných testovacích skriptů, které lze přiřadit správci stahování. Tyto skripty však nebudeme potřebovat, takže je lze všechny vybrat a smazat (je na to tlačítko). Vymazat). Poté klikněte na tlačítko Nový vytvořit nový testovací skript. V otevřeném okně Upravit specifikaci přístupu můžete definovat spouštěcí scénář disku nebo RAID.

Předpokládejme, že chceme zjistit závislost rychlosti sekvenčního (lineárního) čtení a zápisu na velikosti bloku požadavku na přenos dat. K tomu potřebujeme vygenerovat sekvenci načítacích skriptů v režimu sekvenčního čtení při různých velikostech bloků a poté sekvenci načítacích skriptů v režimu sekvenčního zápisu při různých velikostech bloků. Velikosti bloků se obvykle volí jako řada, jejíž každý člen je dvojnásobkem předchozího a první člen této řady má 512 bajtů. To znamená, že velikosti bloků jsou následující: 512 bajtů, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 kB, 1 MB. Nemá smysl dělat velikost bloku větší než 1 MB pro sekvenční operace, protože při takto velkých velikostech datových bloků se rychlost sekvenčních operací nemění.

Vytvořme tedy skript sekvenčního čtení pro blok o velikosti 512 bajtů.

V terénu název okno Upravit specifikaci přístupu zadejte název stahovaného skriptu. Například Sequential_Read_512. Dále do terénu Velikost požadavku na převod nastavte velikost datového bloku na 512 bajtů. Posuvník Procento náhodné/sekvenční distribuce(procentuální poměr mezi sekvenčními a selektivními operacemi) posuneme úplně doleva, aby všechny naše operace byly pouze sekvenční. No, posuvník , který určuje procento mezi operacemi čtení a zápisu, posuneme úplně doprava, takže všechny naše operace jsou pouze pro čtení. Další možnosti v okně Upravit specifikaci přístupu není třeba měnit (obr. 3).

Rýže. 3. Okno Upravit specifikaci přístupu pro vytvoření sekvenčního načítacího skriptu
s velikostí bloku dat 512 bajtů

Klikněte na tlačítko OK a v okně se zobrazí první skript, který jsme vytvořili Specifikace globálního přístupu tab Specifikace přístupu Nástroje IOmeter.

Podobně musíte vytvořit skripty pro zbytek datových bloků, ale pro usnadnění práce je jednodušší nevytvářet skript pokaždé kliknutím na tlačítko Nový a po výběru posledního vytvořeného skriptu stiskněte tlačítko Upravit Kopírovat(upravit kopii). Poté se okno znovu otevře. Upravit specifikaci přístupu s nastavením našeho posledního generovaného skriptu. V něm bude stačit změnit pouze název a velikost bloku. Po provedení podobného postupu pro všechny ostatní velikosti bloků můžete začít generovat skripty pro sekvenční nahrávání, což se provádí úplně stejným způsobem, kromě toho, že posuvník Procento rozložení čtení/zápisu, která udává procentuální poměr mezi operacemi čtení a zápisu, musí být posunuta úplně doleva.

Podobně můžete vytvářet skripty pro selektivní psaní a čtení.

Poté, co jsou všechny skripty připraveny, je třeba je přiřadit ke správci spouštění, to znamená uvést, se kterými skripty bude pracovat Dynamo.

Abychom to udělali, ještě jednou to zkontrolujeme v okně topologie je zvýrazněn název počítače (tj. správce zatížení na místním počítači), nikoli samostatný pracovník. To zajišťuje, že scénáře zatížení jsou přiřazeny všem pracovníkům najednou. Další v okně Specifikace globálního přístupu vyberte všechny scénáře zatížení, které jsme vytvořili, a stiskněte tlačítko Přidat. Všechny vybrané scénáře zatížení budou přidány do okna (obr. 4).

Rýže. 4. Přiřazení vytvořených scénářů zatížení správci zatížení

Poté musíte přejít na kartu Nastavení testu(obr. 5), kde můžete nastavit dobu provádění pro každý námi vytvořený skript. K tomu skupina doba běhu nastavit dobu provádění scénáře zatížení. Bude stačit nastavit čas rovný 3 minutám.

Rýže. 5. Nastavení doby provádění scénáře zatížení

Navíc v terénu popis testu musíte zadat název celého testu. V zásadě má tato karta spoustu dalších nastavení, ale pro naše úkoly nejsou potřeba.

Po provedení všech potřebných nastavení se doporučuje vytvořený test uložit kliknutím na tlačítko s obrázkem diskety na panelu nástrojů. Test je uložen s příponou *.icf. Následně můžete vytvořený načítací skript použít tak, že nespustíte soubor IOmeter.exe, ale uložený soubor s příponou *.icf.

Nyní můžete přejít přímo k testování kliknutím na tlačítko s obrázkem vlajky. Budete vyzváni k pojmenování souboru s výsledky testu a výběru jeho umístění. Výsledky testu se ukládají do souboru CSV, který lze následně snadno exportovat do Excelu a nastavením filtru v prvním sloupci vybrat požadovaná data s výsledky testu.

Během testování lze na záložce sledovat průběžné výsledky zobrazení výsledku a na kartě můžete určit, do kterého scénáře zatížení patří Specifikace přístupu. V okně Specifikace přiřazeného přístupu spuštěný skript je zobrazen zeleně, dokončené skripty červeně a skripty, které ještě nebyly provedeny, modře.

Probrali jsme tedy základní techniky práce s utilitou IOmeter, která bude vyžadována pro testování jednotlivých disků nebo polí RAID. Všimněte si, že jsme nemluvili o všech funkcích nástroje IOmeter, ale popis všech jeho funkcí přesahuje rámec tohoto článku.

Vytvoření pole RAID založené na řadiči GIGABYTE SATA2

Začneme tedy vytvářet dvoudiskové pole RAID pomocí řadiče GIGABYTE SATA2 RAID integrovaného na desce. Samotný Gigabyte čipy samozřejmě nevyrábí, a proto se pod čipem GIGABYTE SATA2 skrývá přeznačený čip jiné společnosti. Jak můžete vidět ze souboru INF ovladače, jedná se o řadič řady JMicron JMB36x.

Přístup do nabídky nastavení ovladače je možný ve fázi spouštění systému, pro kterou musíte stisknout kombinaci kláves Ctrl + G, když se na obrazovce objeví odpovídající nápis. Samozřejmě nejprve v nastavení BIOSu musíte definovat provozní režim dvou SATA portů souvisejících s řadičem GIGABYTE SATA2 jako RAID (jinak nebude přístup do nabídky konfigurátoru pole RAID možný).

Nabídka nastavení řadiče GIGABYTE SATA2 RAID Controller je docela přímočará. Jak jsme již uvedli, řadič je dvouportový a umožňuje vytvářet pole RAID úrovně 0 nebo 1. Prostřednictvím nabídky nastavení řadiče můžete pole RAID odstranit nebo vytvořit. Při vytváření pole RAID je možné zadat jeho název, vybrat úroveň pole (0 nebo 1), nastavit velikost pruhu pro RAID 0 (128, 84, 32, 16, 8 nebo 4K) a také určit velikost pole.

Jakmile je pole vytvořeno, nejsou v něm možné žádné změny. To znamená, že u vytvořeného pole nemůžete následně změnit například jeho úroveň nebo velikost pruhu. Chcete-li to provést, musíte nejprve pole odstranit (se ztrátou dat) a poté je znovu vytvořit. Ve skutečnosti to není jedinečné pro řadič GIGABYTE SATA2. Nemožnost změny parametrů vytvořených RAID polí je vlastností všech řadičů, která vyplývá ze samotného principu implementace RAID pole.

Po vytvoření pole založeného na řadiči GIGABYTE SATA2 lze aktuální informace o něm zobrazit pomocí nástroje GIGABYTE RAID Configurer, který se automaticky nainstaluje s ovladačem.

Vytvoření pole RAID založené na řadiči Marvell 9128

Konfigurace řadiče Marvell 9128 RAID je možná pouze prostřednictvím nastavení BIOS desky Gigabyte GA-EX58A-UD7. Obecně je třeba říci, že nabídka konfigurátoru ovladače Marvell 9128 je poněkud syrová a nezkušené uživatele může uvést v omyl. O těchto drobných nedostatcích si však povíme o něco později, ale zatím zvážíme ty hlavní. funkčnost Ovladač Marvell 9128.

Přestože tedy tento řadič podporuje disky SATA III, je také plně kompatibilní s disky SATA II.

Řadič Marvell 9128 umožňuje vytvořit pole RAID úrovně 0 a 1 založené na dvou discích. Pro pole úrovně 0 můžete zadat velikost pruhu 32 nebo 64 kB a také můžete zadat název pole. Kromě toho existuje taková možnost jako Gigabyte Rounding, která vyžaduje vysvětlení. Navzdory názvu, shodnému se jménem výrobce, s tím funkce Gigabyte Rounding nemá nic společného. Navíc to nemá nic společného s polem RAID úrovně 0, i když to lze definovat v nastavení řadiče speciálně pro pole této úrovně. Ve skutečnosti je to první z těch nedostatků konfigurátoru řadiče Marvell 9128, které jsme zmínili. Gigabyte Rounding je definován pouze pro RAID úrovně 1. Umožňuje použít dva disky (například různých výrobců nebo různých modelů) s mírně odlišnými kapacitami k vytvoření pole RAID úrovně 1. Funkce Gigabyte Rounding právě nastavuje rozdíl ve velikostech dvou disků použitých k vytvoření pole RAID úrovně 1. V řadiči Marvell 9128 funkce Gigabyte Rounding umožňuje nastavit rozdíl ve velikostech disků na 1 nebo 10 GB.

Další nevýhodou konfigurátoru řadiče Marvell 9128 je, že při vytváření pole RAID úrovně 1 má uživatel možnost zvolit velikost pruhu (32 nebo 64 KB). Pro pole RAID úrovně 1 však pojem proužek není vůbec definován.

Vytvoření pole RAID na základě řadiče integrovaného v ICH10R

Řadič RAID integrovaný do jižního můstku ICH10R je nejběžnější. Jak již bylo uvedeno, tento řadič RAID je 6portový a podporuje nejen vytváření polí RAID 0 a RAID 1, ale také RAID 5 a RAID 10.

Přístup do nabídky nastavení ovladače je možný ve fázi spouštění systému, pro kterou musíte stisknout kombinaci kláves Ctrl + I, když se na obrazovce objeví odpovídající nápis. Samozřejmě musíte nejprve v nastavení BIOSu definovat provozní režim tohoto řadiče jako RAID (jinak nebude přístup do nabídky konfigurátoru pole RAID možný).

Nabídka nastavení řadiče RAID je poměrně jednoduchá. Prostřednictvím nabídky nastavení řadiče můžete odstranit nebo vytvořit pole RAID. Při vytváření pole RAID můžete zadat jeho název, vybrat úroveň pole (0, 1, 5 nebo 10), nastavit velikost pruhu pro pole RAID 0 (128, 84, 32, 16, 8 nebo 4K) a definovat velikost pole.

Porovnání výkonu RAID

Pro testování polí RAID pomocí nástroje IOmeter jsme vytvořili scénáře zatížení sekvenčního čtení, sekvenčního zápisu, selektivního čtení a selektivního zápisu. Velikosti datových bloků v každém scénáři zatížení byly následující: 512 bajtů, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 KB, 1 MB.

Na každém z řadičů RAID bylo vytvořeno pole RAID 0 se všemi povolenými velikostmi pruhů a pole RAID 1. Kromě toho, abychom mohli vyhodnotit nárůst výkonu získaný použitím pole RAID, testovali jsme také jeden disk na každém z řadičů RAID.

Pojďme tedy k výsledkům našeho testování.

Ovladač GIGABYTE SATA2

Nejprve se podívejme na výsledky testování RAID polí založených na řadiči GIGABYTE SATA2 (obrázek 6-13). Obecně se ovladač ukázal jako doslova záhadný a jeho výkon byl prostě zklamáním.

Rýže. 6. Rychlost konzistentní
a selektivní diskové operace
Western Digital WD1002FBYS

Rýže. 7. Rychlost konzistentní

s velikostí pruhu 128 kB
(řadič GIGABYTE SATA2)

Rýže. 12. Sekvenční rychlost
a selektivní operace pro RAID 0
s velikostí pruhu 4 kB
(řadič GIGABYTE SATA2)

Rýže. 13. Rychlost sekvenční
a selektivní operace
pro RAID 1 (řadič GIGABYTE SATA2)

Při pohledu na výkon jednoho disku (bez RAID) je maximální rychlost sekvenčního čtení 102 MB/s a maximální rychlost sekvenčního zápisu je 107 MB/s.

Při vytváření pole RAID 0 s velikostí pruhu 128 KB se maximální rychlost sekvenčního čtení a zápisu zvýší na 125 MB/s, tedy nárůst asi o 22 %.

Při velikosti pruhu 64, 32 nebo 16 KB je maximální rychlost sekvenčního čtení 130 MB/s a maximální rychlost sekvenčního zápisu je 141 MB/s. To znamená, že se specifikovanými velikostmi pruhů se maximální rychlost sekvenčního čtení zvýší o 27 % a maximální rychlost sekvenčního zápisu o 31 %.

Ve skutečnosti to pro pole úrovně 0 nestačí a chtěl bych, aby maximální rychlost sekvenčních operací byla vyšší.

Při velikosti pruhu 8 KB zůstává maximální rychlost sekvenčních operací (čtení a zápis) přibližně stejná jako u velikosti pruhu 64, 32 nebo 16 KB, jsou zde však zjevné problémy se selektivním čtením. S nárůstem velikosti datového bloku až na 128 KB se selektivní rychlost čtení (jak by měla být) zvyšuje úměrně velikosti datového bloku. Při velikosti datového bloku větší než 128 KB však rychlost selektivního čtení klesá téměř na nulu (na cca 0,1 MB/s).

Při velikosti pruhu 4 KB klesá nejen rychlost selektivního čtení při velikosti bloku větší než 128 KB, ale také rychlost sekvenčního čtení při velikosti bloku větší než 16 KB.

Použití pole RAID 1 na řadiči GIGABYTE SATA2 výrazně nemění (ve srovnání s jedním diskem) rychlost sekvenčního čtení, ale maximální rychlost sekvenčního zápisu je snížena na 75 MB/s. Připomeňme, že u pole RAID 1 by se rychlost čtení měla zvýšit a rychlost zápisu by se neměla snížit v porovnání s rychlostí čtení a zápisu na jeden disk.

Na základě výsledků testů řadiče GIGABYTE SATA2 lze vyvodit pouze jeden závěr. Použití tohoto řadiče k vytvoření polí RAID 0 a RAID 1 má smysl pouze v případě, že jsou již povoleny všechny ostatní řadiče RAID (Marvell 9128, ICH10R). I když je docela těžké si takovou situaci představit.

Ovladač Marvell 9128

Řadič Marvell 9128 vykazoval mnohem rychlejší výkon ve srovnání s řadičem GIGABYTE SATA2 (obrázek 14-17). Ve skutečnosti se rozdíly projevují, i když řadič pracuje s jedním diskem. Zatímco řadič GIGABYTE SATA2 má maximální rychlost sekvenčního čtení 102 MB/s a je dosahován s velikostí datového bloku 128 KB, pro řadič Marvell 9128 je maximální rychlost sekvenčního čtení 107 MB/s a dosahuje se datovým blokem. velikost 16 kB.

Při vytváření pole RAID 0 s velikostí pruhu 64 a 32 KB se maximální rychlost sekvenčního čtení zvýší na 211 MB/s a sekvenčního zápisu až 185 MB/s. To znamená, že se zadanými velikostmi pruhů se maximální rychlost sekvenčního čtení zvýší o 97 % a maximální rychlost sekvenčního zápisu o 73 %.

Mezi poli RAID 0 s velikostí pruhu 32 a 64 KB není žádný významný rozdíl v rychlosti, ale vhodnější je použití pruhu 32 KB, protože v tomto případě je rychlost sekvenčních operací s velikostí bloku menší než 128 KB. bude o něco vyšší.

Při vytváření pole RAID 1 na řadiči Marvell 9128 se maximální rychlost sekvenčního provozu téměř nezmění ve srovnání s jedním diskem. Pokud je tedy pro jeden disk maximální rychlost sekvenčního provozu 107 MB/s, pak pro RAID 1 je to 105 MB/s. Všimněte si také, že u RAID 1 je rychlost selektivního čtení mírně snížena.

Obecně je třeba poznamenat, že řadič Marvell 9128 má dobré rychlostní charakteristiky a lze jej použít jak pro vytváření polí RAID, tak pro připojení jednotlivých disků k němu.

Ovladač ICH10R

Řadič RAID vestavěný do ICH10R se ukázal jako nejvýkonnější, jaký jsme kdy testovali (obrázek 18-25). Při použití s ​​jedním diskem (bez vytvoření pole RAID) je jeho výkon vlastně stejný jako u řadiče Marvell 9128. Maximální rychlost sekvenčního čtení a zápisu je 107 MB a dosahuje se při velikosti datového bloku 16 KB.

Rýže. 18. Sekvenční rychlost
a selektivní operace
pro disk Western Digital WD1002FBYS (řadič ICH10R)

Pokud mluvíme o poli RAID 0 na řadiči ICH10R, pak maximální rychlost sekvenčního čtení a zápisu nezávisí na velikosti pruhu a je 212 MB/s. Pouze velikost datového bloku závisí na velikosti pruhu, při kterém je dosaženo maximální hodnoty rychlosti sekvenčního čtení a zápisu. Jak ukazují výsledky testů, pro RAID 0 na bázi řadiče ICH10R je optimální použít 64 KB stripe. V tomto případě je maximální sekvenční rychlosti čtení a zápisu dosaženo s velikostí datového bloku pouhých 16 KB.

V souhrnu tedy ještě jednou zdůrazňujeme, že RAID řadič zabudovaný v ICH10R výkonem výrazně předčí všechny ostatní integrované RAID řadiče. A vzhledem k tomu, že má i více funkcionality, je optimální použít právě tento řadič a na existenci všech ostatních (samozřejmě pokud nejsou v systému použity SATA III disky) prostě zapomenout.

Pole RAID byla navržena tak, aby zlepšila spolehlivost ukládání dat, zvýšila rychlost a umožnila sloučení více disků do jednoho velkého disku. odlišné typy RAID řeší různé problémy, zde se podíváme na některé z nejběžnějších konfigurací RAID polí stejné velikosti.



RAID 0

  • RAID 0(Proužek). Režim, který maximalizuje výkon. Data jsou rovnoměrně rozložena po discích pole, sloučena do jednoho, který lze rozdělit na několik. Distribuované operace čtení a zápisu mohou výrazně zvýšit rychlost práce, protože několik čte / zapisuje svou část dat současně. Uživateli je k dispozici celý svazek, což ale snižuje spolehlivost datového úložiště, protože při poruše jednoho z disků je pole obvykle zničeno a je téměř nemožné data obnovit. Rozsah - aplikace, které vyžadují vysokou rychlost výměny disku, jako je nahrávání videa, střih videa. Doporučeno pro použití s ​​vysoce spolehlivými disky.

    RAID 1
  • RAID 1(Zrcadlo). Několik disků (obvykle 2) pracujících synchronně pro záznam, to znamená, že se zcela duplikují. Ke zlepšení výkonu dochází pouze při čtení. Nejspolehlivější způsob ochrany informací před selháním jednoho z disků. Vzhledem k vysoké ceně se obvykle používá při ukládání velmi důležitých dat. Vysoká cena je dána tím, že uživatel má k dispozici pouze polovinu celkové kapacity.

    RAID 10
  • RAID 10, také někdy nazývaný RAID 1+0- kombinace prvních dvou možností. (pole RAID0 z polí RAID1). Má všechny rychlostní výhody RAID0 a výhodu spolehlivosti RAID1, přičemž si zachovává nevýhodu – vysokou cenu diskového pole, protože efektivní kapacita pole je poloviční než kapacita disků v něm použitých. K vytvoření takového pole jsou potřeba minimálně 4 disky. (V tomto případě musí být jejich počet sudý).
  • RAID 0+1- Pole RAID1 s poli RAID0. Ve skutečnosti se nepoužívá kvůli nedostatku výhod oproti RAID10 a menší odolnosti proti chybám.

    RAID 1E
  • RAID 1E- Podobně jako RAID10, varianta distribuce dat mezi disky, umožňující použití lichého čísla (minimální počet je 3)
  • RAID 2, 3, 4- různé možnosti pro distribuované ukládání dat s disky přidělenými pro paritní kódy a různé velikosti bloků. V současné době se prakticky nepoužívají z důvodu nízkého výkonu a nutnosti alokovat hodně místa na disku pro ukládání ECC a/nebo paritních kódů.


    RAID 5
  • RAID 5- pole, které také používá distribuované úložiště dat podobné RAID 0 (a sloučení do jednoho velkého logického) + úložiště distribuovaného paritního kódu pro obnovu dat v případě selhání. Ve srovnání s předchozími konfiguracemi byla velikost bloku Stripe ještě zvětšena. Je možné simultánní čtení i zápis. Výhodou této možnosti je, že kapacita pole dostupná uživateli je snížena o kapacitu pouze jednoho disku, ačkoli spolehlivost ukládání dat je nižší než u RAID 1. Ve skutečnosti se jedná o kompromis mezi RAID0 a RAID1, který poskytuje poměrně vysoká rychlost s dobrou spolehlivostí ukládání dat. Pokud selže jeden disk z pole, data lze obnovit bez ztráty v automatickém režimu. Minimální počet disků pro takové pole jsou 3.
    "Softwarové" implementace RAID5, zabudované do jižních můstků základních desek, nemají vysokou rychlost zápisu, takže nejsou vhodné pro všechny aplikace.


    RAID 5EE
  • RAID 5EE- pole podobné RAID5, ale kromě distribuovaného úložiště paritních kódů se používá distribuce náhradních oblastí - ve skutečnosti se používá, které lze přidat do pole RAID5 jako náhradní (taková pole se nazývají 5 + nebo 5+náhradní). V poli RAID 5 je náhradní disk nečinný, dokud jeden z primárních disků selže, zatímco v poli RAID 5EE je tento disk neustále sdílen se zbytkem HDD, což má pozitivní vliv na výkon pole. Například pole RAID5EE s 5 pevnými disky může provést o 25 % více I/O operací za sekundu než pole RAID5 se 4 primárními a jedním náhradním pevným diskem. Minimální počet disků pro takové pole jsou 4.


    RAID 6
  • RAID 6- analog RAID5 s vysokou úrovní redundance - informace se neztrácí při poruše dvou disků, resp. celková kapacita pole se sníží o kapacitu dvou disků. Minimální počet disků potřebný k vytvoření pole této úrovně je 4. Obecně je rychlost provozu přibližně stejná jako u RAID5. Doporučeno pro aplikace, kde je důležitá maximální spolehlivost.


    RAID 50
  • RAID 50- spojení dvou (nebo více, ale to se málokdy používá) polí RAID5 do pruhu, tzn. kombinace RAID5 a RAID0, částečně korigující hlavní nevýhodu RAID5 - nízkou rychlost zápisu dat díky paralelnímu použití několika takových polí. Celková kapacita pole je snížena o kapacitu dvou, ale na rozdíl od RAID6 toto pole toleruje pouze selhání jednoho disku bez ztráty dat a minimální počet disků nutných k vytvoření pole RAID50 je 6. Spolu s RAID10, toto je nejvíce doporučená úroveň RAID pro použití v aplikacích, kde je vyžadován vysoký výkon kombinovaný s přijatelnou spolehlivostí.


    RAID 60
  • RAID 60- Sloučení dvou polí RAID6 do pruhu. Rychlost zápisu je přibližně dvojnásobná oproti rychlosti zápisu v RAID6. Minimální počet disků pro vytvoření takového pole je 8. Informace se neztratí, pokud selžou dva disky z každého pole RAID 6.
  • Matrix RAID- technologie implementovaná společností Intel ve svých jižních mostech, počínaje ICH6R, která umožňuje organizovat několik polí RAID0 a RAID1 na pouhých dvou discích a současně vytvářet oddíly se zvýšenou rychlostí a zvýšenou spolehlivostí ukládání dat.
  • JBOD(z anglického "Just a Bunch Of Disks") - sekvenční spojení více fyzických do jedné logické, která nemá vliv na výkon (spolehlivost v tomto případě klesá podobně jako u RAID0), přičemž mohou mít různé velikosti. V současné době se prakticky nepoužívá.