Zadejte hledaný výraz...

Kvalita disků u Hetzner.de

armin
verified
rating uzivatele
(2 hodnocení)
1. 10. 2018 12:00:12
Disky odchází, dokonce i SSD disky. Stalo se nám již x krát, že i čisto nový disk byl vadný. A nešlo o lowendové "enterprise", ale o server edice, které jsou dražší o asi 1.5x a více. A proto existuje SMART, přes který se všechny disky monitorují a předem víme, který disk je potřeba výhledově v tom kterém serveru vyměnit a nazrcadlit, aby zákazník nic nepoznal. Je to vše jen o přístupu. A pokud někomu stojí ušetřená pětistovka měsíčně za problémový provoz, neustálé rýpání se na serveru,... tak si zřejmě neváží svůj čas no.
1. 10. 2018 12:00:12
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363285
TomasX
verified
rating uzivatele
(4 hodnocení)
1. 10. 2018 12:20:19
Napsal armin;1487717
Disky odchází, dokonce i SSD disky. Stalo se nám již x krát, že i čisto nový disk byl vadný. A nešlo o lowendové "enterprise", ale o server edice, které jsou dražší o asi 1.5x a více. A proto existuje SMART, přes který se všechny disky monitorují a předem víme, který disk je potřeba výhledově v tom kterém serveru vyměnit a nazrcadlit, aby zákazník nic nepoznal. Je to vše jen o přístupu. A pokud někomu stojí ušetřená pětistovka měsíčně za problémový provoz, neustálé rýpání se na serveru,... tak si zřejmě neváží svůj čas no.
Nepoužíváte replikaci (raid, snapshoty, mirroring atd.) rovnou, ale data replikujete až podle SMARTu? Většinu poruch u disků co zažívám není detekovatelných podle SMART ale u ssd odejde eletronika (špatně řešený odvod tepla, zdravím HPE), po restartu serveru (či jen disku) jsou zadřený ložiska a disk se nerostočí, odejde hlavička disku (servové disky nebývají tak odolné a nemají rádi časté parkování hlavičky jak ty konsumní).
Souhlasím s tím, že takhle šetřit se vyplatí až u velkého množství serverů a pak je to také na zvážení, i low cost wedos nakupuje značkové servery a řeší u nich záruky a náhradní díly. Čas techniků je prostě pořád příliš drahý, ztráta dat je ještě dražší.
1. 10. 2018 12:20:19
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363284
armin
verified
rating uzivatele
(2 hodnocení)
2. 10. 2018 08:05:44
Tomáši, fungovat v oblasti serverů mimo RAID je sebevražda. Používáme HW radiče (adaptec, areca) a disky hlídáme nonstop. To, co popisujete - špatný odvod tepla (kde ten server proboha je? Ve špajzu, v zaměstnanecké šatně?), parkování hlavičky, zadřené ložiska, odejde hlavička disku (styl fungování - dokud to jede, tak to jede)... do takovéhoto stavu jsme se nikdy nedostali, protože tomu jsme schopni velmi úspěšně předejít - právě hlídáním stavů disků a s dostatečným předstihem, kdy je disk již na výměnu a funguje prozatím na 100%, dojde k jeho výměně. Než nastane některá z uvedených situací, kdy je již disk defakto nenávratně poškozen, nečitelný, tak to je hodně pozdě.
Lidi v ČR slyší na cenu a to je vše co je zajímá. A je nad slunce jasné, že musí být podstatně levnější fungovat na vyřazených strojích z USA za cenu šrotu, které melou z posledního a hlavně není jasná jejich historie (kde a za jakých podmínek to fungovalo), než fungovat na čisto novém HW obměňovaném co 3 roky a se 100% garancií provozu v špičkovém data centru.
2. 10. 2018 08:05:44
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363283
TomasX
verified
rating uzivatele
(4 hodnocení)
2. 10. 2018 08:29:10
i bez RAIDu se dá žít, není to povinnost, jen se data musí chránit jinak :). Mluvím o nevhodných skříních u HPE proliant (dl380, g9 i g10) s použitím těch hodně drahých a zřavých nvme karet (PCIe x8) pouze s pasivních chladičem, lokálně vznikají dost vysoké teploty a složitě se nám chladí více takových v jedné krabici, odpadávají jak mouchy, samozřejmě provoz v DC, začali jsme montovat dodatečné větráky na odvod tepla, ale až poté co jich pár odešlo. Člověk někdy nechápe, co jsou schopní vendoři poskládat a doručit.
Zajímavé. Pracuji na projektech s několika tisíc disky a spousty chyb neumíme přes SMART dopředu detekovat, resp. zjistí se až problémy a nikoliv stav, které k nim vede. Ročně odpadne asi 1 % disků (nejvíce v prvních měsících a poté po několika letech provozu), u poloviny z nich dopředu nemáme podezření, že disk je na tom špatně. Disky jsou pernamentně vytížené na 60 % - 100 %.
---------- Příspěvek doplněn 02.10.2018 v 10:18 ----------
armin: mě právě zaujala informace, že dokážete odhalit z monitoringu všechny poruchy disků, mně se to ještě nepodařilo, tak se ptám, jestli opravdu poznáte všechny stavy nebo vám ještě nenastaly, takže nevíte.
2. 10. 2018 08:29:10
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363282
Pota
verified
rating uzivatele
(1 hodnocení)
2. 10. 2018 18:18:25
Vě vetšině případů se porucha disku resp. možné budoucí selhání, anebo chybovost odhalí předem. Ten podíl disků, které odejdou tzv. z ničeho nic je mizivý, alespoň u nás.
2. 10. 2018 18:18:25
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363281
armin
verified
rating uzivatele
(2 hodnocení)
3. 10. 2018 09:57:29
Tomáši, shrnu to do pár bodů:
1) základem je kvalitní case (rozuměj dobře větratelný) a pochopitelně všechny HW komponenty, umístění v datovém centru, které opravdu chladí
2) hlídání smart hodnot disků je maličkost a ty v 99,99% případů předem napoví, že je s diskem výhledově něco špatně a je relativně dost prostoru na to, to řešit (minimálně týden v drtivé většině případů)
3) úroveň vytížení disků - kdysi jsme technicky zabezpečovali provoz jednoho datového úložiště s nemalými nároky na čtení a zápis na disky a věřte nebo ne, po proškolení jejich programátora a zakomponování doporučeného sektorového čtení velmi rapidně pokleslo množství požadavků na disky i na RAM. Je pravda, že v té době jsme zvedli u dodavatele poruchovost disků o cca. 5%, nicméně, nikdy se o žádná data nepřišlo - právě skrze hlídání a včasný přesun dat
Jak dále uvádí Poťa, tak se s tím můžu jen souhlasit.
3. 10. 2018 09:57:29
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363280
TomasX
verified
rating uzivatele
(4 hodnocení)
3. 10. 2018 19:21:56
děkuji za odpovědi, ale vidím, že moc informací nevytáhnu :).
nejde o větrání, ale nvme karty s pasivním chlazením se v proliantu a poweredge case přehřívají, když je člověk nechá pár dní v kuse naplno pracovat, jen jsem si postěžoval :).
Primárně se bavím o heliových midline LLF diskách do kapacity 10TB, ročně se jich na každých 1000 ks vyměňuje asi 12, z toho čtyři pět disků odejde aniž by se tím dopředu pochlubily a metriky v smartu vypadají v pořádku. Disky mají samozřejmě stálou udržovanou teplotu 18C, denně se do každého zapíše/přečte kolem 1TB dat, musí se skartovat, takže vendor neřekne žádné další info. Jedná se o velké analytické databáze a datové sklady, disky tam jsou od toho, aby se používaly a ne flákaly, o ztrátu dat nejde, vše je ve více lokalitách a dostatečně replikované, jsem jen zvědavý a chtěl jsem vytáhnout tipy, jestli náhodou něco nepřehlížím, z hlediska provozu je jedno, jestli o disku dopředu vím, že odejde nebo si odejte náhle sám, stačí když neodejdou všechny najednou, proto se kombinuje více šarží a typů, nemám ale rád situace, které nedokážu předvídat.
3. 10. 2018 19:21:56
https://webtrh.cz/diskuse/kvalita-disku-u-hetzner-de/strana/2#reply1363279
Pro odpověď se přihlašte.
Přihlásit