31Jul

Mohou data na pevných discích zhoršovat bez upozornění na poškození?

click fraud protection

Všichni se obáváme, že uchováme naše data a soubory bezpečné a neporušené, ale je možné, že data budou poškozena a budou přístupná uživateli bez jakéhokoli upozornění nebo varování o problému? Dnešní příspěvek SuperUser Q & A má odpověď na znepokojenou otázku čtenáře.

dnešní otázka &Odpověď na zasedání se k nám dostala s laskavým svolením SuperUser - podřízenou výměnou Stack Exchange, skupině webů Q & A založených na komunitě.

Foto s laskavým svolením generalizace( Flickr).

Otázka

Reader SuperUser topo morto chce vědět, zda mohou na pevném disku docházet k poškozování a přístupnosti dat bez upozornění na poškození:

Je možné, že fyzická degradace pevného disku by mohla způsobit "převrácení" bitů v obsahu souborubez toho, aby si operační systém všiml změny a o čem o tom informoval uživatele při čtení souboru? Například by se text "p"( binární 01110000) v textovém souboru ASCII mohl změnit na "q"( binární 01110001), pak když uživatel otevře soubor, uvidí "q", aniž by si uvědomoval, že došlo k poruše?

instagram viewer

Mám zájem o odpovědi týkající se FAT, NTFS nebo ReFS( pokud je to rozdíl).Chci vědět, jestli operační systémy chrání uživatele před tím, nebo bychom měli kontrolovat naše data o odchylkách mezi kopiemi v čase.

Mohou data na pevných discích zhoršovat a být přístupná bez varování před poškozením?

Odpovědí Answer

SuperUser přispěvatel Guntram Blohm má pro nás odpověď:

Ano, existuje věc nazvaná bit rot. Ale ne, to neovlivní uživatele bez povšimnutí.

Když pevný disk zapisuje sektor do platforem, nepopisuje pouze zápis bitů stejným způsobem, jako jsou uloženy v paměti RAM, používá kódování, aby se ujistil, že neexistují žádné sekvence stejného bitu, které jsou příliš dlouhé.Také přidává kódy ECC, které jí umožňují opravit chyby, které ovlivňují několik bitů, a zjistit chyby, které se týkají více než několika bitů.

Pokud pevný disk přečte sektor, zkontroluje tyto ECC kódy a v případě potřeby opraví data( a pokud je to možné).Co se dále děje, závisí na okolnostech a firmwaru pevného disku, což je ovlivněno označením jednotky.

  • Pokud je sektor čitelný a nemá žádné problémy s kódem ECC, pak je předán operačnímu systému.
  • Pokud může být sektor snadno opravován, může být opravená verze zapsána na disk, přečtena zpět a ověřena, zda byla chyba náhodná( tj. Kosmické paprsky apod.) Nebo jestliže dochází k systematické chybě s médii.
  • Pokud pevný disk zjistí chybu s médiem, přerozdělí sektor.
  • Pokud se po několika pokusech o čtení( na pevném disku označeném jako RAID pevný disk) nemůže sektor číst ani opravit, pak se pevný disk vzdá, znovu přidělí sektor a říká správci, že existujeproblém. Spoléhá se na řadič RAID, aby rekonstruoval sektor od ostatních členů RAID a zapsal jej zpět na neúspěšný pevný disk, který jej pak uloží do přerozděleného sektoru( který snad nemá problém).
  • Pokud sektor nelze číst nebo opravit na pevném disku počítače, pevný disk se bude více snažit číst. V závislosti na kvalitě pevného disku může dojít k přemístění hlavy, kontrole, zda se objeví nějaké bity, které se při opakovaném přečtení převracejí, zda jsou bity nejslabší a zda se jedná o několik dalších věcí.Pokud některý z těchto pokusů uspěje, pevný disk přerozdělí sektor a odešle zpět opravená data.

Jedná se o jeden z hlavních rozdílů mezi pevnými disky, které se prodávají jako pevné disky typu "desktop", "NAS / RAID" nebo "video surveillance".Pevný disk RAID se může rychle vzdát a regulátor provede opravu sektoru, aby se zabránilo latenci na straně uživatele. Pevný disk stolního počítače se bude i nadále pokoušet znovu a znovu, protože uživatel může počkat několik sekund, je pravděpodobně lepší, než když je informuje o ztrátě dat. A video pevný disk hodnotí konstantní datové rychlosti více než obnovení chyb, protože poškozený snímek nebude zpravidla ani zaznamenán.

Pevný disk bude v každém případě vědět, zda došlo k bitovému hnilobě, obvykle se z něj zotaví a pokud to nemůže, řekne řídícímu pracovníkovi, který zase oznámí řidiči, který pak povědí operační systém. Pak je na operačním systému, aby uživateli zobrazil chybu a jednal na něm. To je důvod, proč cybernard říká:

  • Nikdy jsem nebyl svědkem jediné bitové chyby, ale viděl jsem spoustu pevných disků, kde selhaly celé sektory.

Pevný disk bude vědět, jestli je v sektoru něco špatně, ale nebude vědět, které bity selhaly. Jeden bit, který selhal, bude vždy zachycen ECC.

Upozorňujeme, že chkdsk a souborové systémy, které se automaticky opravují, se netýkají opravy dat uvnitř souborů.Ty jsou zaměřeny na poškození v rámci struktury samotného systému souborů, jako je rozdíl v velikosti souboru mezi položkou adresáře a počtem přiřazených bloků.Samoléčebná funkce systému souborů NTFS zjistí strukturální poškození a zabrání tomu, aby dále ovlivňovala vaše data, ale nebude opravovat žádné poškozené údaje.

Existují samozřejmě i další důvody, proč se mohou data poškodit. Například špatná paměť RAM na řadiči může změnit data předtím, než je dokonce odeslána na pevný disk. V takovém případě žádný mechanismus na pevném disku nezjistí nebo neopraví data, což může být jeden z důvodů poškození struktury souborového systému. Mezi další důvody patří softwarové chyby, výpadky při psaní na pevný disk( i když se jedná o souborové systémové žurnálování) nebo špatné ovladače souborového systému( ovladač NTFS v systému Linux byl v pohotovostním režimu pouze na čtení,nebyl zdokumentován a vývojáři nevěřili vlastnímu kódu).

  • Měl jsem tento scénář jednou, kdy aplikace uloží všechny své soubory na dva různé servery ve dvou různých datových centrech, aby uchovával pracovní kopii dat dostupných za všech okolností.Po několika měsících jsme si všimli, že asi 0,1% všech zkopírovaných souborů neodpovídá kontrolní součtu MD5, která je uložena ve své databázi. Ukázalo se, že se jedná o vadný kabel mezi serverem a SAN.

Tyto další důvody jsou důvodem, proč některé systémy souborů, jako je ZFS, uchovávají dodatečné kontrolní součty, aby detekovaly chyby. Jsou navrženy tak, aby vás ochraňovaly před mnohem více věcí, které se mohou pokazit, než jen hnilobit.

Musíte něco přidat k vysvětlení?Zní to v komentářích. Chcete se dozvědět více odpovědí od ostatních uživatelů technologie Stack Exchange? Podívejte se na celý diskusní příspěvek zde.