Hvad dit diskdrev ikke fortæller dig

  • Sep 26, 2023

fordi det er uvidende. Du ved, at du har et problem, når dit diskdrev går ka-thunk.

fordi det er uvidende.

Du ved, at du har et problem, når dit diskdrev går ka-thunk. En undersøgelse af 1,53 millioner diske viser, at datafejl er meget mere almindelige end direkte fejl. Du ved det bare ikke. Hvad værre er, det gør de mennesker, der designer pc-filsystemer heller ikke.

En anden form for latency Urapporteret el latent diskfejl er reelle. Storage array-leverandører er holdt op med at anbefale RAID 5 med SATA-drev på grund af den meget store chance for, at du ikke får dine data tilbage.

Men indtil Lakshmi N. Bairavasundaram, Garth R. Goodson, Shankar Pasupathy og Jiri Schindler analyserede fejlloggene for over 50.000 systemer, ingen havde lavet en storstilet undersøgelse af problemet før. Lakshmi var ved U of Wisconsin-Madison, mens de 3 sidstnævnte arbejdede hos den store NAS-leverandør Network Appliance. De udgav En analyse af latente sektorfejl i diskdrev sidste år.

Diske har mange fejltilstande, de fleste af dem - heldigvis - forbigående. Denne undersøgelse fokuserede på

Latente sektorfejl (LSE), der er defineret som dårlige nyheder:

Denne fejl opstår, når en bestemt disksektor ikke kan læses eller skrives, eller når der er en ukorrigerbar ECC-fejl. Alle data, der tidligere er lagret i sektoren, går tabt.

[fremhævelse tilføjet]

Resultater Da de fleste ZDnet-læsere kører PATA- eller SATA-drev, vil jeg fokusere på holdets resultater for det, de kalder - i åbenbar respekt for NetApp-marketing - nærlinie drev, i modsætning til de dyre virksomhed drev, der bruges i avancerede arrays. For mig og dig er nearline- eller forbrugerdrev de onlinedrev, vi stoler på hver dag.

8,5 % af alle forbrugerdrevne udviklede LSE. Det er den gode nyhed.

Holdet fandt flere faktorer, der bidrager til LSE.

  • Størrelse betyder noget. Efterhånden som diskstørrelsen øges, stiger andelen af ​​diske med LSE også.
  • Alder betyder noget. 20 % af nogle forbrugerdiske havde LSE efter 24 måneder. LSE-raterne steg med alderen.
  • Sælger har betydning. De fandt også ud af, at nogle leverandører havde meget højere LSE end andre. På grund af branchen omerta de vil ikke snyde synderne, men du kan vædde på, at NetApp ikke køber deres diske.
  • Fejl betyder noget. Et drev, der udvikler én fejl, er meget mere tilbøjeligt til at udvikle en anden.

Forbruger/SOHO-brugere med store, billige, gamle diske vil se LSE. En anden grund Desktop RAID er en dårlig idé.

Implikationer for pc-filsystemer Filsystemer er afhængige af diskbaserede datastrukturer for at holde styr på dine ting. Et af de vigtigste resultater af holdet er, at diskfejl har en tendens til at samle sig tæt på hinanden, ligesom kongresmedlemmer og lobbyister.

Efter den første LSE er en anden LSE også meget mere sandsynlig. LSE er ikke tilfældig i tid eller rum.

Derfor er det meget mindre sandsynligt, at filsystemer, der replikerer kritiske data på tværs af disken, mister dine data, end dem, som Linux ReiserFS, placerer kritiske strukturer i ét sammenhængende område. Måske en person med specifik viden om, hvordan NTFS og HFS+ lægger deres datastrukturer ud, kunne kommentere.

Opbevaringsbittene tager Vi kan alle godt lide store billige drev, men denne undersøgelse viser, at de kommer med nogle afvejninger. Disse data får mig ikke til at opgive mine.

Det, jeg gør, er at sikkerhedskopiere hver nat til et bootbart eksternt drev. Hvis du ikke sikkerhedskopierer nu, håber jeg, at du snart starter.

Opdatering: hvis du er hjemmebruger, er der noget, du bør anderledes? Ja.

  • Sikkerhedskopier dine data. Diske er utroligt pålidelige, men de fejler. Vær forberedt.
  • At udskifte diske, når de fylder 3, ser ud som en god idé, hvis uplanlagt nedetid ville koste dig penge. Jeg har et backup-computersystem af netop den grund. Ingen computer = ingen indkomst. Så jeg tager det her seriøst.
  • Brug ikke desktop RAID 5. Hvis et drev fejler, og du støder på en LSE på genopbygningsdrevene, skal du alligevel gå til din backup. Du behøver ikke besværet.

Jeg slår hårdt på min maskine, bruger snesevis af programmer om ugen og laver tusindvis af filer, så jeg bruger et OS X-diskreparationsværktøj hvert par måneder til at genopbygge min mappe. Jeg er overrasket over, hvor ofte det har løst problemer, som jeg aldrig troede kunne være filsystemrelateret. YMMV. Afslut opdatering.

Kommentarer er selvfølgelig velkomne.