Vesmír nenávidí vaše údaje

  • Oct 29, 2023

Skladovanie je najťažším problémom informačných technológií. prečo? Pretože entropia vždy pracuje na zničení našich údajov. Existuje len jedna stratégia, ktorá funguje.

Prečo musí byť ukladanie údajov také ťažké? Zlyhania disku, bitová hniloba, chyby súborového systému a ďalšie. Zdá sa, že CPU a siete jednoducho fungujú – prečo nie úložisko? Entropia, môj priateľ, entropia. Vesmír nenávidí vaše údaje.

Naozaj.Entropia sa vzťahuje na všeobecnú tendenciu systémov postupne sa zmenšovať.

Napríklad v spaľovacom motore zapaľovanie paliva poháňa usporiadaný súbor akcií: piesty sa pohybujú; ventily otvorené; kľukový hriadeľ sa otáča. Ale ako sa zápalné teplo šíri cez mechanické komponenty, stáva sa menej užitočným: a V chladných dňoch sa auto zohreje, ale veľká časť energie paliva uniká ako odpadové teplo a nie je užitočná práca.

In informačnej teórie entropia sa vzťahuje na to, ako je bitový tok usporiadaný alebo predvídateľný. Je to užitočné, pretože usporiadané bitové prúdy – povedzme jasná modrá obloha na fotografii – sú stlačiteľnejšie.

Kópie vs originály Úložisko však existuje na hranici teórie informácie a fyzického sveta. Vo veľkej časti teórie informácie – napr vymazávacie kódy - cieľom nie je maximálna kompresia, ale maximálna spoľahlivosť.

Siete bežne kódujú 8 bitov údajov do 10 bitov, aby umožnili obnovu údajov, keď sa vyskytnú chyby. Paketové siete – väčšina dátových sietí – sa nespoliehajú len na kódovanie 8/10: uchovávajú kópie údajov vo vyrovnávacej pamäti. Ak má prijímajúci uzol problém, znova odošle paket. Siete pracujú s kópiami – nie s originálmi.

Ale v sklade túto možnosť nemáme: skladujeme originály. Entropia je teda ešte väčší problém.

To je dôvod, prečo sa všetky funkčné stratégie ochrany údajov spoliehajú na pridávanie bitov. Bity môžu byť v dátovom toku ako pri kódovaní 8/10, alebo môžu byť v kópiách dokumentov, ako sú zálohy. Alebo, čo je najspoľahlivejšie, extra bity sú na každej úrovni prenosu a ukladania dát.

Pointa je, že údaje v pokoji sú vždy citlivé na entropický rozpad. Vaše dáta nie sú nikdy 100% v bezpečí.

Úložné bity zaberajú Technici milujú kladné čísla: GHz; jadrá; rýchlosť prenosu dát; prístupové časy. Ale dátová entropia je celá o negativite: MTTF; AFR; MTTDL; časy prestavby. Čísla sú slabé a premýšľanie o úmrtnosti našich údajov – a teda aj našej vlastnej – nie je príjemné.

Vedci a inžinieri z oblasti skladovania sa však snažia vytvárať stále hustejšie – usporiadanejšie – úložné zariadenia a systémy. A zároveň vytváranie schém ochrany údajov na ochranu čoraz zraniteľnejších údajov.

Niektoré problémy sa dajú vyriešiť. Ostatné sa dajú len spravovať. Skladovanie je a vždy bude medzi tými poslednými.

Zálohujte si teda svoje dáta! Vesmír je väčší ako my všetci a naše úložné systémy.

Komentáre sú samozrejme vítané.