Microsoft sází na syntetickou DNA. Zkusí ji proměnit v úložiště budoucnosti
Když k nám domů dorazil první osobní počítač, všechny programy jsme měli uložené na několika běžných magnetických kazetách. Ty o pár let později vystřídaly rychlé diskety, pak CD-ROM, DVD, externí disky, flashová úložiště a nakonec abstraktní cloud.
Abstraktní cloud
Zatímco archiv několika DVD s rodinnými fotografiemi už dnes nepřečtu, protože doma nemám jediné zařízení s optickou mechanikou, v případě cloudu vím, že všechna binární data mnoha tisíc fotografií jsou tam kdesi v abstraktním internetovém éteru a já je budu moci kdykoliv zobrazit, stáhnout a dále upravit nehledě na to, jestli se bude za dvacet let používat pro práci s rastry ještě stále JPEG, anebo nějaký nový formát. Google Photos, Flickr a další – pokud budou stále existovat – mi fotografie prostě naservírují v tom aktuálním.
Internetový cloud jako princip práce s daty je možná abstraktní, ale jeho infrastruktura je docela konkrétní a v čase korodující | Internetový cloud jako princip práce s daty je možná abstraktní, ale jeho infrastruktura je docela konkrétní a v čase korodující
Ačkoliv internet přinesl lákavou abstrakci cloudu, samotný problém se stárnutím nosičů dat pochopitelně zůstává. Změnilo se jen to, že pevné disky a plastové kotouče s kritickými daty nekolabují u nás doma, ale v obřím datacentru, kde ty vadné provozovatel neustále vyměňuje a ztracená data obnovuje ze záloh.
Co po nás zůstane?
Jelikož naše společnost generuje stále více a více dat, hledají se i nové a trvanlivější cesty pro jejich archivaci. Leckoho by jistě napadlo, že bychom přeci zdaleka nemuseli archivovat vše, nicméně si představte, co všechno bychom věděli třeba o společnosti našich předků v raném středověku, kdyby již tehdy existovaly moderní způsoby dokumentace a hlavně chuť tato data vytvářet.
Je vlastně docela smutné, že i o počátcích přemyslovského státu víme jen z několika málo původních písemných pramenů a celé by to vydalo na pár blogových zápisků průměrného teenagera.
Fuldské letopisy – jeden z mála dobových pramenů, které zmiňují raný přemyslovský stát. Pokud nevymyslíme dlouhodobé archivační médium, z naší digitální éry toho může vydržet ještě méně. | Fuldské letopisy – jeden z mála dobových pramenů, které zmiňují raný přemyslovský stát. Pokud nevymyslíme dlouhodobé archivační médium, z naší digitální éry toho může vydržet ještě méně
Hlad po technologiích, jejichž úkolem není uchovat digitální informaci pro příštích několik let, než dojde k výměně pevného disku, anebo archivační magnetické pásky, ale pro příští stovky let, tedy roste.
Krystal z planety Krypton
Jedním ze slibných experimentů je třeba vypalování nul a jedniček do speciálního trvanlivého skla, které by měly být teoreticky čitelné i za miliony let – pokud se tedy tou dobou na Zemi či v jejím okolí najde někdo, kdo je ještě dokáže přečíst.
Na podobný kus speciálního skla se podle vědců ze Southamptonu vejde 360 TB dat a čistě teoreticky vydrží až 13,8 miliard let | Na podobný kus speciálního skla se podle vědců ze Southamptonu vejde 360 TB dat a čistě teoreticky vydrží až 13,8 miliard let
Hlavní kouzlo této skleněné technologie, která tak trochu připomíná fiktivní paměťové krystaly ze série o Supermanovi, však spočívá v tom, že neexistuje jen na papíře a její realizace je relativně snadná. Inženýři ze Southamptonské univerzity k vypalování vrstviček informací do skleněného hranolu totiž používají femtosekundový laser, který se dnes běžně používá třeba při operacích oční rohovky. Setkal se s ním každý, kdo si nechal laserem snížit dioptrie.
DNA jako magnetická páska
Jestli je vypalování dat do skla proveditelná archivační technologie, pak je kódování informací pomocí „božské kyseliny“ DNA naprosté sci-fi. Přestože i toto sci-fi se už v biochemických laboratořích skutečně děje.
A i když se v tomto případě jedná opravdu zatím jen o primární výzkum, který je roky vzdálený od komerčního využití, má o něj zájem i Microsoft, což ledacos signalizuje. A je to právě Microsoft, který si před pár dny koupil kvalitní syntetické DNA.
DNA je největší přírodní pevný disk s vlastním kódováním | DNA je největší přírodní pevný disk s vlastním kódováním
Na podobné nákupy a akvizice počítačových firem nejsme příliš zvyklí, čili podobné zprávy vzbudí přirozený zájem, v podstatě jde ale o to, že redmondská korporace uzavřela partnerství s biochemickým startupem Twist Bioscience, který se specializuje na vysoce kvalitní syntézu DNA.
Microsoft díky tomu získá obrovský oligonukleotid – syntetickou jednovláknovou molekulu DNA skládající se z deseti milionů nukleotidů, se kterými si nyní budou obě společnosti hrát a pokoušet se ji použít jako záznamové médium, kde však bude nuly a jedničky představovat chemická struktura DNA. A chemické kódování informací umí DNA naprosto skvěle, protože jako obří manuál z Ikei popisuje do nejmenšího mikroskopického detailu téměř vše živé na této planetě.
Miliarda terabajtů informací v jediném gramu
Jak píše Ars Technika, pokud by se čistě teoreticky podařilo využít efektivitu umělého ukládání dat do DNA na sto procent, pouhý gram DNA by představoval zettabajt informací – miliardu terabajtů. Suma sumárum, k uložení všech stávajících unikátních digitálních dat z celého světa počínaje zálohou kompletního internetu a konče soukromým adresářem „mami, toto neotvírej“ na vašem laptopu bychom potřebovali nanejvýše pár dekagramů DNA. Méně než co váží kelímek vlašáku a dva rohlíky k tomu.
A kdybychom teorii proměnili v praxi a efektivita kódování dat do DNA by nám kvůli režijním a opravným algoritmům, které se používají třeba v grafických kódech QR, jenž jsou pak čitelné i po částečném poničení obrázku, klesla třeba na tisícinu, stále bychom dokázali uložit kompletní digitální otisk veškerého lidského díla od hliněných destiček ze starověké Mezopotámie po zálohu PornHubu do hmoty o velikosti jedné přerostlé dýně.
Zatím hlavně slibný experiment
jestli se to jednou podaří, bude v praxi záviset na rychlosti, chybovosti a ceně zápisu a čtení z DNA. I to už dnes částečně umíme. Čtení informací z DNA – tzv. sekvencování – používáme posledních několik desítek let v medicíně, studiu lidského genomu i kriminalistice. Tomu odpovídá i rapidní pokles ceny. Zatímco projekt zmíněného studia lidského genomu trval déle než deset let a přišel vědce na tři miliardy dolarů, dnes by stejný proces stál zájemce naprostý zlomek původní ceny. Vždyť z individuální analýzy DNA se stal široce dostupný byznys.
Jenže bude trvat další dlouhé roky, než inženýři z Microsoftu a dalších společností zjistí, jestli lze podobným způsobem přečíst z DNA dostatečně rychle a hlavně levně také MP4 soubor s aktuálním hollywoodským trhákem nebo třeba ISO obraz čerstvého Ubuntu.
Z dnešního úhlu pohledu je něco takového prakticky nemyslitelné, ovšem stejně tak bylo ještě v 90. letech pro všechny z nás téměř nepředstavitelné, že se vlastně docela brzy dočkáme éry, kdy se na maličkou micro SD kartu za pár stovek vejdou desítky GB dat.
Článek vyšel na webu Živě.cz