Nové díly Avatara zaberou petabajty datových kapacit

Avatar

Avatar Zdroj: Bontonfilm

Před několika lety vznikl jeden z prvních, plně digitálně vytvořených filmů – Avatar. Tehdy produkční tým společnosti Lightstorm Entertainment zpracovával 250 až 300 terabajtů surových dat. Nedávno oznámený sequel Hollywoodského trháku by pak podle odhadů měl být mnohem větší: objem hrubých dat filmu by měl nabobtnat až na těžkou věřitelné desítky petabajtů.

Tvrdí to alespoň technický ředitel Lightstorm Entertainment Tim Bicio. „Další díly filmu Avatar mohou zabrat až desítky petabajtů,“ odhadl. Hollywood se podle něj bez datových úložišť v budoucnu jednoduše neobejde. A právě potřeba uskladnit takto ohromné balíky hrubých nezpracovaných dat a zároveň je živě zpřístupnit třeba hned několika produkčním skupinám z celého světa najednou, vedla ke vzniku čehosi, čemu odborníci říkají „data lake“.

Termín vykrystalizoval v průběhu posledních let z celého hype trendu kolem big data. U těch se ukázalo, že ne každý s nimi potřebuje pracovat a ne každá firma je potřebuje analyzovat stejně, respektive stejným způsobem (například prediktivní big data versus „klasická“ analytická big data). Data lake v tomto ohledu umožňují relativně levné uskladnění obřích objemů (výše zmiňovaných petabajtů) nestrukturovaných dat, s nimiž může jejich majitel nakládat, analyzovat je nebo v případě producentů filmů nechat v reálném čase měnit hned vícero týmy najednou.

„Pro mě osobně již filmový produkční průmysl v tom tradičním pojetí neexistuje. Jsme stoprocentně digitální firmou,“ prohlásil Jon Landau, produkční partner Lightstorm Entertainment, která pro svoji práci využívá služby firmy EMC Isilon. Ta jí připravila data lake jak pro první díl Avatara, tak i pro ty následující, zároveň razí myšlenku data lake jako hlavní způsob práce s daty v budoucnosti.