Boj o extrémně rychlé zpracování dat může začít

Šéf Oraclu Larry Ellison.

Šéf Oraclu Larry Ellison. Zdroj: Jan Sedlak

Trvalo to sice déle, než se původně předpokládalo, nakonec to ale vyšlo. Oracle sice chtěl svojí odpověď na technologii HANA od konkurenčního SAPu uvolnit na trh do dvou měsíců od doby, kdy jí na podzim na konferenci v San Francisku představil. Nakonec je z toho rok, konečně ale mohou skončit slovní přestřelky a obě firmy mohou své nové hračky poměřit v praxi.

Řeč je o takzvaných in-memory databázích. Databáze jsou základní stavební kámen informačních systémů, cloudů, webů, e-shopů a tak dále a ještě donedávna se vyznačovaly zejména tím, že ukládaly data zejména na tradičních pevných discích. S tím, jak klesá cena operačních pamětí (RAM) a SSD disků se nicméně mnoho operací a dat dá přesunout právě na tyto rychlejší komponenty a tím zásadně urychlit zpracování informací.

„Technologie kolem naší databáze se změnily. Paměti se staly levnějšími, takže dávalo smysl je více využít. Flash se stal cestou, jak nahradit tradiční disk,“ uvedl minulý týden šéf Oraclu Larry Ellison společně s oznámením, že in-memory možnost pro tradiční Oracle databázi bude dostupná během několika týdnů.

Z hodin jsou minuty

Oracle překládá některá první čísla. Databáze Oracle 12c se zapnutou podporou zpracování dat v paměti údajně zvládne některé položky zpracovat až stokrát rychleji, analyzuje až tři biliony řádků informací za sekundu a ty operace, které dříve trvaly třeba 60 hodin, bude nyní možné zvládnout za 13 minut. Praxe samozřejmě ukáže, u každého zákazníka se dle specifického prostředí mohou čísla všelijak lišit.

Oracle do in-memory hry vstupuje později, než zmiňovaný SAP a jeho HANA (Oracle sice koupil in-memory databázi TimesTen, ta ale zvládá pouze specifické operace a navíc není cenově příliš atraktivní). HANA se za tři roky na trhu stala nejrychleji rostoucím IT artiklem v historii a ze SAPu mimo jiné udělala poměrně relevantního hráče na databázovém trhu. Německá firma sice v tomto byznysu figurovala po nákupu společnosti Sybase, stále ale brala Oracle jako velkého partnera a jeho databázi dodávala k vlastnímu softwaru.

Prezident Oraclu Mark Hurd na konferenci OpenWorld 2013 v San Francisku.Prezident Oraclu Mark Hurd na konferenci OpenWorld 2013 v San Francisku.|Jan Sedlak

Adopce HANA je sice rychlá, ta stále ale v celkovém databázovém trhu hraje minoritní roli. Oracle podle čísel Gartneru s přehledem ovládá 48procentní tržní podíl v tradičních databázích. Larry Ellison navíc věří, že jeho in-memory funkce získá během jednoho roku u zákazníků mnohem větší penetraci, a to právě díky instalované bázi.

Docílit by toho mělo údajně jít i díky tomu, že v případě Oraclu stačí na in-memory „přehodit páku“, zatímco HANA je nová platforma, pro kterou je často nutné aplikace napsat znovu. „Nainstalujte nový software, přehoďte přepínač a všechno běží rychleji,“ tvrdí Ellison. „Stačí říct, které tabulky nebo části chcete mít uloženy v paměti. To je vše, hotovo.“ Je zde ale jedna podmínka – týká se to enterprise verze databáze Oracle 12c a podrobné ceny budou zveřejněny až při vydání. SAP tvrdí, že HANA bude levnější.

Zaklínadlo pro velká data

Databáze Oraclu umožňuje kombinovat paměť RAM, PCI flash, disky a zvládne pracovat až s 32 TB operační paměti. Navíc zvládne ukládat data jak v řádcích, což se hodí zejména pro transakční operace, tak ve sloupcích, což se hodí pro analytiku.

V tom by Oracle mohl být velice zajímavý. SAP HANA je sice velice silná v analytických funkcích, o kterých Němci velice často mluví, ale v tradičních transakcích (OLTP) už zase tolik neexceluje.

Zaklínadlo in-memory každopádně není záležitostí pouze dvou tradičních konkurentů. S touto technologií v novém SQL Serveru 2014 pracuje také Microsoft a vznikají i některé velice zajímavé mladé projekty. Třeba bývalí zaměstnanci Facebooku a Microsoftu letos rozjeli projekt MemSQL, který vypadá poměrně zajímavě. Do toho se mísí také databáze typu Hadoop, které pracují s nestrukturovanými daty.

V Česku už se in-memory rovněž začíná usazovat. Mall.cz třeba běží na SAP HANA.

In-memory každopádně začíná trhem rezonovat. Cena je samozřejmě v porovnání s tradiční databází a pevnými disky stále mnohem vyšší, objevují se ale (zejména ti velcí) zákazníci, kteří velice oceňují přidanou hodnotu v podobě oné často fascinující rychlosti. Díky tomu není nutné čekat na výsledky dny, ale pouze minuty či sekundy. Nové nástroje nad těmito databázemi navíc umožňují vytáhnout informace pomocí jednoduchých nástrojů a nemusí tak činit pouze IT oddělení. V Česku si například nasazení HANA pochvaluje Mall.cz.

Další roli mohou in-memory nástroje sehrát v cloudu. SAP už třeba nabízí HANA Enterprise Cloud, díky čemuž není nutné pořizovat vlastní servery s hromadou paměti a SSD disků. Výrobci serverů už nicméně in-memory možnosti také větří a vydávají přizpůsobené stroje.

O což se ostatně snaží i sám Oracle. Ten vedle tradičních komplexních, výkonných a také náležitě nákladných přístrojů z řady Exa vydal nové x86 servery s čipy Intel Xeon E7-8895 v2 (Sun Server X4-4 a X4-8), které mají být plně přizpůsobeny pro práci s daty.

Praxe ukáže, zda naroubování in-memory možnosti na běžnou databázi není pouze řešením z nutnosti. Z řad analytiků se například ozývají názory, že tento postup lze přirovnat k tomu, kdyby se na spolehlivý a funkční VHS přehrávač přidělala Blu-Ray mechanika.