V Praze se rozjíždí big data konkurence pro HP, Oracle a další

Big data.

Big data. Zdroj: Microsoft

Tahle firma se od mnoha dalších českých začínajících technologických projektů v mnoha ohledech hodně liší. Prozatím totiž netouží po žádné velké publicitě a všeobecné slávě. „Stejně teď nemáme kapacity na to obsloužit další zákazníky,“ vysvětluje zakladatel a šéf asi čtvrt roku starého podniku Shards.io Aliaksandr Aliashkevich. To jeho firmu také odlišuje od jiných: od začátku vydělává slušné peníze.

Aliaksandr Aliashkevich nějakou dobu působil v pražské vývojové centrále Skypu, kde jako programátor stavěl velké databázové clustery, které tento komunikační nástroj pro svůj chod využívá. Asi čtyři měsíce nazpět se ale na Smíchově přesunul o pár desítek metrů vedle. Nyní obývá prostory technologického centra Node5 a databázové zkušenosti ze Skypu chce překlopit do poměrně ambiciózního podniku.

„Jsme v podstatě konkurence pro technologie jako HP Vertica, Oracle Exadata, EMC Greenplum nebo pro firmy, které staví projekty nad Hadoopem,“ popisuje mladý Rus, který už se usadil v Česku a solidně hovoří zdejším jazykem. Shards.io tedy začíná stavět velké databázové clustery pro firemní zákazníky. Rozdíl ovšem je v tom, že si jako základ vybírá databázi PostgreSQL, s níž pracoval právě ve Skypu.

Ukázkovými zákazníky Shards.io tedy mohou být například automobilky, které pomocí všemožných senzorů sbírají čím dál větší množství informací o každém automobilu. Technologie by mohla zajímat také operátory v rámci jejich povinností s uchováváním dat (data retention) a podobně. „Zatímco Hadoop umožňuje zpracovávat nestrukturovaná data, my se hodíme na ta strukturovaná. Typicky tedy na informace ze senzorů a tak dále,“ vysvětluje programátor a podnikatel.

Node5.Node5.|Node5

To by nemusel být vůbec špatný byznys. „Oživených“ zařízení s čipy, čidly a tak vůbec s nástupem internetu věcí stále přibývá a objemy strukturovaných (ale i těch nestrukturovaných) dat rychle rostou. Zásadní otázkou ovšem je, zda se Shards.io dokáže prosadit v hromadě již zmiňované i nezmíněné konkurence, která rovněž cítí příležitost. Zavedení giganty navíc mají silné obchodní a partnerské sítě.

„Konkurovat chceme zejména díky dvěma věcem – ceně a tím, že jsme nad PostgreSQL postavili MapReduce,“ vysvětluje Aliashkevich. Cena se dá mimo jiné srazit tím, že Shards.io samozřejmě není Oracle nebo HP, ale také tím, že chce software stavět nad levným komoditním hardwarem, který se dnes už běžně v datových centrech usazuje.

Příležitost pro zájemce

Shards.io je nyní v začátcích a firma ještě nestihla vyvinout finální model. Ten do budoucna počítá s tím, že její databázové clustery budou – zjednodušeně řečeno – univerzální a bude možné je dodávat rovnou s hardwarem (a samozřejmě potřebnými úpravami podle zákazníků). Výsledek by mohl být podobný třeba tomu, co dělá Red Hat či nově běžící nad Hadoopem.

Tak daleko projekt ale ještě není a Shards.io projekty buduje jednotlivě. „Aktuálně pracujeme na druhé velké instalaci s tím, že na každou máme až několik měsíců,“ popisuje. Zákazníků, kteří by se o připravené PostgreSQL mohli zajímat, je podle něj hodně. Je pravda, že si mnohé velké firmy právě nad touto technologií staví vlastní řešení. Příkladem budiž Avast, jenž si PostgreSQL cluster budoval sám.

Shards.io aktuálně pracuje na druhé velké instalaci s tím, že každá zabere až několik měsíců. Výsledkem má být ale model podobný třeba Red Hatu.

Aliashkevich v současné době dodává do domovského Ruska, kde navázal vztahy s tamním velkým obchodním partnerem. Do budoucna se chce ale dostat přímo k zákazníkům a nyní i v Česku i jinde hledá lidi, kteří by byli schopní mu s tím pomoci.

V Shards.io mají práce hodně a počítají tak s tím, že přijmou nové lidi také na technické pozice. Firma má otevřené pozice na databázové a DevOps inženýry, finálně by je chtěla zaměstnat ale až tak na podzim. „Máme teď plné ruce práce se zakázkami a vývojem a nezbývá moc času na zaučování a vysvětlování,“ říká Aliashkevich.

Velká část technologií, se kterou mladá společnost aktuálně pracuje, a na kterých svůj produkt staví, je open source. Základ pro chod prozatím na serveru tvoří Ubuntu, do budoucna se ale počítá s mnoha dalšími systémy.

Mnozí si slibovali, že podobné „big data and analytics“ projekty představí letošní ročník StartupYardu, který se za podpory významných firem zaměřil právě na tuto oblast, nakonec se ale takové projekty rodí jinde. Takže kdo ví, třeba o Shards.io ještě bude hodně slyšet.