ČVUT zkoumá velká data a chce se propojit s firmami

Jan Šedivý, ČVUT

Jan Šedivý, ČVUT Zdroj: Jan Sedlak

České vysoké učení technické rozjíždí projekty, jejichž výsledkem mají být technologie a produkty, které umožní analyzovat obrovské množství strukturovaných i nestrukturovaných dat. Přední česká technická škola by ráda úzce propojila akademickou sféru se soukromým sektorem. Má jít o vzájemnou symbiózu – firmy se na školních výzkumech mohou podílet poskytnutím dat a výsledkem pak mohou být produkty, které jim z dat umožní vyčíst důležité a užitečné údaje.

Takzvaná big data jsou v současné době veliký pojem, se kterým pracuje stále více společností. Různá zařízení připojená k internetu generují značné množství dat, která je ne vždy jednoduché zpracovávat, analyzovat a využívat k dalším činnostem. Velcí giganti jako Oracle, SAP, Microsoft, HP a mnozí další na ukládání a zpracování big data zakládají budoucnost svého podnikání. Třeba tím, že umožňují přívaly údajů zpracovávat v operační paměti serverů.

S příměsí umělé inteligence

Skupina asi 10 doktorandských a magisterských studentů ČVUT pod vedením Jana Šedivého chce tento trend podchytit. „Na big data projektech se tady na ČVUT pracuje prakticky od pradávna,“ popisuje bývalý vysoký inženýr z Googlu a IBM ve své univerzitní kanceláři na Karlově náměstí v Praze. „V této oblasti se používají prvky umělé inteligence a takzvaného data learningu, což jsou projekty, které zde delší dobu vznikají, nicméně doposud ne ve spojení s big data,“ doplňuje Šedivý, který za své výzkumy v oblasti práce s daty a umělou inteligencí získal světová ocenění i několik patentů.

ČVUT v současné době hledá nové firemní partnery, kteří by byli ochotní svá data skupině akademiků svěřit. Samotná škola totiž k obrovským databázím všeho druhu nemá přístup. „Nějaká školní data sice máme, ale těch není tolik,“ popisuje Šedivý. „My ale potřebujeme údaje od velkých bank, pojišťoven, e-shopů nebo webových společností.“ Poptávka přitom není pouze po českých subjektech, ale také po těch ze zahraničí.

S několika takovými partnery už se na české technice pracuje. Princip je často podobný – soukromá firma poskytne škole určitá data, která jsou kompletně anonymní, takže z nich nelze vyčíst například konkrétní údaje o zákaznících, a akademici díky nim pak provádí výzkumy a tvoří software a algoritmy.

Velká data mohou být užitečná třeba pro pojišťovny. Z analýzy různých vzorků obří databáze je možné vyčíst to, jak vypadá pojistný podvod a na základě takové nekalé aktivity odhalovat. Podobné techniky mohou využít také banky. Internetové obchody zase mohou zkoumat chování svých zákazníků a internetové firmy zase lépe třídit a ukládat vrstvící se množství informací.

Změnit svět

Samotná škola na podobných akcích může i vydělat. Jan Šedivý je na ČVUT zodpovědný za přenos univerzitních technologií a know-how do komerčního prostředí a vytvořené projekty se tak snaží uplatnit na běžném trhu. „V tomto případě postupujeme podle různých možností, které nám umožňuje zákon. Většinou uzavíráme kontrakty a velká část z nich míří do Spojených států,“ říká Šedivý.

Právě propojení univerzit a firem je českým školám často vyčítáno a za příklad se dává ekosystém ze Států, kde díky spojení těchto dvou oblasti vznikají úspěšné velké firmy. „V Česku se to teď podařilo v případě spojení ČVUT a Cognitive Security, které koupilo Cisco, takže to jde,“ konstatuje Šedivý.

Šedivého role proto může být pro školu důležitá. „Je tu (na ČVUT) spousta vědců, kteří umí pracovat s technologiemi a vytvářet nové věci, neumí je ale přetavit do byznysu. Z jejich skvělých projektů vznikne třeba pěkná kapitola v odborné učebnici, ale to je vše,“ popisuje bývalý šéf vývojářů v Googlu. Šedivý proto rozjel iniciativu eClub, kde snaží studenty učit to podnikat a uspět na komerčním trhu.

Pro samotné výzkumníky ale údajně peníze nepředstavují tu hlavní motivaci. „Primárně nám jde o to, abychom se něco naučili a změnili svět. Musí tam být ta vášeň pro objevování nových věcí,“ popisuje zkušený technolog.

Velká data se mohou na ČVUT zkoumat i díky partnerům, kteří zdarma poskytují nutnou hardwarovou infrastrukturu. Škola má k dispozici několik serverů v několika datových centrech v Praze, na kterých spouští cloudy a vlastní projekty. Hodně se využívá takzvaný grid. Akademici si také po vzoru Googlu montují vlastní levné stroje v ceně kolem 25 tisíc, které sice nedokážou odbavit „nekonečné“ množství dat, na základní výzkum ale postačují.

ČVUT se dostane rovněž k big data technologiím jako Hadoop, jejich využití ale prozatím není tak velké. „Data, která v současné době máme k dispozici, prozatím nejsou tak veliká, abychom Hadoop využili,“ vysvětluje Šedivý. Následují se i další trendy. Doktorandi si hrají s nestrukturovanými NoSQL databázemi a zpracováním dat v paměti.

„Chceme se spojit s důležitými partnery. Třeba takový Seznam by se nám hodně líbil, to je skvělá společnost,“ uzavírá nadšený vědec. „Big data budou ještě větší. Začíná éra internetu věcí a informace budou generovat různá čidla a další přístroje.“