Strojové učení a big data. Microsoft koupil další firmy

Šéf Microsoftu Satya Nadella.

Šéf Microsoftu Satya Nadella. Zdroj: Microsoft

Microsoft pod novým výkonným ředitelem stále více prokazuje svojí náklonost k velkým datům, práci s informacemi a strojovému učení obecně. Redmond na těchto technologiích staví stále více interních produktů, z čehož má podle svých představ jednou hodně profitovat. K rozvoji této „kultury dat“, jak vše Satya Nadella pojmenoval, mají přispět i dvě nové akvizice.

První z nich je osm let fungující společnost Revolution Analytics, kterou Microsoft koupil za nespecifikovanou částku. Tento podnik pracuje s jazykem R, který se stal velice populární zejména mezi datovými vědci. R se hodně využívá pro statistické operace a celkově práci s velkým množstvím informací. Revolution Analytics nad tímto jazykem staví nástroje, služby a dejme tomu garance, což pak přitahuje také významné zákazníky.

Software od Revolution Analytics například umožňuje nástroje napsané v jazyku R nasazovat ve velkých prostředích, jakými jsou serverové farmy, datová centra a cloudy. Produkt je úzce provázaný s big data technologií Hadoop a je možné ho integrovat s různými firemními IT systémy.

Otevřený Microsoft

Microsoft zřejmě Revolution Analytics využije na více frontách. Jednak samozřejmě bude chtít získané produkty integrovat do své stávající nabídky. Je tu Azure, SQL, Windows Server, SharePoint, Visual Studio a tak dále. Redmond je zároveň velkým uživatelem jazyka R – využívá ho třeba v Bingu, Azure, Office či u online služeb Xboxu.

Mezi zákazníky získané společnosti patří velké finanční domy a banky, farmaceutické firmy, technologické firmy a další subjekty. Pro Microsoft tak jazyk R představuje další podchycení celého datového trendu. Revolution Analytics například dříve podepsala spolupráci s Hortonworks, který staví nástroje nad Hadoopem.

Hadoop či R jsou pro Microsoft další vstupenkou k větší otevřenosti. Redmond už dříve začal spolupracovat třeba s Clouderou či CoreOS a získáním R se chce také nadále angažovat v open source projektech jako RHadoop a ParallelR.

Prohledat všechny dokumenty

Druhou firmou, která zapadá do rozvíjejících se datových aktivit Softies, je Equivio. Tento izraelský startup údajně Microsoft vyšel až na 200 milionů dolarů. Nadellově týmu se bude hodit zejména pro rozšiřování možností kolem Office 365.

Equivio umí hledat a zpracovávat nestrukturovaná data, poznávat, co v nich je, a vše pak logicky třídit a analyzovat. K dispozici jsou také rychlé nástroje pro vyhledávání. Jeden z hlavních produktů tak například prohledává kvanta dokumentů a automaticky je umí na základě obsahu roztřídit. Velkými zákazníky Equivio jsou instituce jako NASA, americké ministerstvo spravedlnosti, Deloitte či Thomson Reuters.

To přesně zapadá do vize rozvoje Office. Satya Nadella už s projektem Delve či nástrojem Power Q&A jasně naznačil, kudy se chce vydat. Uživatel by prostě měl říct, co chce a machine learning a datová analytika na pozadí by mu měla poskládat výsledek. Microsoft do toho zapojuje nejenom samotný Office, ale také třeba SQL Server, Azure či třeba Bing, který mimo jiné slouží jako věc, která Microsoftu umožňuje data poznávat.

Strojové učení pro masy

Technologii Equivio bude možné kromě dokumentů aplikovat třeba na e-maily. Je jasné, že Microsoft postupně skládá skutečně komplexní sadu nástrojů využívající data a strojové učení. Jedním z příkladů je rozvoj technologie nazvané Azure ML, o které už jsme dříve psali. Ta v podstatě umožňuje si do cloudu nahrát všemožné zdroje dat a nechat si téměř okamžitě zpracovat výsledek.

„Azure ML je v podstatě strojové učení pro masy,“ řekl před pár měsíci pro E15.cz viceprezident Microsoftu pro machine learning Joseph Sirosh. „Cloud odstranil onu poslední míli nutnou k masovému nasazení. Dříve byli třeba datoví vědci, rozsáhlá IT infrastruktura a tak dále. Ne však dnes. Teď stačí skrze webový prohlížeč nahrát strojově čitelná data do cloudu a okamžitě můžete získat výsledky.“ Sirosh je pod Nadellou velice důležitý člověk a výsledky práce jeho týmu budou ještě hodně na očích.