Technologicky jsme stále na špici, vzkazuje Centrum
„Centrum bylo dříve vnímáno jako lepší technologická varianta k Seznamu. Myslím si, že v mnoha ohledech toto platí dodnes,“ tvrdí v kancelářských prostorách Centrum Holdings v pražských Holešovicích technický šéf společnosti Štěpán Burda. Jako jeden z příkladů zmiňuje e-mailovou službu Centra. „Minimálně v technologické části jsme v tomto dále než Seznam a spíše se srovnáváme s Gmailem.“
Zatímco Seznam postupně uvádí do ostrého provozu novou podobu svého e-mailu, Centrum podle Burdy sází především na postupné a ne vždy úplně nápadné inovace. „Testujeme 5GB schránky. Jsme sice teprve na začátku, ale už nyní nabízíme stejné vnitřní limity, jako má Seznam u svého údajně neomezeného e-mailu, to je 30 tisíc zpráv na účet.“ Firma kromě toho umožňuje také jednoduché posílání SMS nebo ve spolupráce s eM Clientem také vlastní desktopovou aplikaci.
Datová centra ve stylu Googlu
E-mail od Seznamu je každopádně nejpoužívanější službou pro posílání pošty v Česku. Gigamail nicméně obsluhuje také zákazníky na Slovensku a Chorvatsku, které Centrum Holdings získal při vstupu nového majitele. „Ve výsledku tak máme zhruba stejný počet uživatelů, jako má Seznam,“ upozorňuje Burda. E-mailové schránky Centra každých 24 hodin přijmou více než 70 milionů e-mailů a půl milionu jich odešlou, přičemž zhruba třetina těchto e-mailů obsahuje přílohu. „To už vyžaduje pořádné technologie a infrastrukturu,“ říká Burda.
A právě na technologie, které veškeré služby Centrum.cz pohání, jsou v Holešovicích pyšní. České i zahraniční produkty společnosti běží na zhruba 800 serverech ve 3 datových centrech kolem Prahy. „Infrastrukturu budujeme tak trochu ve stylu Googlu,“ popisuje Burda principy fungování datových center. Firma nenakupuje žádné drahé servery od největších světových hráčů, ale raději vše staví z levnějších značek a nad tímto železem pak nasazuje vlastní software. „Samozřejmě nejsme tak daleko, abychom si stavěli vlastní hardware jako Google, ale funguje přesně na podobném přístupu.“
„Kupujeme ten nejlevnější hardware, který můžeme sehnat,“ pokračuje Burda. „Ve většině případů jsou to stroje od Super Micro, ale v konečném důsledku nám je jedno, od koho železo kupujeme.“ Centru v podstatě nezáleží na tom, jaký mají servery výkon procesoru, kolik RAM a další technické parametry. „Od určité kapacity nám servery bohatě dostačují a u nás je to především o škálování. Stejných a levných strojů máme desítky až stovky.“ Nově přidaný server přitom technici dokáží zprovoznit do běžného nasazení během desítek minut.
Centrum obsluhuje e-mailové schránky v Česku, Chorvatsku a na Slovensku.
Takové kombinování je možné díky softwarové platformě, které si Centrum nad fyzickým železem vybudovalo, ať už jsou to nástroje pro správu serverů, tak pro provoz samotných webových služeb. „Kombinujeme to, co nám dá open source s vlastními technologiemi,“ popisuje mladý technický šéf. Základ tak tvoří Linux, hotové nástroje s otevřeným zdrojovým kódem a software, který vyvíjí programátoři. V klasickém provozu se ani nevyužívá virtualizace, která s využitím levného hardwaru nedává tolik smysl. Firma nicméně virtuální servery na nástrojích VMware provozuje při vývoji a testování.
Například u e-mailu vývojáři v Centru používají některé dostupné technologie pro zpracování pošty, zároveň ale značný kus celého obslužného systému vyvíjejí sami. Jejich e-mail nespoléhá na centrální ukládání dat a pro ukládání je využíváno simulování souborového systému. „Už v počátcích budování našeho e-mailu jsme se vydali cestou škálování levných strojů. Je vidět, že ta platforma je škálovatelná dobře, protože jsme začali na 5 serverech a teď jich máme 250.“
Běh na otevřeném softwaru
Využití open source v takto velikém prostředí podle Burdy nepředstavuje problém. „Při rozhodování, zda nasadit otevřený software, je zásadní, zda máte kvalitní tým lidí, kteří se o tyto technologie dokáží postarat. Pokud ano, není problém je použít i ve velkém měřítku.“ Výhodou je údajně přístup ke zdrojovým kódům, tvorba skriptů a možnost si vše upravit dle svého. „Pokud toto umíte, můžete si systém ohnout k obrazu svému lépe, než třeba s technologiemi od Microsoftu.“
V jiných společnostech je ale možné se setkat s jiným přístupem. Například v Geewě, která patří mezi 10 největších vývojářů her na Facebooku, dávají přednost právě Microsoftu. „Nejsme tak bohatí, abychom si pořizovali levné věci,“ říká na adresu open source šéf Geewy Miloš Endrle. Na otevřený software je dle jeho zkušeností potřeba velký tým odborníků, kteří ho musí spravovat a udržovat v chodu, což nakonec anuluje nízké pořizovací náklady.
V Centru mají na každých zhruba 120 serverů jednoho administrátora, celkově tedy 6. „Je to o tom, jaké nástroje si pro aktualizaci a další úkoly vyvinete,“ argumentuje technický šéf české internetové dvojky. Jeho kompletní IT tým aktuálně čítá 70 lidí, přičemž drtivá většina spadá do vývoje produktů, nikoliv do údržby serverů. V konkurenčním Seznamu, který rovněž funguje na Linuxu, se o montáž a instalaci serverů stará 8 lidí a správců aplikací je pak 25.
Open source nad Microsoftem v Centru vyhrál i v době, kdy se Centrum.cz spojilo s konkurenčním Atlasem. Ten vznikl čistě na technologiích Redmondu a při slučování došlo k výraznému střetu kultur. „Nakonec jsme zůstali u open source, ale nechci posuzovat, která technologie je lepší. Nicméně na příkladu Atlasu je vidět, že podobně veliký projekt je možné provozovat také na platformě Microsoftu a není to o tom, že by věci šly dělat pouze na jedné platformě,“ říká Burda.
Centrum provozuje 800 serverů ve 3 datových centrech.
Podle jeho slov o vítězství volného softwaru rozhodla mimo jiné vyspělost produktů. E-mail Centra běžící na open source tvoří třetinu celé IT kapacity firmy a Atlas mimo jiné část svého e-mailu rovněž psal na otevřené platformě. „Málokdo ví, že v Atlasu se připravovala nová verze e-mailu, která už využívala také Linux.“
Po stabilních kabelech
Centrum před rokem a půl kompletně předělalo síťovou infrastrukturu s tím, že rovnou umožnilo zavedení „nového internetu“ IPv6. Díky tomu už přechod na nový protokol o pár měsíců později neznamenal žádné náklady navíc a proběhl hladce. IPv6 firma testovala na vlastních zaměstnancích a „šestkovým“ protokolem komunikuje pouze směrem z datových center, servery komunikují stále přes IPv4.
I když se Centrum připojilo ke dni IPv6, provoz v rámci této nové sítě je stále prakticky zanedbatelný. Aktuálně přes tuto síť ke službám společnosti přistupuje 10 tisíc lidí, což ani není měřitelné procento. „Je dobrý být připravený a vzhledem k tomu, že nás to nestálo žádné náklady navíc, je dobré se připojit, protože když to neudělají vydavatelé obsahu, bude to uzavřený kruh,“ popisuje problematiku Burda.
Ostatní síťový provoz už ale rozhodně malý není. Centrum si s internetem vyměňuje datový tok 2 Gb/s a infrastrukturou v datových centrech ve špičce protéká 20 Gb/s. Navenek proto stačí 10Gb linky, mezi servery jsou ale vybudována také 20 a 30Gb propojení. Největší tok dat připadá na e-mail.
Vzhledem k těmto tokům už Centrum se sítěmi neexperimentuje tolik, jako se servery. „U sítí není úplně jednoduché použít levné technologie, protože se v tomto případě neumíme vypořádat s výpadky stejně dobře, jako v případě serverů,“ říká Burda. Firma tak investuje do dražších a ověřených síťových prvků. S virtualizací síťových spojů technický šéf do budoucna prozatím nepočítá, i když aktuálně virtualizuje například balancery, což má podle jeho slov obrovský přínos. „Výraznější virtualizace sítí ale v našem případě není něco, v čem bychom prozatím viděli využití.“
Česká internetová dvojka staví levnou infrastrukturu s vlastním softwarem.
Data, která služby Centra využívají, se zapisují především do databáze MySQL a v případě obchodních modelů také do PostgreSQL. V menší míře je pro specifické projekty využíváno také MongoDB. Pro ukládání dat do paměti (in-memory) má Centrum napsaný vlastní nástroje SessionDB. „Přirovnal bych ho k odlehčenému Redisu nebo memcacheDB.“ Pro analýzu a reportování ukládaných dat se pak používá český produkt GoodData, protože ho podle Burdových slov není složité nasadit ve velké infrastruktuře.
Mobilní a cool Centrum
Toto robustní zázemí má Centru zajistit platformu pro budování dalších služeb, zejména jejich mobilních variant. „Trend přechodu na mobilní zařízení je jasný. Uživatelé přecházejí od klasických obrazovek k těmto druhům přístrojů a obsah konzumují všude možně,“ konstatuje Burda a zmiňuje, že právě mobilní služby jsou pro jeho společnost veliké a aktuální téma.
Centrum v posledním tři čtvrtě roce udělalo několik důležitých kroků směrem k tomu, aby na mobilní vlnu naskočilo, zejména restartovalo CMS systém, který pohání všechny služby. „Základem bylo, aby splňoval tři požadavky: být mobilní, multimediální a sociální.“ Díky tomu v současné době probíhají převody služeb Centra na mobilní přístroje.
Holešovická firma se nicméně nevydává cestou nativních mobilních aplikací, ale raději volí HTML5. „Vždy to posuzujeme podle jednotlivých produktů, ale obecně více věříme mobilním webům používajícím HTML5, AJAX a JavaScript,“ popisuje Burda. Aplikace podle jeho slov není tolik flexibilní pro doručování obsahu, vývoj je nákladný a ve hře jsou také například schvalovací procesy. „Navíc máme kvalitní kodéry a programátory JavaScriptu a dává větší logiku použít je, než shánět těžko dostupné programátory nativních aplikací.“
U některých služeb nicméně tvorba aplikací smysl má, třeba u elektronického deníku Insider. Ten Centrum vydává prozatím pouze pro web a Kindle, ale chystá také verzi pro další chytrá zařízení. Smysl by měla také aplikace pro mapy, ty ale v Holešovicích na rozdíl od Seznamu nehrají zásadní roli a s tvorbou aplikace se tak nepočítá. „Například u sportu věříme, že uživatelé raději přijdou na web,“ říká Burda. Právě sportovní zpravodajství je, podobně jako u Seznamu, nejvyužívanější mobilní službou. Z celkové návštěvnosti už je 8 procent uživatelů mobilních.
Burdův tým také zkouší, . „Děláme interní pokusy s Metrem, ale zatím nevíme, co se z toho vyvine. Je možné, že se velice brzy po vydání Windows 8 objeví nějaké aplikace Centra pro tento systém.“
O chytré mozky, které na těchto věcech dokáží pracovat, je podle technického šéfa Centra boj. Přesto věří, že právě tato firma stále má i v konkurenci jiných hráčů co nabídnout. „Centrum je pořád ještě relativně malá firma a je tu trochu jiný pracovní režim a nejsme korporace. Na druhou stranu oproti startupům nabízíme to, že naše služby využívají miliony lidí měsíčně. A to je pro vývojáře často velice zajímavé,“ popisuje a dodává, že Centrum je „často cool alternativa k Seznamu, který už dosáhl obrovských rozměrů.“
Zaměstnanci mimo jiné dostávají prostor pracovat na svých vlastních nových projektech a jedna část serverů a výpočetní kapacity je vyhrazena pro jakési interní startupy. „Lidé a malé týmy tam pracují na věcech, které jim přijdou fajn,“ popisuje Burda. S těmito praktikami Centrum začalo před 2 lety a do ostrého nasazení se díky tomu dostal například projekt Crazy Café.
Centrum Holdings jemně navyšuje počty vývojářů, kteří umí pracovat jak na front-endu (JavaScript, PHP), tak na back-endu (jazyk C) a poptávka je také po kodérech.
„O Seznamu toho z technologického hlediska v posledních měsících bylo slyšet určitě více. To ale chceme změnit. Už teď spolupracujeme s ČVUT, Matfyzem nebo eClubem a angažovat se v komunitách budeme mnohem aktivněji,“ vzkazuje Burda.