Za nepřesnost předvolebních průzkumů může marketing, říká David Slánský z KPMG

David Slánský

David Slánský Zdroj: KPMG

David Slánský
2 Fotogalerie
Filip Zelenka

Využití dat je v politice i ve firmách čím dál důležitější, jejich možnosti ale nejsou všemocné. „Kdyby data uměla vyřešit všechno, tak neexistují burzovní makléři a všichni jsme miliardáři," říká v rozhovoru pro deník E15 David Slánský, který se v KPMG věnuje využití dat ve firmách. KPMG se k tématu dat, stále více důležitější roli strojů v životech lidí a role člověka v dnešním světě věnuje v manifestu 121, ke kterému se přidal také deník E15. Nejdůležitějším článkem společnosti musí být člověk, stojí v manifestu. 

Co vám o člověku řekne více? Výpis z účtu, nebo to, co lajkuje na Facebooku? 

Prvoplánově bych řekl, že sociální sítě, ale záleží na profilu člověka. Explicitní chování u většiny populace lépe vyjádří výpis z účtu, na druhou stranu názory, zájmy a více „privátních“ informací najdete na sociálních sítích.

Věříte předvolebním průzkumům? 

Osobně je vnímám jako nástroj předvolebních kampaní. Obecně díky znalosti práci s daty nevěřím ničemu. Nechci tím říct, že lidé se vším manipulují, ale strašně moc pracujeme s chybovostí dat. Téměř neexistují správná data, ani ta strojově generovaná. I data z bankovních účtů, která jsou hodně kontrolovaná, mohou být někde nepřesná. Data mohou například chybět a pak je interpretace posunutá.

Předvolební výzkumy jsou z mého pohledu vždy nereprezentativní vzorek. Můžeme se přít, zda 1500 respondentů dává smysl, ale já si stále myslím, že neumíme zachytit lidi, kteří netuší, jestli půjdou volit. Pokud oslovíme náhodnou skupinu lidí, nemohu z definice náhodné skupiny garantovat rovnoměrnou reprezentaci celé voličské základny. Předvolební průzkumy beru s rezervou také proto, že lidé se v dnešní době nechají ovlivnit čistým marketingem bez reálného obsahu.

Video placeholder
Předvolební průzkumy v Česku • Zdroj: Videohub

Umí české strany pracovat s daty? 

Některé to umí výrazně lépe než ostatní. 

Je jich víc, které to umí? 

Podle pohledu člověka z venku většina stran pracuje s daty lépe než před čtyřmi lety. Nemyslím si, že jsou strany na stejné úrovni jako komerční organizace. Ale nemyslím si, že to je proto, že by neměly k dispozici chytré lidi. Myslím, že tam je velmi tenká hranice etiky. A chci věřit tomu, že tu hranici strany nepřekročily. 

Kdyby strany měly ty možnosti, které mají komerční subjekty, tak by byly efektivnější? 

Ano, efektivnější, invazivnější a více cílenější. 

Existuje nějaký příklad, jak by to vypadalo? 

Cambridge Analytica je typický příklad. Mohli by být schopni cílit na konkrétní osoby na sociálních sítích s konkrétním sdělením, a tak přímo ovlivňovat jejich názory a v důsledku i chování. Ale chci věřit, že to české strany nedělají. 

Cambridge Analytica byl tedy příklad, jak pracují komerční subjekty? 

Do jisté míry ano. Když s vámi komunikuje banka, může – na základě vašeho souhlasu – využít konkrétní osobní údaje a údaje o vašem chování, aby dokázala určit, co je pro vás nejvhodnější, a to vám následně cíleně nabídnout. Vyhrává tak každý – banka (prodá nový produkt) i klient (dostane zajímavou nabídku, když ji potřebuje). Proto osobně rád dávám podobným institucím souhlas k použití mých dat – když je použijí správně, nabízejí mi relevantní produkty/služby a neobtěžují mě něčím, co nechci. 

Do doby, než bylo GDPR, tak na sociálních sítích šlo cílit na konkrétní osobu s konkrétní nabídkou. To byl i případ skandálu firmy Cambridge Analytica, která byla nařčena z toho, že využívala osobní údaje konkrétních osob pro ovlivňování výsledků voleb. Kdyby se strany mohly podívat na profily na sociálních sítích, což už dnes naštěstí nemohou, a pracovali s analytikou na úrovni komerční firmy, tak by dokázali naprosto cíleně dostat zprávu ke konkrétní osobě a změnit její chování. Cílení zpráv nemá žádný jiný důvod, než změnu chování cílené osoby nebo skupiny – chcete, aby si něco koupila, něco udělala nebo naopak něco nedělala. 

Když se podíváme na nové nejúspěšnější firmy na světě, tak většina z nich má know-how právě v práci s daty. Co tuto „datovou revoluci“ spustilo? 

Nejsem si jistý, jestli tam byl nějaký konkrétní spouštěč, podle mě to spíše byla evoluce. Jako lidstvo máme limitovaný objem fyzických věcí, ať už to jsou nerostné suroviny, věci, které vyrábíme, nebo samotné kapacity výrobních linek. Proto si vytváříme hodnoty přes derivované věci a přes informace. Uveďme si příklad – mezi nejhodnotnější společnosti světa patří banky, které v dnešní době obhospodařují primárně data. Některé odhady říkají, že zhruba pouze deset až dvacet procent peněz na světě je fyzických, zbytek už je elektronických. Nebo kryptoměny – kromě jasného faktu, že se jedná pouze o data, i volatilita jejich hodnoty není nic jiného než hrátky s informacemi. 

Není to trochu děsivé? Že se svět odehrává z velké části ve virtuálním světě? 

Za mě určitě ano. Jako expert na data si říkám, že jsme se úplně zbláznili. Ve chvíli, kdy bude nedostatek elektřiny, tak jsme v háji. Je potřeba si uvědomit, jakým způsobem máme pracovat s informacemi a daty tak, abychom jako lidstvo byli schopni je využít rozumně a zároveň to nepřehánět. Finanční krize byla o tom, že pár lidí mělo nějaké informace, využili informační nerovnováhy k obohacení se a ve finále přivedli celý systém téměř k likvidaci. Blížíme se do dost podobného bodu. Příklad je opět v kryptoměnách – nemyslím si, že by byly něco špatného, ale cesta do pekla je dlážděná dobrými úmysly. Někdo měl skvělý nápad, že vystaví něco, co eliminuje nedostatky finančních trhů a mechanismů. Ale v okamžiku, kdy se toho chytili lidi, kteří na tom chtějí krátkodobě vydělávat, tak se dostáváme úplně někam jinam. 

Nejsem fanoušek přílišné regulace, například si rozhodně nemyslím, že by kryptoměny měly být regulované, naopak bychom měli být informačně co nejvíc demokratičtí a co nejvíc zavírat nůžky, co se rozevírají mezi lidmi, co mají a nemají přístup k informacím. Vždy se mluvilo o big datech, ale poslední dva roky slyším lidi mluvit spíše o small datech. Už si generujeme tolik dat, že musíme být schopni se zamýšlet nad tím, jestli jsme schopni je zpracovat a případně je negenerovat.

Říkáte, že data jsou nebezpečnější než oheň. Proč? 

Mohou způsobit jakoukoliv škodu. Zneužité osobní údaje mohou vést ke zničení kariéry a klidně k velkým psychickým problémům a sebevraždám. V tomto ohledu dává regulace a ochrana údajů smysl. Na druhou stranu si také můžeme za to, co sami o sobě kde říkáme, musíme si sami začít dávat pozor, jak s tím pracujeme. Proto je čím dál tím důležitější vychovávat společnost k datové gramotnosti. 

Stejně tak pokud jste komerční organizace, tak jediným hodnotícím hlediskem je vygenerovaný zisk, a jakákoliv informace, která může organizaci poškodit, jde proti tomu. Tedy v tomto případě to může být cokoliv od drobných finančních problémů firmy až po její likvidaci. Jako příklad můžeme brát Jumpshot a zavření této společnosti na základě práce s informacemi. 

Řídí naše životy data a algoritmy? Do jaké míry rozhodujeme o tom, co si koupíme? 

I když to možná neradi uslyšíme, tak ano. Pokud se vrátíme na začátek naší diskuse a k volbám, tak opět příklad – kolik z nás četlo volební program strany, kterou volí? Rozhodne menší polovina, jednotky procent lidí. Zbytek je marketing na základě využití dat. O tom, co si koupíme, se také rozhodujeme na základě dat. Ti uvědomělejší na základě doporučení, ale každý vidíme nějaké reklamy na sociálních sítích či kdekoliv jinde a cílení reklamy je čistá datová analytika. Volební marketing není nic jiného než práce s daty, které nejsou natolik osobní, jako u komerčních subjektů, ale stále zde jisté zaměření je. Troufnu si tvrdit, že dnes si z drtivé části si kupujeme věci na základě dat a algoritmů. Víte, co se nejvíce prodává v sobotu ve společném nákupu s plínkami? 

Pivo, nebo víno? 

Správně. A proč? Protože v sobotu je otec vyslán do obchodu pro plínky. A on si k tomu koupí alkohol. Proto obchody přeskládají zboží, aby pivo bylo vedle plen. Všechny možné kamery a algoritmy sledují, na co se koukáte a co berete do ruky a na základě toho upravují obchody rozložení zboží.

Jak se dá pomocí dat předvídat chování člověka? 

Relativně jednoduše a přesně, na základě dat, kterým říkáme signály chování. Opět příklad – můžeme klidně velmi přesně odhadnout, jestli člověk dodělá, či nedodělá vysokou školu. U některých to zvládneme předpovědět ještě dřív, než do školy nastoupí. Student, který se na dvě školy, na které se hlásil, nedostal, a proto šel na školu, která zbyla. Bydlel 200 kilometrů od té univerzity, ale klíčové bylo, že nastoupil až tři týdny po začátku. Takže prošvihnul všechny události na začátku semestru a po třech měsících odešel. Tedy už první den školy jsme dokázali říct, že je velká pravděpodobnost, že brzy odejde. To je krásný příklad, jak jsme na základě tří signálů dokázali předpovědět, že ten člověk odejde. Ale může být i úplně jiný příklad – u lidí, kteří přišli do Anglie studovat z Nigérie během ropné krize, se dalo celkem odhadnout, že při stoprocentní inflaci a devalvaci měny bude pro jejich rodiny těžké udržet je na studiích. Proto se vybralo několik procent nejlepších a nabídlo se jim stipendium, zbytek odjel zpět do Nigérie. 

Takových signálů jsou tisíce a dost vám pomohou, člověk ale nemá šanci vše sledovat. Od toho jsou tady nástroje, které to umí a hledají vzorce nebo anomálie. U všech podobných řešení je zde ale opět otázka etiky: Mohu sledovat studenta, abych mu pomohl dokončit školu? Mohu podobně sledovat zaměstnance a zajistit, aby neodešel z firmy a zlepšit mu kariéru? Mohu nabízet klientovi něco, o čem jsem přesvědčen, že by se mu to hodilo, ale on sám o tom třeba ani neví? Mohu to dělat jako stát s občany?

Stát má o nás velké množství dat, ale nemůže je spojovat. Kdyby to mohl dělat, pomohlo by to? 

Jde o využití a zneužití dat. Kvalita IT systémů a jejich bezpečnost v ČR je dle mého názoru na vysoké úrovni, bojíme se zneužití mnohem více, než bychom museli. Vždy samozřejmě hrozí riziko, ale musíme být schopni s ním pracovat a uvědomovat si, kde vlastně začíná. Někdo říká: „Je to nelegální a je to problém“. Já říkám, že problém začíná výrazně dřív, než se stane „nelegální“, a to již u neetického chování. V drtivě většině případů budu pracovat s daty dříve neeticky než nelegálně. 

Zkusím vás neunudit příklady, ale ještě jeden si dáme – v telekomunikacích přemýšleli o tom, že by bylo super spojovat anonymizované databáze pohybu mobilních telefonů. Opět to má obrovské množství pozitivních efektů – můžete plánovat umístění a služby benzinových stanic, rozmístění bankomatů, poboček jakékoliv společnosti. Ve Velké Británii tato služba komerčně běží. Když se o tom ale začali bavit telekomunikační operátoři v Německu, vznikl ve společnosti silný názor, že je to neetické a operátoři od této myšlenky raději odstoupili. 

Takže si myslím, že by státní správa mohla být výrazně efektivnější, kdyby používala data a analytici je využívali, myslím, že by to šlo, ale je potřeba vyřešit etické a legislativní otázky. 

Potom by nám například mohla ta data pomoci i v pandemii.

Jednoznačně. Existují otevřená data, hodnota trhu s otevřenými daty byla cca 1,5 miliardy eur v letech 2016 až 2020. Jinými slovy, nad otevřenými daty různých institucí a úřadů byl a je velký byznys. Firmy dokázaly z otevřených dat vytvořit služby, za které jsou organizace a lidé ochotni platit. Existuje studie, která říká, kolik peněz anglické ekonomice ušetří volně poskytovaná data Londýnského dopravního podniku. Jsou to desítky milionů liber ročně, existují kvantifikované výhody těch dat. To jsou další možnosti, co dělat s daty, které stát shromažďuje.

Mluvíme v době, kdy dochází k narušení dodavatelských řetězců a ceny energií rychle rostou. Dalo se to na základě dat předpokládat? 

Ano, všechno se dá předpokládat a jsou lidi, kteří to mají spočítané. 

Kteří na tom dokáží vydělat. 

No, je otázka, jestli to mohou použít. Kdyby data uměla vyřešit všechno, tak neexistují burzovní makléři a všichni jsme miliardáři. Strojové investování stále není jistější. Je to o přesnosti a odchylkách. Koneckonců stroje by nám měly dávat podklady k rozhodování, ale rozhodujeme se my. Je hrozně důležité, že datové analýzy mají být podklad pro lepší rozhodování. 

Což je obsah Manifestu 121, se kterým jste jako KPMG přišli. 

Přesně tak. Existují rozhodující procesy, ve kterých je stroj lepší a dělá méně chyb. Existuje hodně studií, že algoritmus rozhoduje lépe než doktor, respektive s menší chybovostí, ale to je právě to kouzlo. Kdysi jsme dělali projekt, který predikoval poptávku po zboží v určitém místě. A tři kluci z Čech dokázali být desetkrát přesnější než 60letí chlapi z Londýna, kteří se tím živili desítky let a predikovali na základě zkušeností. Jak je to možné? Protože stroj udělá menší průměrnou chybu. A tam se to vyplatilo, ale stejně to nebylo stoprocentní. 

Takže katastrofické scénáře, že v následujících letech přijde obrovské množství o práci kvůli automatizaci, jsou ještě daleko? 

Je to absolutní nesmysl. Jako lidstvo nejsme schopni pokrýt potřeby práce. Byl tady covid, báli jsme se vysoké nezaměstnanosti a stejně všichni mají problém s nedostatkem lidí. Všem chybí přesně znalostní pracovníci. Když se podíváme na doktory, právníky, manažery nebo bankéře, tak všichni si stěžují, že jich je nedostatek. Když někde zavedeme automatizaci nebo robotizaci, tak nám banka poděkuje, že jsme jim ušetřili deset lidí, protože jim místo přepisování dají zajímavější práci. Dělali jsme projekty, které ušetřily stovky pracovních míst, a nikdo ty lidi nevyhodil. Vždy se přesunuli jen na kvalitnější a kvalifikovanější práci. Nepamatuji si, že by jakákoliv firma propustila lidi na základě toho, že někdo nasadil datovou analytiku. 

Mluvíme o Česku, kde je tradičně nízká nezaměstnanost, ale když se podíváme na jih Evropy, tak tam je situace úplně jiná. 

Nemyslím si – díky své mezinárodní roli mluvím často s kolegy z regionu EMEA i z celého světa a všechny regiony mají stejné problémy, všichni říkají: nemáme lidi. Nedostatek lidí a snaha pomoci si stroji nezávisí na regionu, sektoru i rozvinutosti země. Takže za mě chytrá analytika vůbec neohrožuje lidi. 

Kam se to podle vás posune? 

Život se mění, ale ne výrazně. Data a analytika přinesou efekt jen ve chvíli, kdy jsou lidé schopni je využít. A to se stane jen ve chvíli, kdy to lidi sami akceptují a mají schopnost to dělat a používat. Je to plíživé, musíme se na to adaptovat. Poslední příklad: Jedna banka vyvinula super nástroj na cílení kampaní, bankéřům dala kontakty, na které mají volat. Oni obvolali procento. Nerozuměli tomu, nechtěli to dělat, nezajímalo je to. Banka se v okamžiku nasazení nástroje nezměnila. To se stalo až o několik let později, kdy se na to přišlo a udělalo se s tím něco.

Stejně tak autonomní auta nebudou jezdit do té chvíle, než to mentálně připustíme. Je to o schopnosti člověka akceptovat riziko. Stroj rozhoduje na základě informací, které má, ale nikdy nemá všechny. Člověk vždy bude mít širší kontext. A to buď proto, že se o to s tím strojem nepodělíme, anebo proto, že ten kontext přichází tak rychle, že mu to nestihneme předat. Rozhodovací činnost je kreativní a pořád si nejsem jistý, že by toho stroje byly schopny. Lidé jsou přirozeně opatrní, což je spojené s ochotou sdílet rizika. Nemyslím si, že jsme v revoluci, měníme se jen tak rychle, jak jsme schopni a ochotni to akceptovat. Ale měníme se a to je dobře.

David Slánský vede pražské KPMG Data & Analytics Centre of Excellence a je členem globálního týmu KPMG zaměřeného na datovou analytiku. Působí na Vysoké škole ekonomické v Praze a je autorem knihy Data a analytika pro 21. století. Často přednáší o datové analytice na akademických i profesních akcích.