Máte pod kontrolou svá big data?

Ne? Keboola nabízí řešení Pavel Doležal je zkušený matador českého internetu a své rozsáhlé zkušenosti z internetových projektů nyní zužitkovává jako jeden ze tří managing partnerů firmy Keboola. Konkrétně je zodpovědný za EMEA obchod a marketing. Keboola nabízí sofistikovanou analýzu vytěžování informační hodnoty z firemních dat na českém i zahraničním trhu. Kromě integrace dat z různých zdrojů se firma proslavila pořádáním úspěšných datových festivalů v ČR i zahraničí. Poměrně malý tým Keboola zpracovává data i pro takové internetové giganty, jakými jsou Centrum Holdings, Seznam.cz nebo Slevomat.cz, ale také pro velké obchodníky a výrobce zvučných značek. Doby nákladných warehouse řešení jsou dávno pryč a díky cloudu lze pořídit rozbor dat od tisícovky dolarů měsíčně. Je to dobrá zpráva především pro střední firmy, které se nemusejí bát tučných faktur a mohou si dovolit řešení, které jim přinese okamžitou hodnotu. S Pavlem Doležalem jsem se sešla při příležitosti britsko-české Smart Data konference, která se konala v září v Impact Hubu v Praze a organizovalo ji Britské velvyslanectví. Hlavním tématem bylo, jak jinak, využívání chytrých dat a big data v UK a v ČR, nové technologie z toho plynoucí a výměna zkušeností mezi britskými a českými experty. Jak byste jednoduše popsal nabídku vašich služeb pro zájemce z řad managementu? Zkuste si představit manažersky kompetentního člověka bez hlubší znalosti IT. Kompetentní lidi nemusíte přesvědčovat. Pokud manažerům na firmě opravdu záleží, stačí se jich zeptat, jaké problémy je trápí, a nakonec zjistíte, že většina z nich v současné době řeší datové záležitosti. Vím to, protože spolupracujeme s různými firmami, ty průmyslové nevyjímaje. Uvedu například podnik čerpadla Vrchlabí. Velmi úspěšná česká firma s obratem několik desítek milionů ročně, jejíž management donedávna vedl veškerou obchodní dokumentaci na papíře. Hned na počátku jsem se zeptal ředitele firmy, který zaměstnává desítky opravářů, zda má přehled o jejich osobní ziskovosti. Komu se čerpadla vrací, jak často a další záležitosti. Jelikož firma chtěla zvýšit produktivitu práce, navrhl jsem řešení, které navzdory jejich očekávání nebylo nákladné. Naším typickým zákazníkem je středně velká firma, která má 25 různých datových zdrojů. Uvedu ještě jeden příklad, klienta, jehož hlavní produkcí jsou šroubky vyráběné na lince, kterou obsluhují stovky lidí s různou chybovostí. Do našeho systému jsme nahráli data o vstupu materiálu, provozu linky apod. a na konci analýzy bylo pomocí přesných údajů popsáno každé pracoviště. Zároveň jsme zdemokratizovali přístup k datům a všichni pracovníci měli možnost vidět výsledek svých kolegů. Nastalo benchmarkování, soutěž, porovnávání se, a protože nikdo nechtěl být poslední, konečným efektem bylo zvyšování kvality práce. Dalším inspirujícím příkladem z jiného ranku je obchod McPen, český velmi úspěšný obchodní řetězec s papírnickým zbožím, který eviduje obrovské množství položek. Aby to celé zafungovalo, bylo třeba napojit desítky zdrojů. Celá implementace stála několik set tisíc a byla hotová do několika měsíců. Díky tomu McPen v následujícím období realizoval 30% nárůst nákupního košíku. V druhém roce jsme u této firmy přidali ještě řízení skladových zásob a byl zjištěn jejich pokles téměř o 20 %. Rovněž jsme zdemokratizovali přístup k firemním datům, takže každá vedoucí provozovny si může zjišťovat, co potřebuje, a případně se podívat, jak si vedou ostatní pobočky a vzít si z toho ponaučení. Čili znovu, výsledkem procesu efektivní práce s daty je zvýšení produktivity a snížení nákladů. Kromě produktivity práce lze takto pracovat i s jinými údaji? Všeobecně známý fenomén dnešní doby je, že firmy utrácejí neadekvátní prostředky na akvizici zákazníků skrze různé kanály, od těch nejběžnějších, jako je tištěná reklama v denících a magazínech, až po digitální, jako jsou AdWord, Facebook, Linkedin apod. Většina majitelů však vůbec netuší, jaké jsou reálné náklady na jednoho přivedeného zákazníka a jaká byla atribuce na kanály. Nedokážou identifikovat, zda nový klient či zákazník přišel osloven reklamou, nebo nakonec jen běžnou referencí. Skupina těch modernějších majitelů firem dokáže vysedávat hodiny nad analýzami dat z SKliku, ale nejsou již schopni získaná data provázat s informací, jak se vůbec zákazníci dostali na jejich web, jak odebrali zboží, kolikrát objednali a jaký byl náklad na celkovou marketingovou kampaň. Nedokážou informace zpřesnit, zjemnit a využít je ku prospěchu a zkvalitnění dalších kampaní. My dokážeme za velmi malý honorář v horizontu jednoho měsíce roztřídit informace přes tzv. datová sila (expedice, prodej, cash flow) a předložit výsledný produkt ve formě tabulky (lze i v jiném formátu), z které je možné vyzobávat velmi přesná a konkrétní data na mnoha úrovních, která mě zajímají: Kdo mi dluží? Přes jaký kanál jsem tohoto konkrétního zákazníka získal? Jaké náklady jsem na jeho získání musel vynaložit? Kdo zboží vrací? Proč zboží vrací? V 60. letech se analýzou dat pro své prodeje jako první začal zabývat Wallmart a stálo ho to miliardy dolarů. Kvůli poptávce analýzy big data vznikly obří společnosti, například Teradata. Práce s big data na obvyklé úrovni vyžaduje velké množství na míru postaveného HW, a proto malým společnostem taková analýza dat není samozřejmě cenově dostupná. Vše se změnilo, když se začal využívat cloud. Jak je to s kompatibilitou systémů? Nemusí být ideální. Od toho jsme tu my a nejsložitější část celého procesu je data processing. U různých klientů pracujeme s různými systémy: Oracle, Fujitsu Siemens pro CNC stoje, BI Microsoft… Přijdete do kovoobráběcí firmy a mají tam Abru, přijdete jinam a tam používají Excel. Přijdete do té samé firmy v jiném městě a mají Abru, ale i Pohodu a k tomu ještě používají na docházku Excel, jinde k tomu stejnému účelu využívají Google Sheet. Keboola software jsme napsali tak, aby toto vše absorboval a „schroustal“. Finální nahlížení do výsledných dat může manažer uskutečňovat, jak je mu libo, v Excelu, v Good- Data, v Tableau, Power BI, CleverMaps. My datům dáváme lidsky pochopitelný kabátek a proces, který k tomu využíváme, je ETL – Extract-Transform-Load. Nic nového pod sluncem, pouze jsme s pomocí cloudu vše zpracovali novým způsobem. Neděláme nic nového, neobjevili jsme DNA, nevymysleli jsme, jak cestovat na Mars, ale bereme staré neefektivní věci a zjednodušujeme je. Používáme k tomu náš vlastní nástroj a tím je tzv. Keboola Connection. Na jakých technologiích je Keboola Connection založený? Je to architektonicky velmi zajímavá záležitost a vybudovali jsme ho jako lego. Petr Šimeček, původní zakladatel Kebooly, nechtěl postavit monolitický SW, ale vytvořil sadu malých SW jako komponent, které pracují jako trpaslíci a my je orchestrujeme pomocí dvou technologií. Jednou z nich jsou RESTová apíčka a druhá technologie, kterou jsme přidali před rokem, se jmenuje Docker – kontejner na SW. Princip vyměnitelnosti jsme ještě zdokonalili a nyní kterýkoliv z našich externích partnerů může dodat do systému jakýkoliv kousek svého SW. Náš systém si lze představit jako Rubikovu kostku. Na začátku máte rozdrobené kostičky, které představují datové zdroje. My jsme schopni kostičky zacvakat do sebe a v případě potřeby je rozpojovat a pozměňovat. Na programovací úrovni je to však nesmírně složité. A co bezpečnost dat? U některých velkých klientů existují samozřejmě obavy, co vše je v kódu Keboola skryto a jak to může ohrozit interní data. Například firmy, které mají SAP EDW (Enterprise Data Warehouse), nás nechtějí pustit za firewall. Takovým firmám předáme komponentu, kterou si do SAP nainstalují, a přes obrannou linii nám tato komponenta posílá jen konkrétní data, která potřebujeme. Kromě toho zdrojový kód komponenty si klient může pečlivě prohlédnout a zjistit, zda nebude v jejich systému dělat nějakou neplechu. Všechny kódy Keboola jsou totiž uložené v GitHubu, což je depozitář na software volně dostupný na internetu. Snažíme se o rychlost, otevřenost, transparentnost a serióznost, protože fungovat můžeme pouze v případě, že naši klienti vydělávají. Pakliže nedojde ke kýženému zlepšení, máme uvnitř systému Keboola Connection takové tlačítko – Data Takeout – a všechny klientovy kostičky se vysypou pryč. Máte ve svém oboru vůbec konkurenci? Naše konkurence je především nepřímá a jsou to velké globální společnosti, které do své propagace a akcí investují obrovské částky, což my dělat nechceme. Znamená to však, že musíme věci dělat jinak. Naprosto otevřeně, rychle a se super servisem pro zákazníky, protože jinak půjdou jinam. Mezi vašimi příznivci je všeobecně známo, že jste v Londýně zorganizovali již řadu úspěšných akcí. Anglie, a konkrétně Londýn, nás velice posunula. Na českém trhu máme velmi dobré postavení a spousta lidí nás zná, ale bylo načase pokročit dále. Založili jsme v Londýně pobočku a rozvíjíme zde komunitu. Pořádáme tam například takovou akci, která se jmenuje Data Fest, letos byla třídenní, a jejím účelem je seznámit lidi, jak získávat data z různých zdrojů. V rámci této akce proběhl tzv. DataGirls Weekend, který jsme organizovali ve spolupráci s Czechitas s paní Ditou Přikrylovou, a byla to demonstrace analýzy dat v přímém přenosu. Učit děvčata práci s daty je super, protože jsou velmi šikovná. Máte české zaměstnance i v zahraničí? Ano, spoustu. V Praze, Vancouveru, Singapuru, na Bali, ale i v Londýně. A nejlépe fungují mezinárodní týmy. Plánujete se ještě rozšířit? Já si myslím, že Británie a spol. nám budou zatím stačit. Řadu let jsme investovali do toho, aby se z Londýna stala naše technologická základna, protože spousta úspěšných firem z EMEA oblasti má centrálu právě v Londýně a my chceme být blízko zdroje. Já mám Británii rád a není to slepá láska. Britové jsou totiž úžasní obchodníci s profesionálními prezentačními schopnostmi a Anglie má čarovnou moc přitahovat schopné mozky; především v IT oblasti tam vznikají úžasné týmy. /Ivana Strasmajerová/

27. únor 2017, 06:00, Autor:

Sdílet na Facebook Sdílet na Twitter Tisk