Big Data neznamenají jen velký objem dat, který se exponenciálně zvyšuje. Ovlivňuje je jejich struktura, kontinuita i způsob, kterým vznikají. Pomocí moderních technologií (finančně dostupných velkokapacitních a bezpečných hardwarových zařízení i softwarových prostředků) je už můžeme relativně snadno zpracovávat, a to dokonce v reálném čase. Mnohem těžší ale je Big Data zanalyzovat a vytěžit, tedy byznysově využít. Pokud víme, jaký potenciál velká data ukrývají pro byznys, můžeme v nich objevit doslova zlatý důl, z něhož bude těžit jak firma, tak její zákazníci.

Přečtěte si rozhovor s Dagmar Bínovou, Big Data Science Leaderem Adastry, která v rozhovoru pro časopis IT Systems hovoří o významu velkých dat pro firmy i praktických příkladech jejich využití včetně návaznosti na technologie internetu věcí (Internet of Things, IoT).

 

Jak byste definovala big data? Co z nich dělá to „big“, a čím se tedy vlastně odlišují od jiných dat?

Pojem big data doslovně vysvětluje, že máme k dispozici hodně dat. To označení „hodně“ je ale v čase relativní, objemy dat v různých oblastech různými vlivy exponenciálně rostou. Proto je nutné definici big dat doplnit ještě o nějaká další specifika. Jedním z nich může být podmínka soustavného vzniku nových dat. Dalším specifikem může být, že tato data nemusí být strukturovaná (tj. nelze z nich okamžitě tvořit tabulky a grafy) a pro jejich další využití je většinou nutné s nimi provést nějaké transformace. A do třetice, big data vznikají na základě interakcí, jednak interakcí člověka s nějakým zařízením (např. klient platí platební kartou) nebo interakcí zařízení s jiným zařízením (telefon se pravidelně hlásí k mobilní síti).

Pokud to shrneme, nejčastěji se řeší úlohy, kdy nám data chodí v téměř reálném čase a jejich ukládáním můžeme tvořit bohatou sbírku reflektující vývoj a historii. 

S tím souvisí další otázky: Proč se podle vás o big datech teď tak mluví? Znamenají opravdu tak zásadní změnu v práci s informacemi v obchodě? Nejsou spíš trendovým výrazem? 

Oblast big dat se rozvíjí především díky tomu, že jsou konečně k dispozici finančně dostupná velkokapacitní a bezpečná hardwarová zařízení a k nim se vyvíjí softwarové prostředky. Tím, že se dají data relativně jednoduše zpracovávat téměř v reálném čase, a tím, že máme mnohem bohatší databáze, můžeme big data považovat za zlatý důl. V dnešní době je mnohem těžší data smysluplně využít, než je posbírat. Klíčové je vědět, k čemu nové informace z té obrovské hromady poslouží a čemu to může prospět. Právě odpovědi na tyto otázky jsou nejzásadnější a často s nimi musíme přijít my jako data scientisti.

Pro představu, jak se dá s big daty pracovat: Klient banky zaplatí převodem zájezd, což lze poznat v popisu příkazu, pokud ho klient samozřejmě zadá. Banka pak může takovému klientovi obratem nabídnout cestovní pojištění. Ačkoliv to vypadá velmi jednoduše a samozřejmě, banky dosud neměly nástroje, jak v téměř reálném čase takového klienta identifikovat, natož mu nabídnout relevantní službu.

Jaké zdroje velkých dat vlastně vaše společnost nejčastěji využívá? E-shopy, karetní platební transakce…? 

Máme celou řadu projektů, které bohužel nemůžeme zveřejňovat, inovace patří mezi obchodní tajemství. Co lze veřejně uvést, je, že ve financích pracujeme s transakcemi, v telekomunikacích se signálními daty, na webu se záznamy o pohybech na stránkách, v obchodě a ve výrobě se senzorickými daty, napříč odvětvími s logovými daty z aplikací. 

Jak se v současnosti využívají big data v retailu? Jak s nimi obchodníci a dodavatelé pracují? 

Viditelný úspěch zaznamenávají big data v oblasti e-commerce. Z chování zákazníka v e-shopu, např. o čase, způsobu a rychlosti nakupování, lze vyvodit spoustu zajímavých vzorů chování zákazníka, které lze využít pro vylepšení procesu prodeje a obsluhy. S postupným příchodem technologií IoT se chystají i změny v prodeji v kamenných obchodech. Díky čidlům a senzorům umístěným u zboží může prodejní personál získávat automatickou nápovědu nejvhodnější péče o zákazníka. Nápověda vznikne na základě okamžitého zpracování dat ze senzorů, porovnáním s historickými událostmi a na základě doporučení, které se spočítá modelem. Čili dopady big dat a IoT technologií do obchodu jsou zřejmé. 

Jaké jsou hlavní výhody využití velkých dat?

Pomocí big dat mohou firmy především lépe poznat své zákazníky a jejich chování. Tím, že big data tvoří nejen klasická čísla, ale i různé logy, transakce, signální data, senzorická data, texty, obrázky, hlasy či videa, tak je jejich využitelnost možná v každém odvětví. Například banky mohou schválit úvěr i člověku, který by jinak neprošel, pokud se z dat ukáže, že je spolehlivý a zodpovědný. 

Big data se dnes využívají i mimo obchod. Například v oblasti budování chytrých měst, kdy můžete na základě sběru dat vyhodnocovat, odkud a kam lidé jezdí. Můžete tedy upravit jízdní řády nebo silniční značení. Mobilní operátoři totiž vědí, kde se pohybují mobilní zařízení.

Nemusí to být jen data telefonních operátorů, ale třeba i data ze sociálních sítí, pokud zákazníci povolí bankám přístup k informacím, například za slevu na poplatcích. Výzkumy ukazují, že pokud zákazníci získají výhody, tak nevnímají sběr dat negativně a přístup povolí.

Říkáte, že například banky mohou schválit úvěr i člověku, který by jinak neprošel, pokud se z dat ukáže, že je spolehlivý a zodpovědný. Jaká data tedy máte na mysli, odkud je čerpáte? 

Tady se jedná o standardní využití transakčních dat v bance. Nové na tom je, že se nepracuje pouze s roční historií, ale třeba desetiletou, a dokážete klienta díky dlouholetému „pozorování“ vhodně zařadit do životního cyklu a pochopit jeho finanční chování. To, že klient je v určité době bez finančních prostředků a nevychází mu skóre pro úvěr, ještě neznamená, že je typický neplatič nebo člověk, který si neumí vydělat peníze a splácet. Momentální nepříznivá situace vs. dlouhodobá znalost stálého klienta, to je to, oč tu běží. A k tomu se tyto informace dají samozřejmě obohatit i o nějaké externí zdroje informací z různých registrů. 

Jaká jsou naopak úskalí v jejich využití?

Vše, co je výhodou, je zároveň i rizikem. Na jednu stranu lepší znalost zákazníka by měla např. bance umožnit zjednodušení obsluhy klienta díky vylepšeným procesům. Na druhou stranu je tu jisté reputační riziko, kterého se nesprávným nebo nevhodným využitím velkých dat může společnost dopustit. Proto je tu legislativa ohledně ochrany dat, která nutí společnosti k tomu, aby nakládaly se svými daty obezřetně a dodržovaly zákonné rámce.

Jisté úskalí přichází s big daty v tom, že společnosti musejí při jejich využití pozměnit IT infrastrukturu, proškolit nové specialisty a také se musí mentálně nastavit na změny v postupech, které s novými prvky a z nich plynoucími novými znalostmi přicházejí.

Můžete popsat nějakou konkrétní kampaň / marketingovou aktivitu, která byla postavena na využití velkých dat? 

Pro jednu banku jsme identifikovali zákazníky, kteří mají děti. Zároveň jsme zjistili, že v září mají největší výdaje, a tak jsme těmto skupinám zákazníků dokázali ve správný čas nabídnout vhodný úvěrový produkt. Akce byla 10× úspěšnější než při použití standardních postupů bez využití big dat.

Z jakých zdrojů informací jste vycházeli? A co těmi standardními postupy míníte? 

U této kampaně jsme vycházeli z dlouholetých popisků transakcí. Identifikaci rodiny s dětmi v bance dosud nikde v systémech řádně neměli a pro aktuálnost a pravdivost, že se jedná o rodinu s dětmi, jsme potřebovali celou řadu identifikovaných transakcí specifického typu. Pro nabídku úvěrového produktu se obvykle hledají jednodušší pravidla (např. výše zůstatku a kreditní limit). 

 

Zdroj:IT Systems, 03/2018

Na otázky odpovídala: Dagmar Bínová, Big Data Science Leader, Adastra