DataRestart 2016

V pátek 22. dubna se v prostorách konferenčního centra City v Praze na Pankráci uskutečnila v pořadí již druhá konference DataRestart se zaměřením na data a datovou analytiku. Tématem číslo jedna byla efektivita využití získaných dat z webů, aplikací i informačních systémů.

Analytické nástroje v DoubleClicku (David Špinar)

David Špinar z Google představil, jaké informace nám o uživatelích poskytuje systém DoubleClick. V mnohém předčí i Analytics. DoubleClick není jen jeden nástroj, ale obsahuje více dalších komponent – DoubleClick Search, DoubleClick Campaign Manager, DoubleClick Studia a DoubleClick Bid Manager. DoubleClick propojuje možnosti a výhody AdServeru s nástrojem pro webovou analytiku – např. sledování celé uživatelovy cesty před návštěvou našeho webu s chováním na našich stránkách, zahrnuje do konverzní cesty všechny důležité zdroje provozu a touch pointy včetně prokliků, impresí a zhlédnutí. David Špinar kladl důraz především na možnosti vyhodnocení konverzí po zhlédnutí, zaměření pouze na viditelné imprese či měření cross-device přechodu uživatelů, např. Desktop to mobile, Mobile web to Mobile app, Cross browser a Tablet to mobile. Cross device měření probíhá na základě změření přechodů na vzorku uživatelů, kteří jsou přihlášení do Google účtu a následně jsou extrapolací dopočítána cross device data i pro nepřihlášené uživatele. Integrace nástrojů pro display a search pod DoubleClick Campaign Manager pomáhá vyřešit problém s duplikací jednotlivých konverzí.

Produktové kampaně vs. analytika (Adam Šilhan)

Produktovými kampaněmi může být produktová inzerce ve zbožácích, ve vyhledávání i na sociálních sítích. Jenže s produktovými kampaněmi je úzce spjata otázka, zda se nám vůbec vyplatí na konkrétní produkt inzerovat. Odpovědět můžeme různě, záleží na našem přístupu. Nejčastěji rozlišujeme:

  • Účelový. Maximalizace zisku, případně tržeb. Nástroje pro účelový bidding: Beed, BiddingTools, Heureka Magic Script.
  • Principiální. Maržovost/skladovost/sezónnost/cenová konkurenceschopnost. Nutnost využití custom labelů pro rozlišení produktových skupin

Customer LifeTime Value v digitálním marketingu (Pavel Jašek)

Že jedinou konverzí vše nekončí, dokázal na svých modelech Pavel Jašek z Google. Zákazník nám totiž může přinést výrazně více než jen zisk z jediné objednávky.  Ovšem záleží na tom, jak dobře s ním dokážeme pracovat.

Aktuální CLV (tedy Customer LifeTime Value) jednoho zákazníka je vždy konkrétní číslo, které se v závislosti na čase v důsledku (ne)činnosti zákazníka mění, proto je nutné jej v pravidelných intervalech aktualizovat. Hrubý odhad nám může poskytnout i zjednodušená CLV kalkulačka dostupná online – http://life-time-value.appspot.com.

Základy strojového učení (Michal Illich)

Se strojovým učením se setkáváme takřka denně na internetu i mimo něj. Například Google, Seznam a další vyhledávají na základě informací, které se učí o obsahu jednotlivých webů. Vyhledávače se dále učí, jaké reklamy jsou pro dané uživatele v rámci PPC relevantní. E-mailový klient se učí, které e-maily má vyhodnotit jako nevyžádané.

Jenže jak toho můžeme využít my?

  • Skladovost. Minimalizace ceny skladovaného zboží při maximalizaci prodejů.
  • Cenotvorba. Stanovení marží za účelem maximalizace celkového zisku.
  • Parametry zboží. Model se může učit o zboží, které nabízíme na základě dat z jiných e-shopů nebo webů. Takto získané informace lze automatizovaně doplnit na náš e-shop.
  • Doporučování. Zákazník si koupil X, jaká Y mu nabídnout?

Výhody strojového učení jsou zjevné. Můžeme analyzovat obrovská data, určovat matematicky koeficienty, vybírat nejvhodnější vstupy a hlavně vše probíhá automaticky. Robot to udělá efektivně. Člověk tak zůstává v roli dohledu/učitele.

5 tipů pro agentury, kterak ošidit své klienty (Jan Tichý)

  1. Nažeňte si KPI přes brand. Od uživatelů, kteří vyhledávají brandové dotazy, lze očekávat výrazně lepší výsledky než od generických kampaní. Brandové dotazy totiž leží na konci nákupního procesu, zatímco generické na začátku.
  2. Ignorujte storna a agenturní fee. Pro úplný obraz nákladů inzerce musíme brát v potaz i agenturní fee, případně dělat zpětné korekce na základě storna objednávek. Tyto dva prvky mohou finální výsledky výrazně ovlivnit.
  3. Držte své klienty v klinči. Klient by měl mít vždy přístup ke svým účtům v inzertních systémech. Když se klient rozhodne od agentury odejít, měl by mít možnost si své účty vzít.
  4. Nedávejte užitečný reporting. V každém období se vždy najde nějaká metrika, která „roste“. Když agentura klientovi vypíchne pouze metriky, které se za sledované období „povedly“, pak nemá žádné objektivní srovnání s předchozími obdobími.
  5. Zneužívejte atribuční modely. Reporting z jednotlivých inzertních systémů bývá zkreslený, protože konverze se mohou duplikovat. Reportovat by se mělo ze systémů, které mají přehled o celé cestě k objednávce, např. Google Analytics.

Prediktivní analytika pro rok 2020 (Jan Matoušek)

Prediktivní analytika je disciplína, která pomáhá odhadnout chování zákazníka. V e-commerce za pomoci prediktivní analytiky můžeme předvídat, co zákazník potřebuje, jaké má potřeby, jaké má důvody k nákupu, jestli má špatné úmysly, jaká je pravděpodobnost nákupu a další. Základem predikce je model. Modelem je obvykle algoritmus, který se učí na základě historických dat o chování uživatelů na e-shopu.

Jaké trendy v pokročilé analytice můžeme do roku 2020 očekávat?

  • Open Source software bude v dominantním postavení
  • umělá inteligence na tahu
  • rozpoznání řeči, obličejů a lidí jako komodita; funkce lidského mozku budou dostupné ke koupi v počítačové podobě
  • Konec spamu? Válka robotů! V okamžiku, kdy nás budou systémy umět dokonale identifikovat, budou nám moci zasílat poštu přímo na míru. Hromadná pošta upadne, každý mail totiž bude jiný, personalizovaný.

Clever Analytics – Zákazníci a „nezákazníci“, kde jsou? (Ondřej Tomas)

Clever Analytics propojuje dostupná open-source data s interními daty klienta. Takto propojená data následně promítne do map. Mapy je možné analyzovat od regionální úrovně až po mezinárodní. Z jednotlivých úrovní můžeme vyčíst například koncentraci zákazníků, potenciál, tržní podíl, přehled kamenné konkurence, zvyky klientů, hodnotu zákazníků a další.

Kromě hledání souvislostí mezi informací o našich zákaznících a jejich geografické lokalitě může nástroj sloužit k plánování i vyhodnocování on-line, ale i off-line kampaní. Získaná data totiž lze relativně snadno využít pro predikční model chování zákazníků v daných lokalitách.

Customer User Scoring pro remarketing (Pavel Brecík)

Myšlenka spočívá v  tzv. ohodnocování návštěvníků stránek body. Body jsou přidělovány za různé aktivity na webu. Uživatelé s více body mají pro nás větší hodnotu, takže má smysl cílit na ně remarketingové kampaně intenzivněji. Počet bodů vyjadřuje číslo uložené do cookies uživatele. Bodování probíhá na základě skriptu, který lze relativně snadno nasadit za pomoci Google Tag Manageru. Body jsou přiděleny vždy na základě splnění některé ze sedmi uvedených událostí. Počet bodů za každou událost se může lišit.

  1. Zdroj prvotní návštěvy. Odkud návštěvník pochází (geograficky + zdroj/médium)?
  2. Vstupní stránka. Přes kterou stránku návštěvník na náš web vstoupil?
  3. Zobrazené podstránky. Kolik a jakých podstránek webu si zobrazil?
  4. Scrolling na detailu produktu. Prohlédl si detailnější informace o produktu?
  5. Interní vyhledávání. Využil interního vyhledávání?
  6. Opakované návštěvy. Je u nás uživatel již po několikáté?
  7. Typ zařízení. Jaké zařízení má pro nás větší váhu?

Takto posbírané informace o počtu bodů pro jednotlivé uživatele můžeme využít v systémech, které umí s remarketingovými publiky pracovat jako Analytics, AdWords, Sklik, nebo Facebook Ads. Celý skript pro bodování uživatelů je dostupný zde: http://bit.do/h1cz.

Textová analytika pro marketing a sales (Petr Hamerník)

Internet je přehlcen informacemi. Jenže ne všechny jsou pravdivé, ne všechny jsou zajímavé… Jak ale z nestrukturalizovaných dat získat užitečné informace? Touto problematikou se zabývá textová analytika, tedy věda na pomezí informatiky a lingvistiky. V textech se skrývá nějaká hodnota, kterou potřebujeme extrahovat do zpracovatelné podoby.

Kde textovou analytiku můžeme uplatnit?

  • Obsahové štítky. Můžeme si je představit jako záložky webu, které pomáhají lépe utřídit jeho obsah. Vhodný obsahový štítek nám může pomoci vybrat právě textová analýza konkrétního textu. Využít lze například algoritmu TF-IDF.
  • Helpdesk/Chat. Textová analytika dokáže analyzovat jazyk a předmět dotazu zaslaného na helpdesk a dle zjištění jej přeposlat na vhodné oddělení. Kromě toho je možné detekovat náladu pisatele. Na základě nálady pisatele a hodnoty nákupů, které uskutečnil, můžeme upravit priority na pořadníku dotazů k řešení.
  • Reporting. Můžeme detekovat nejčastější nahlášené dotazy. V případě zvýšené četnosti dotazů na konkrétní problém mu přiřadíme vyšší prioritu tak, aby se vyřešil dříve.
  • Analýza komentářů. Za pomoci textové analytiky můžeme analyzovat komentáře uživatelů ke konkrétní službě nebo produktu (např. na Heurece). Na základě toho získáme přehledná data o jejich výhodách, ale i nedostatcích.

X problémů vašich dat (Martin Procházka)

V datech se totiž může vyskytnout X problémů, které musíme brát v potaz. Nejčastěji se jedná o následující:

  • Přesnost měření. Téměř nikdy se do měřicího systému nepodaří zaznamenat všechny objednávky tak, jak reálně proběhly.
  • Průměrná hodnota objednávky. Zajímavý úhel pohledu nám poskytnou statistiky průměrné hodnoty objednávky členěné na jednotlivé druhy zařízení. Můžeme pak zjistit, jaké hodnoty objednávek získáme off-line (např. na prodejně), z desktopu, z mobilu nebo z tabletu.
  • Storna objednávek. Ve snaze dosáhnout úplnosti dat nesmíme opomenout storna objednávek, případně reklamace. V tomto případě nebyl generován zisk a je potřeba to do statistik promítnout.
  • Opakované nákupy. Ve většině případů nakoupí uživatel na e-shopu pouze jednou (jedná se o cca 85 %), druhou objednávku provede asi 15 % uživatelů, třetí 5 %. S počtem objednávek procentuální podíl klesá.
  • Mobilní nakupování. Optimalizace pro mobilní telefony je velkým trendem. Než se do těchto optimalizací pustíme, podívejme se, zda to má v našem segmentu smysl. Určitý náhled na problematiku poskytne podíl zobrazení na mobilních zařízeních a podíl objednávek na mobilních zařízeních.
  • Náklady na kampaně. Do kampaňových nákladů patří kromě kreditu v inzertních systémech i agenturní marže, pronájem doplňkových nástrojů a další služby. Všechny tyto aspekty je nutno do výsledných statistik promítnout.

Podívejte se do karet ostatním hráčům e-commerce (Honza Mayer)

„E-commerce je jako StarWars, sice není jasné, kdo vyhrává, ale jisté je, že je plný zelených ufonů“. Touto narážkou na progresivní marketing Alzy začal svou přednášku Honza Mayer, který stojí za zrodem projektu TrendLucid.

Jenže proti komu doopravdy stojíme? Pojďme si o nich zjistit něco více. Pokud má obchod implementovanou službu „Ověřeno zákazníky“ od Heureky, můžeme relativně snadno zjistit odhad počtu prodejů. Heureka totiž po každém prodeji rozesílá dotazník, na základě kterého můžeme udělit obchodu recenzi. Prvním vodítkem je tak počet recenzí na Heurece.

Jiný úhel pohledu na konkurenci nám poskytnou nástroje SimilarWeb a JumpShot. Nástroje kromě mnohých dalších informací poskytují i odhad návštěvnosti konkurenčních webů. Analyzovat můžeme nejen konkurenční homepage, ale i jednotlivé podstránky (kategorie, produkty) a na základě toho zjistit, které konkrétní produkty jsou u konkurenta populární.

Autor: Marek Neufus, Tomáš Hanáček
Publikováno: 8.5.2016

Performics Newsletter