Český statistický úřad zahazuje dotazníky. Budoucnost patří big datům!

Český statistický úřad zahazuje dotazníky. Budoucnost patří big datům!

Český statistický úřad zavedl revoluční novinku. Od obchodních řetězců začal  ve velkém sbírat takzvaná big data. Získá tím obrovské množství užitečných dat, aniž by přitom vyplňováním dotazníků obtěžoval domácnosti a firmy. Budoucnost statistiky je i ve spolupráci s mobilními operátory a automatické analýze družicových snímků.

Představa statistika, který s papírovým dotazníkem obíhá byty, už je trochu zastaralá. Velká část dat, kterou Český statistický úřad získává, se totiž sbírá automaticky. „Než abychom obtěžovali firmy a domácnosti statistickými výkazy, snažíme se vždy využívat jiných zdrojů – například administrativních dat. Jde o údaje, které už má veřejná správa k dispozici v různých databázích, hlavně v těch ministerských,“ vysvětluje Marek Rojíček, nový předseda Českého statistického úřadu.

Aktuálně je v testovacím provozu cenový skener, který automaticky sleduje ceny ve dvou obchodních řetězcích. Statistici tak mají přesný přehled, kolik co stojí, co zákazníci obvykle nakupují a kolik za to utratí. Na první pohled se to nezdá jako velký pokrok, ale je potřeba si uvědomit, že až dosud se průměrné ceny stanovovaly pomocí uměle vytvořených spotřebních košů, které mohly, ale také nemusely odpovídat realitě. Těžko se do výsledků započítávaly časté slevové akce.

Big data od operátorů

Big data nevyužívá jen Český statistický úřad, ale i firmy, města nebo veřejné instituce. Například v Brně pomocí big dat od mobilního operátora T-Mobile zjišťují, kdy do města přijíždějí lidé z okolních vesnic. A také jak se Brňané po městě pohybují. Město podle toho může například navrhovat fungování MHD, stavbu silnic  i  odstavných parkovišť. Další zákazníky má T-Mobile  i ze soukromé sféry.

Podle Filipa Marka, datového specialisty T-Mobile, je možné základní analýzy zpracovat během jednoho týdne. Například pro firmy, pořádající veletrh, může jít o informace typu odkud lidé přicházejí, kolik času na veletrhu tráví, z jakých částí republiky přijíždí a pokud veletrh navštívili ve více dnech, tak kde nocovali. 

ČSÚ zatím sbírá data, fungování projektu vyhodnocuje a intenzivně vyjednává o spolupráci s dalšími obchodními řetězci. Nejpozději během příštího roku by měl skener fungovat v ostrém provozu. Konečně tak uvidíme, jak se vyvíjejí ceny různých druhů zboží, a to i s ohledem na letákové slevy a sezónní výkyvy cen například u ovoce a zeleniny.

Začátek těžký, budoucnost zářivá

„Big data nemůžeme ignorovat, musíme se učit, jak s nimi efektivně pracovat, byť to mnohdy vyžaduje vyšší nároky na kvalifikované zaměstnance, technické zabezpečení sběru a jejich vyhodnocování. Postupně se však tato zátěž výrazně snižuje s tím, jak nové procesy přecházejí do běžné praxe a jak se automatizují,“ vysvětluje Marek Rojíček.

Na ČSÚ tento přístup klade podobné nároky jako na všechny firmy, které přecházejí na Průmysl 4.0. Místo velkého množství relativně nekvalifikovaných tazatelů, kteří obíhají republiku s dotazníky, využívá menší počet špičkově kvalifikovaných programátorů a analytiků. O hrubou rutinní práci se postarají počítače.

I když to zatím ČSÚ přímo neplánuje, do budoucna by bylo možné uvažovat o využití dat mobilních operátorů. Statistici by tak získali data, podle kterých by měli celkem detailní přehled o tom, jak se lidé na území Česka pohybují. Mezi další možnosti patří měření podílu zemědělské půdy z pravidelně vytvářených satelitních snímků i analýza spotřeby vody, plynu a elektrické energie podle informací, které statistikům předají dálkově odečitatelná IoT měřidla.

Úplně nová statistika

Marek Rojíček, předseda Českého statistického úřadu.
Zdroj: archiv redakce

Statistici tak poprvé v historii mají na dosah téměř všechna data, na která si pomyslí. Zatímco u klasických dotazníkových šetření obvykle třetina až polovina lidí neodpoví, u chytrého vodoměru připojeného na internet se to nestane. Odmítavé odpovědi lidí se navíc samozřejmě projevují na kvalitě výsledků – čím více chybějících odpovědí, tím horší odhady. Stejně tak je problém vybrat lidi, kterým dotazník předložíte tak, aby výběr co nejvíc odpovídal realitě. To všechno ale s příchodem big dat odpadá. „Použití big dat přináší v mnoha statistických ohledech novou kvalitu zjišťovaných údajů,“ pochvaluje si Rojíček.

Prozatím chce ČSÚ využívat data k vlastním analýzám, ale plánuje i jejich poskytnutí odborné veřejnosti. „Uvažujeme o vybudování takzvaného Safe centra, které by akademikům umožnilo přístup k mikrodatům pro účely analýz,“ potvrdil předseda ČSÚ. Data by pak byla uložena v cloudu ČSÚ a zájemci by prováděli své analýzy na dálku. Pokud se vyřeší problém s ochranou osobních údajů a anonymizací dat, mohli by analytici dostat i celé datové soubory.

Evropský statistický úřad Eurostat, který obvykle shrnuje výsledky statistických šetření ze všech členských států EU, zatím vlastní databáze big dat nemá. Rozhodně ale podporuje jednotlivé národní statistické úřady, aby testovaly, jaké možnosti big data v jejich zemi přinášejí. „Národní zkušenosti pravidelně probíráme s ostatními kolegy na mezinárodních setkáních. Není proto vyloučené, bychom se v budoucnu dočkali srovnání big dat na mezinárodní úrovni. V big datech je zkrátka budoucnost statistiky,“ uzavírá Marek Rojíček.

 

Mohlo by vás zajímat...

Sdílejte nás