redakce

Český statistický úřad zahazuje dotazníky. Budoucnost patří big datům!

Stát chytřetéma 4 min čtení

Líbí se vám článek? Sdílejte ho:

Český statistický úřad zavedl revoluční novinku. Od obchodních řetězců začal  ve velkém sbírat takzvaná big data. Získá tím obrovské množství užitečných dat, aniž by přitom vyplňováním dotazníků obtěžoval domácnosti a firmy. Budoucnost statistiky je i ve spolupráci s mobilními operátory a automatické analýze družicových snímků.

Představa statistika, který s papírovým dotazníkem obíhá byty, už je trochu zastaralá. Velká část dat, kterou Český statistický úřad získává, se totiž sbírá automaticky. „Než abychom obtěžovali firmy a domácnosti statistickými výkazy, snažíme se vždy využívat jiných zdrojů – například administrativních dat. Jde o údaje, které už má veřejná správa k dispozici v různých databázích, hlavně v těch ministerských,“ vysvětluje Marek Rojíček, nový předseda Českého statistického úřadu.

Aktuálně je v testovacím provozu cenový skener, který automaticky sleduje ceny ve dvou obchodních řetězcích. Statistici tak mají přesný přehled, kolik co stojí, co zákazníci obvykle nakupují a kolik za to utratí. Na první pohled se to nezdá jako velký pokrok, ale je potřeba si uvědomit, že až dosud se průměrné ceny stanovovaly pomocí uměle vytvořených spotřebních košů, které mohly, ale také nemusely odpovídat realitě. Těžko se do výsledků započítávaly časté slevové akce.

ČSÚ zatím sbírá data, fungování projektu vyhodnocuje a intenzivně vyjednává o spolupráci s dalšími obchodními řetězci. Nejpozději během příštího roku by měl skener fungovat v ostrém provozu. Konečně tak uvidíme, jak se vyvíjejí ceny různých druhů zboží, a to i s ohledem na letákové slevy a sezónní výkyvy cen například u ovoce a zeleniny.

Začátek těžký, budoucnost zářivá

„Big data nemůžeme ignorovat, musíme se učit, jak s nimi efektivně pracovat, byť to mnohdy vyžaduje vyšší nároky na kvalifikované zaměstnance, technické zabezpečení sběru a jejich vyhodnocování. Postupně se však tato zátěž výrazně snižuje s tím, jak nové procesy přecházejí do běžné praxe a jak se automatizují,“ vysvětluje Marek Rojíček.

Na ČSÚ tento přístup klade podobné nároky jako na všechny firmy, které přecházejí na Průmysl 4.0. Místo velkého množství relativně nekvalifikovaných tazatelů, kteří obíhají republiku s dotazníky, využívá menší počet špičkově kvalifikovaných programátorů a analytiků. O hrubou rutinní práci se postarají počítače.

Související článek

Filip Marek z T-Mobile: Analýzu na základě big dat zpracujeme do týdne

Big data. Výraz, který se objevuje stále častěji. Jenže většina lidí pořád tápe v tom, co si pod ním má představit. Obcím mohou sloužit k lepšímu plánování dopravy, pořadatelům kulturních akcí k jejich plánování a organizaci, provozovatelům internetových obchodů k vytvoření efektivnější nabídky – alespoň podle Filipa Marka, který s nimi každodenně pracuje v T-Mobile. To je ale jen špička ledovce.

I když to zatím ČSÚ přímo neplánuje, do budoucna by bylo možné uvažovat o využití dat mobilních operátorů. Statistici by tak získali data, podle kterých by měli celkem detailní přehled o tom, jak se lidé na území Česka pohybují. Mezi další možnosti patří měření podílu zemědělské půdy z pravidelně vytvářených satelitních snímků i analýza spotřeby vody, plynu a elektrické energie podle informací, které statistikům předají dálkově odečitatelná IoT měřidla.

Úplně nová statistika

Statistici tak poprvé v historii mají na dosah téměř všechna data, na která si pomyslí. Zatímco u klasických dotazníkových šetření obvykle třetina až polovina lidí neodpoví, u chytrého vodoměru připojeného na internet se to nestane. Odmítavé odpovědi lidí se navíc samozřejmě projevují na kvalitě výsledků – čím více chybějících odpovědí, tím horší odhady. Stejně tak je problém vybrat lidi, kterým dotazník předložíte tak, aby výběr co nejvíc odpovídal realitě. To všechno ale s příchodem big dat odpadá. „Použití big dat přináší v mnoha statistických ohledech novou kvalitu zjišťovaných údajů,“ pochvaluje si Rojíček.

Prozatím chce ČSÚ využívat data k vlastním analýzám, ale plánuje i jejich poskytnutí odborné veřejnosti. „Uvažujeme o vybudování takzvaného Safe centra, které by akademikům umožnilo přístup k mikrodatům pro účely analýz,“ potvrdil předseda ČSÚ. Data by pak byla uložena v cloudu ČSÚ a zájemci by prováděli své analýzy na dálku. Pokud se vyřeší problém s ochranou osobních údajů a anonymizací dat, mohli by analytici dostat i celé datové soubory.

Evropský statistický úřad Eurostat, který obvykle shrnuje výsledky statistických šetření ze všech členských států EU, zatím vlastní databáze big dat nemá. Rozhodně ale podporuje jednotlivé národní statistické úřady, aby testovaly, jaké možnosti big data v jejich zemi přinášejí. „Národní zkušenosti pravidelně probíráme s ostatními kolegy na mezinárodních setkáních. Není proto vyloučené, bychom se v budoucnu dočkali srovnání big dat na mezinárodní úrovni. V big datech je zkrátka budoucnost statistiky,“ uzavírá Marek Rojíček.

 

Témata:
Líbí se vám článek? Sdílejte ho:
link odkaz
Reklama