Zdroj: iStockphoto

10 trendů ve velkých datech aneb co nás čeká

HomepageTrendy & tipy 7 a více min čtení

Líbí se vám článek? Sdílejte ho:

Velká data vznikají třeba monitorováním pohybu zákazníků mobilních operátorů, vytvářejí je uživatelé webových stránek svým chováním a IoT zařízení svými hlášeními. To všichni víme. V nejbližší době nás ale ve využívání Big Dat čeká několik revolučních změn – třeba to, že se počítače samy naučí, jak je zpracovávat. Co bude jinak?

  1. Čím dál víc dat

Zejména rozvoj nejrůznějších IoT zařízení povede k tomu, že velkých dat bude k dispozici čím dál tím víc. Vypadá to, že každý měřič spotřeby vody, plynu nebo elektřiny bude brzy v pravidelných intervalech reportovat svůj stav, svou polohu budou hlásit i všechny železniční vagony nebo kamiony. Pozadu nezůstanou ani parkovací místa nebo včelí úly. Snad každá představitelná oblast lidské činnosti může být doplněna o smysluplný IoT aspekt. To ale zákonitě vygeneruje nepředstavitelné objemy dat. Chopí se jich někdo a využije v analýze, nebo zůstanou navždy ležet ladem?

  1. Vyšší rychlost zpracování

Analýza velkých datových objemů vyžaduje dostatečný výpočetní výkon a i tak zabere hodně času. Vývojáři na všech důležitých platformách se proto snaží vymyslet, jak razantně zrychlit současné metody analýzy velkých dat, aby je bylo možné využívat snadněji a hlavně častěji. Podpora pro velká data se postupně objevuje také v klasických a široce používaných SQL databázích. Výrazně to usnadňuje integraci do běžných firemních systémů. A to je pro firmy zlatý důl úspor – materiálu, času, peněz. Obě tyto změny povedou k tomu, že firmy začnou pracovat s velkými daty mnohem častěji a mnohem přirozeněji. Nebudou rozlišovat data podle toho, zda je získaly ručně či automaticky, zda je jich málo nebo hodně, ale výhradně podle toho, co z nich mohou vytěžit.

Související článek

  1. Stroje se učí

Slibně vypadá v souvislosti s big daty i strojové učení. Metoda deep learning totiž funguje tak, že se umělé inteligenci předloží velké množství dat – obrázky, texty nebo zkrátka čísla. Stroj pak sám analyzuje, jaké se nachází v datech vzorce a co z nich dokáže vyvodit. V poslední době se deep learning ukázal například v podobě programu AlphaGo Zero, který se pouze na základě pravidel, bez studia cizích partií naučil hrát Go lépe než jakýkoli člověk. Nebo v robotu Atlas, který nejenže dokáže chodit po dvou končetinách, ale umí i skočit salto.

Podobně se předpokládá, že využitelnosti velkých dat napomohou různé interaktivní konverzační automaty, jaké známe třeba z hlasových asistentek v mobilních telefonech. K analýze velkých dat už nebudete muset ovládat programovací jazyk, hlasová asistentka si s vámi “pokecá” běžnou řečí a podle vašich pokynů bude postupně upřesňovat analýzu tak, abyste společně dospěli ke kýženému výsledku. 

  1. Data analyzujte v samoobsluze

S bodem tři souvisí i rozvoj nástrojů pro „amatérskou“ analýzu velkých dat. V současné době si s různorodostí a rozsáhlostí velkých dat lámou hlavu profesionální analytici. Data je potřeba pro analýzu připravit, vyřadit různé problémové případy, změnit formáty a způsoby kódování a podobně. Prostě to stojí spoustu času a peněz. Očekává se, že v budoucnu tato práce proběhne již na začátku celého procesu, ideálně přímo při vzniku velkých dat. Uživatelé bez hlubších statistických znalostí, například běžní manažeři, si pak budou moci s velkými daty pohrát bez asistence rozsáhlého týmu statistiků. Analytici také předpokládají, že vzniknou velké katalogy metadat (popisů dat), které umožní snadno do analýz zapojit i data, o nichž v podstatě nic moc nevíme, jelikož nevznikla uvnitř naší firmy.

  1. Big data uvidíme všude kolem nás

S koláčovými grafy nebo kontingenčními tabulkami už v případě velkých dat úplně nevystačíte. Doba notně pokročila a pomalu se začínáme blížit vizím ze sci-fi filmu Minority Report, kde Tom Cruise elegantně prohazoval různé informace v 3D prostoru. Brýle pro virtuální realitu už jsou relativně běžnou věcí, s nejrůznějšími variantami rozšířené reality experimentují výrobci již drahnou dobu. Informace získané analýzou velkých dat tak v nejbližší době uvidíme doslova všude kolem sebe. Jaké to s sebou přinese možnosti, to ukáže až čas.

  1. Všechno půjde do cloudu

I když velké firmy zpracovávají v cloudu zatím jen asi 20 % své agendy, lze předpokládat, že tento trend bude v budoucnu posilovat. A velká data, která zatím neexistují a nejsou pro ně zpracované žádné firemní procesy, jsou žhavým kandidátem na to, aby šla do cloudu rovnou. Cloud v tomto případě nemusí sloužit jen jako úložiště, může nabízet také analytické nástroje nebo různé metody strojového učení. Lze totiž předpokládat, že ne všichni uživatelé budou chtít provádět analýzu velkých dat v jednom okamžiku. Proto je zbytečné, aby investovali spoustu peněz do IT. Lepší bude si výpočetní výkon pronajímat od poskytovatele cloudových služeb podle toho, jak je zrovna potřeba.

  1. Zaprášená data opět na scénu

Jakmile budou k dispozici snadno dostupné nástroje pro automatickou analýzu například textových dokumentů, vzroste tlak na využití informací, které se ve firmách válejí v papírové podobě v zaprášených archivech. Analytici proto očekávají masivní digitalizaci faktur, účetnictví, dopisů, fotek a jiných informací, jejich uložení do cloudu či jiného místa a zapojení do analýzy velkých dat. Nasazení nových metod na již dávno zapomenutá a nevytěžená data může přinést řadu nečekaných zjištění. Třeba kolik firmě kde dlouhodobě utíká peněz. 

  1. Bude se zvyšovat zabezpečení dat

Vznik chytrých dat a jejich ukládání s sebou nese řadu bezpečnostních otázek. Jsou data dostatečně anonymizovaná, abychom se nedostali do rozporu se stále se zpřísňující legislativou na ochranu osobních údajů? Chceme nechat cenná big data volně dostupná pro kohokoli, nebo musíme zapracovat na jejich dokonalém zabezpečení? Můžeme si dovolit ukládat data do anonymního cloudu někde v internetu, nebo si musíme připlatit za bezpečné datové centrum nacházející se na území Evropské unie?

Na druhou stranu lze velká data využít ke zlepšení bezpečnosti jiných dat. Co jiného jsou totiž logy z firemního firewallu než big data, která je možno analyzovat, a podle výsledků analýzy upravovat bezpečnostní pravidla? Dalšími příklady velkých dat využitelných ke zvýšení bezpečnosti je chování uživatelů ve firemní síti, využívání sdílených tiskáren a podobně.

  1. Distribuované zpracování „po cestě“

Dalším trendem, který možná změní vnímání velkých dat jako takových, je jejich částečné zpracování po cestě z místa vzniku do úložiště. Představme si elektroměr vybavený IoT zařízením. To odesílá aktuální stav do domovní centrály, která většinu času výpočetně zahálí. Z ní jednou za čas odejdou data na server elektrorozvodných závodů, pravděpodobně ještě přes několik dalších prvků – místní a regionální centrály. Proč by tyto prvky, které se nacházejí blízko místa vzniku informací, a které mají „pod sebou“ relativně málo naměřených dat, nemohly provádět nějakou jednoduchou analýzu a reportovat do vyšších úrovní už rovnou dílčí výsledky? Vždyť podobně probíhá například sčítání volebních výsledků, kdy samotné počítání hlasů probíhá v rámci jednotlivých okrsků a do vyšších úrovní jdou již hotové součty. Nestane se tak, že by krajská volební komise musela jednorázově sčítat milion volebních hlasů.

  1. Analýza, která předvídá

Původně bylo možné analyzovat data jen zpětně, dlouho poté, co došlo k nějaké události. Zvyšováním výpočetního výkonu a přenosových kapacit internetových přípojek jsme se na časové ose posunuli do analýzy v reálném čase. V okamžiku, kdy elektroměr odešle informaci o stavu, může analytik vidět, jaká je aktuální spotřeba ve všech místech republiky, a kde došlo k jakému nárůstu. Díky výše popsaným trendům, zejména analýze dat po cestě a strojovému učení, bude brzy možné provádět analýzu ještě před tím, než k události dojde. V popsaném případě elektroměru tak operátor nejen uvidí, jaká je aktuální spotřeba, ale bude moci i odhadnout, jak se bude spotřeba vyvíjet v nejbližší době.

Zdroje: Tableau.com, Datafloq.com, Techrepublic.com,

Líbí se vám článek? Sdílejte ho:
link odkaz
Reklama