Vzpomínáte na slova známé písničky „statistika nuda je“? Datová analýza věda je, má však pro firmu rovněž cenné údaje. Co všechno obnáší datová analýza a proč je důležitá pro efektivní fungování firmy?
Datová analýza je jako kouzlo, které přetvoří hromadu dat na cenné poklady. Datový analytik pátrá po tajemstvích skrytých v datech. Sbírá data z různých typů zdrojů, pracuje s nimi a analyzuje je. Zkoumá, jak se data chovají a hledá skryté vzory a trendy. Hledá odpovědi na otázky, které mohou pomoci manažerům lépe se rozhodnout, co dělat dál.
Aby zvládl splnit tak komplexní úkoly, potřebuje znalosti v oblasti statistiky, matematiky, programování a informačních technologií. A co je nejdůležitější – datový analytik nejen najde odpovědi, ale také je představí ve srozumitelných a snadno pochopitelných reportech, vizualizacích a přehledech. Pomáhá manažerům vidět, co se děje ve firmě a jaké kroky je třeba podniknout pro zlepšení jejího fungování.
Zásadním úkolem datové analýzy je vytěžit z dat maximální potenciál. Náš předchozí článek se hlouběji zabývá otázkou čím může datová analýza pomoci podniku. Nyní se podrobněji podíváme na typy datové analytiky a další základní pojmy.
Typy datové analytiky
Podle hloubky analýzy rozlišujeme několik hlavních typů analýzy dat:
- Nejjednodušší formou analytických metod je deskriptivní analýza, pod kterou spadají jednoduché statistické metody jako průměr, medián, modus a další. Zaměřuje se na popis současnosti a historických dat. Využívá se k rychlým přehledům a k datové vizualizaci, což jsou techniky, které tvoří převážnou část činností v BI aplikacích.
- Prediktivní analýza na základě dat vytváří předpovědi budoucích událostí. Používá se k odhalení trendů a vzorců v datech, díky čemuž předpovídá budoucí události. Prediktivní analýza je užitečná pro identifikaci obchodních příležitostí a minimalizaci rizik.
- Preskriptivní analýza navazuje na deskriptivní (popisnou) a prediktivní (předpovědní) analýzu. Zatímco deskriptivní analýza odpovídá na otázku, co se stalo, a prediktivní analýza odhaluje, co a kdy se stane, preskriptivní analýza určuje, i proč se to stane.
- Napomáhá při identifikaci budoucích rizik a příležitostí, ale zároveň poskytuje i doporučení. Dokáže neustále přijímat nová data, což umožňuje zpřesňování predikcí, přijímání lepších rozhodnutí a efektivňování procesů.
- Diagnostická analýza se používá k pochopení toho, proč se něco stalo. Hledá příčiny na základě poznatků zjištěných během deskriptivní analýzy. Může pomoci identifikovat problémy v procesu nebo systému.
- Explorativní (Explorační) analýza dat zahrnuje průzkum dat a tvorbu hypotéz, které stojí za to testovat.
Pojmy, se kterými pracuje datová analýza
Datová analýza zachycuje různé charakteristiky dat. Říká vám něco pojem míry centrální tendence? Známe je také jako míry střední hodnoty nebo míry polohy. Zachycují typickou hodnotu pro daný znak. Určují, kde je rozložen na číselné ose. Kouzlo i zrádnost spočívá právě v tom, že se jedná o jeden údaj.
Nejčastěji se používá modus, medián a aritmetický průměr. Méně častý je harmonický a geometrický průměr.
- Aritmetický průměr je statistická veličina, kterou vypočteme jako součet všech naměřených údajů vydělený jejich počtem.
V situacích, kdy je rozdělení hodnot asymetrické a logaritmická transformace jej opět vrací k symetrii, se místo s aritmetickým průměrem počítá s geometrickým průměrem. - Harmonický průměr kladných čísel je definován jako podíl počtu těchto čísel (rozsahu souboru) a součtu jejich převrácených hodnot. Jinými slovy jedná se o převrácenou hodnotu aritmetického průměru převrácených hodnot průměrovaných čísel.
Využívá se, pokud potřebujeme hodnotu, která zastupuje ostatní, co se týče převrácených hodnot, například při výpočtu průměrné rychlosti na úsecích stejné délky. Dále jsou-li hodnoty znaku nerovnoměrně rozložené kolem aritmetického průměru, nebo když jsou hodnoty extrémně nízké či vysoké.
Veškerý obsah v užitečném formátu. Rozhovory, články, life hacky a tipy ze světa businessu i korporátů na našem LinkedIn profilu.
Pojďte se připojit!
- Medián
Výpočet mediánu provedeme tak, že naměřené hodnoty seřadíme podle velikosti (od nejmenší po největší) a najdeme tu, která je rozdělí na dvě stejně početné poloviny.
Na rozdíl od aritmetického průměru je medián málo citlivý k odlehlým hodnotám, a proto se používá, pokud chceme eliminovat vliv extrémních hodnot. Je však vhodný jen pro data, která je možné podle velikosti uspořádat.
Praktický příklad: Průměrná mzda
Jedním z nejsledovanějších statistických ukazatelů je průměrná mzda. Menší pozornost je věnována mediánu mezd. Jaký je mezi oběma ukazateli rozdíl?
Problematice průměrné mzdy se věnuje Magazín Českého statistického úřadu. Začíná s průměrnou mzdou, protože při jejím výpočtu potřebujeme méně informací než v případě mediánu, což se týká obecně jakémkoliv průměru.
Častá představa, že průměr je zhruba uprostřed, je mylná. Průměr je výrazně ovlivněn, pokud jsou v podniku zaměstnanci, kteří pobírají buď extrémně nízkou, nebo extrémně vysokou mzdu.
Například: Pokud má podnik 5 zaměstnanců a celkové mzdové náklady činí 200 000 Kč, průměrná mzda je 40 000 Kč (200 děleno 5). V průměru dostal každý zaměstnanec 40 000 Kč.
Přesnější je v tomto případě medián: Jestliže má 1. technik mzdu 30 000 Kč, 2. technik 35 000 Kč, vrátný 15 000 Kč, ekonom 20 000 Kč a hlavní konstruktér dostává 100 000 Kč měsíčně, pak mediánem je mzda 1. technika (30 000 Kč), protože vzestupně máme mzdy srovnány takto: vrátný (15 000 Kč), ekonom (20 000), 1. technik (30 000), 2. technik (35 000), konstruktér (100 000). Takže mzdu menší než 1. technik mají dva zaměstnanci (vrátný a ekonom) a druzí dva zaměstnanci (2. technik a konstruktér) mají mzdu vyšší než 1. technik.
Medián je tedy 30 000 Kč, zatímco průměr, výrazně ovlivněný extrémně vysokou mzdou konstruktéra, je mnohem vyšší (40 000 Kč).
- Modus
Modus neboli modální hodnota ukazuje hodnotu, která se v datech vyskytuje nejčastěji. Pro výpočet modu si seřadíme data vzestupně a spočteme, kolikrát se každý skór objevuje. Skór, který se objevuje nejčastěji, je modus.
Modus může odhalit nehomogenitu výběru, např. rozdělení hodnot tělesné výšky může mít dva mody – pro muže a pro ženy. Modus tedy není užitečnou statistikou pro zobecňování ze vzorku populace – dá se očekávat, že různé vzorky populace budou mít různé mody.
Vhodné nástroje datové analýzy
Používáte Power BI k tomu, abyste vaší organizaci pomohli analyzovat data?
Podrobnosti o bezplatné aplikaci Power BI, která umožňuje připojit se k datům, transformovat je a vizualizovat, jsme pro vás sepsali už dříve. Microsoft v dalším článku vysvětluje, jak využít Excel při analýze dat.
Excel a Power BI umožňují praktické modelování dat pro metody statistiky a vytvoření vizualizace z modelovaných dat. Používají se také pro praktické modelování dat pro metody analýzy.
Datová analýza v praxi a procvičování a doplnění znalostí o práci s užitečnými nástroji vás čeká v našem online kurzu Datová analýza krok za krokem.
Datová analýza se vyplatí
Datová analýza si klade za cíl přeměnu nezpracovaných dat na užitečné informace, které firmě pomohou v dosahování obchodních cílů.
Stává se klíčovým nástrojem, který umožňuje firmám nacházet nové možnosti a činit informovaná rozhodnutí. Může přinést vaší firmě lepší porozumění zákazníkům a pochopení jejich potřeb, což umožňuje vytvořit cílenější marketingové kampaně.
Odhaluje oblasti, které umožňují zvýšení efektivity a snížení nákladů, což vede k optimalizaci firemních procesů. Poskytuje důležité informace, na základě kterých je možné lépe plánovat a rozhodovat se ve prospěch firmy.
Využíváte plně možnosti datové analytiky?