Definice statistiky: 3 aplikace statistické analýzy
Nemusíte být statistik (matematik, který provádí statistickou analýzu), abyste měli prospěch z učení o této matematické disciplíně. Pokud vaše jediná zkušenost se statistickou teorií pocházela ze středoškolské matematické třídy, získáte spoustu výhod objevováním více o této podmnožině datové vědy. Zjistěte více o tomto odvětví matematiky a vytvořte si vlastní definici pracovní statistiky.
Definice statistiky
Statistika je obor matematické analýzy kombinující lineární algebru, počet zahrnující diferenciální rovnice, teorii pravděpodobnosti a další související disciplíny pro lepší pochopení dat. Funguje mimo premisu, že sběr dat v omezeném smyslu může být užitečný při shrnutí a předpovídání informací o mnohem širší populaci.
Co znamená statistika?
Etymologická definice statistiky pochází z latinského statisticus, což znamená studium a popis politiky. Do angličtiny se dostal nedávno z německého slova „statistik“, což znamená popis státu nebo země. Statistika má samozřejmě mnohem širší rozsah použití než politické průzkumy nebo vyhodnocování údajů o demografických údajích v jednotlivých zemích a státech.
Proč jsou statistiky důležité?
Oblast statistiky je jednou podmnožinou širší disciplíny známé jako aplikovaná matematika a skutečně má mnoho aplikací. Umožňuje odborníkům v oblasti výpočetní techniky, obchodníkům, odborníkům na společenské vědy a vládním úředníkům vyvodit závěry o celé populaci z menšího reprezentativního vzorku dat.
Vzhledem k tomu, že je téměř vždy nemožné získat data o celé populaci, přesné statistiky vám mohou poskytnout co nejpronikavější stupeň vhledu.
Jak zobrazujete statistická data?
Existuje několik způsobů, jak zobrazit rozptyl statistických dat. Sloupcové grafy, histogramy, koláčové grafy a bodové grafy jsou jen některé z metod pro ilustraci vaší vizuální analýzy dat. Kombinace tohoto druhu parametrické (a neparametrické) reprezentace se statistickými testy, jako je analýza chí-kvadrát, vám může pomoci lépe pochopit povahu dat před vámi.
Typy statistik
Existují dva základní typy statistik: deskriptivní a inferenční.
Popisné statistiky se zaměřují na zobrazení dat tak, jak jsou. Na experimentální design není kladen velký důraz, protože netestujete změny, ale poskytujete základní kritérium pro to, jak se věci již mají. Své popisné statistické údaje pak můžete použít jako sadu proměnných, se kterou můžete experimentovat.
Na druhé straně inferenční statistika se točí kolem testování spolehlivosti popisné statistiky a experimentování s daty. To může znamenat provedení určitých testů (jako je analýza rozptylu (ANOVA) nebo regresní analýza), abyste lépe pochopili statistickou významnost dat před vámi.
7 klíčových statistických prvků
Statistické modely vyžadují určité vstupy. Zde je sedm klíčových prvků, které budete potřebovat vědět, abyste mohli tuto matematickou teorii uvést do praxe:
1. Centrální tendence : V normálním rozdělení můžete očekávat širokou zvonovou křivku ve středu vašeho diagramu. Je to proto, že pravděpodobně existuje vzorový průměr (sbírka podobných datových bodů kolem průměru), který bude sloužit jako vaše hlavní tendence. Medián a modus jsou dvě další primární měřítka centrální tendence.
2. Hypotézy : V jakékoli formě statistického vyvozování se budete muset zapojit do testování hypotéz. Budete používat nulovou hypotézu (popis toho, jak se věci aktuálně mají) a alternativní hypotézu (popis toho, jak si myslíte, že by se věci mohly změnit za experimentálních podmínek). K testování obou hypotéz pak použijete matematické techniky. Ujistěte se, že se vyhnete standardním chybám typu I i typu II (nesprávné potvrzení nebo zamítnutí nulové hypotézy).
3. Kvalitativní data : Některé soubory dat se zaměřují spíše na určité kvality než na cokoliv číselného. Předpokládejme, že někdo chce koupit deset tisíc hnědých koní. Sběr kvalitativních dat by se zaměřil spíše na koně samotné a také na jejich barvu než na množství, které chce člověk koupit.
4. Kvantitativní data : Kvantitativní datové body představují číselná fakta. Představte si, že někdo plánuje provést průzkum padesáti lidí všech různých demografických skupin. Demografie sama o sobě by byla příkladem kvalitativních dat, zatímco numerická data padesáti různých účastníků průzkumu by byla kvantitativní.
5. Velikost vzorku : Chcete-li vytvořit rozdělení pravděpodobnosti, musíte nastavit parametry své populace sběrem relevantní velikosti vzorku. Na základě těchto údajů pak otestujete další informace (jako jsou intervaly spolehlivosti). Tato statistická data mohou zahrnovat jak kvalitativní, tak kvantitativní proměnné.
6. Variabilita : Jak se frekvenční distribuce rozprostírají od svých středů, existuje určitá variabilita. To zahrnuje věci jako špičatost, šikmost a směrodatná odchylka . Ty zohledňují odlehlé hodnoty ve vašich statistických údajích.
7. Proměnné : V širším smyslu tvoří váš náhodný vzorek kvalitativních a kvantitativních proměnných dvě širší sady nezávislých a závislých proměnných . Ty vám umožňují experimentovat s daty porovnáním toho, jak se věci mají, s tím, jak se mění, když s nimi experimentujete.
Příklady statistik
Rozvíjení pracovního porozumění pravděpodobnosti a statistikám vás připraví k použití tohoto odvětví aplikované matematiky v mnoha různých pragmatických scénářích. Zde jsou tři příklady z reálného světa, ve kterých jsou užitečné matematické statistiky:
- Finanční analýza : Obchodníci z Wall Street a další investoři používají statistické metody pro prognózování akcií. Ty poskytují největší možný přehled o tom, jak by si určité cenné papíry mohly v budoucnu vést. Čím větší prostor a velikost vzorku pro vaše finanční data, tím důkladnější bude vaše analýza.
- Lékařské testy : Lékaři a výzkumníci používají interaktivní statistické testy k testování nových léků. Pomocí různých teorémů a souborů dat mohou určit, zda tyto léky budou mít pozitivní účinek na populaci, a to analýzou reakce vzorku lidí.
- Politický průzkum : Statistická teorie pomáhá politickým prognostikům lépe předvídat a zjišťovat , jak se lidé cítí ohledně problémů a kandidátů. Soubory dat, jako jsou tyto, mají hluboký a kategorický účinek na soupeřící strany, které bojují o moc.