Co je korelace ve statistice?
Přečtěte si o pozitivní a negativní korelaci ve statistice a o tom, jak vypočítat různé typy korelačních koeficientů.
Co je korelace?
Ve statistice korelace, také známá jako závislost, je statistická míra vztahu mezi bivariačními daty nebo jakýmikoli daty zahrnujícími dvě proměnné. Konkrétně se korelace týká lineárního vztahu mezi dvěma nezávislými proměnnými. Korelační koeficient je numerickým měřítkem statistické korelace a udává sílu vztahu.
Pozitivní vs. negativní korelace: Jaký je rozdíl?
Vzorce pro korelační koeficient poskytují absolutní hodnotu mezi zápornou jedničkou a jedničkou.
- Pozitivní korelace : Hodnota jedna označuje silný pozitivní vztah, jinak známý jako silná pozitivní korelace nebo perfektní pozitivní korelace, mezi dvěma body v souboru dat. Čím blíže je hodnota jedné, tím silnější je pozitivní korelace.
- Negativní korelace : Záporná hodnota jedna označuje silný negativní vztah nebo dokonalou negativní korelaci. Čím blíže je hodnota záporné, tím silnější je negativní korelace.
- Žádná korelace : Hodnota nula znamená, že neexistuje vůbec žádný vztah nebo nulová hypotéza.
Někteří statistici představují tato data jako lineární korelaci na grafu měřícím hodnoty X a Y. Pokud se body vztahu zvýší a vytvoří pozitivní korelaci, bude se zdát, že mají pozitivní sklon na bodovém grafu, což znamená, že pokud byste datovými body protáhli přímku, pohybovala by se nahoru zleva doprava. Naopak, pokud se zdá, že datové body mají negativní sklon, který se pohybuje dolů zleva doprava, znamená to negativní vztah.
4 Vzorce pro korelační koeficient
Prozkoumejte nejběžnější způsoby použití korelačních koeficientů k měření korelace.
1. Pearsonova korelace produktu-moment : Nejběžnějším korelačním koeficientem je Pearsonova korelace produktu-moment, která měří lineární vztah nebo lineární asociaci mezi dvěma proměnnými. Pearsonův korelační koeficient lze vypočítat pro jakýkoli soubor dat, který má matici konečné kovariance. Vydělte kovarianci dvou proměnných součinem jejich standardních odchylek.
2. Vzorkový korelační koeficient : Ve výběrovém korelačním koeficientu Sx a Sy označují výběrové směrodatné odchylky a Sxy je výběrová kovariance. Rovnice je vyjádřena takto:
3. Populační korelační koeficient : Populační korelační koeficient je reprezentován řeckým písmenem ρ (rho) a směrodatná odchylka je reprezentována řeckým písmenem σ (sigma). V této rovnici je σx směrodatná odchylka X, σy je směrodatná odchylka Y a σxy je kovariance populace. Rovnice vypadá takto:
4. Pořadové korelační koeficienty : Pořadové korelační koeficienty, jako Spearmanův koeficient pořadové korelace a Kendallův koeficient pořadové korelace, měří, o kolik se jedna proměnná zvyšuje, když má jiná proměnná tendenci růst a naopak, pouze nevyžadují lineární vztah.
Korelace vs. kauzalita: Jaký je rozdíl?
Korelace ne vždy ukazuje kauzalitu nebo přímý vztah mezi příčinou a následkem. To je způsobeno možností, že se korelační koeficienty mohou jevit jako související, ale jsou způsobeny faktory, které se studií nesouvisejí. Některé studie mohou také propůjčit mnohem větší význam existenci odlehlých hodnot mezi datovými body nebo nekvantifikované relevanci faktorů, jako je velikost vzorku.
3 Příklady korelace v každodenním životě
Prozkoumejte několik příkladů korelace v každodenních situacích.
1. Pozitivní korelace : Pozitivní korelace mohou zahrnovat vztah mezi prodejem limonád a venkovní teplotou, z čehož vyplývá, že horké počasí souvisí se zvýšením spotřeby studených nápojů. Může také existovat pozitivní vztah mezi výškou a tělesnou hmotností podobných tělesných typů, z čehož vyplývá, že vyšší lidé pravděpodobně váží více než lidé nižší.
2. Negativní korelace : Negativní korelace mohou vypadat jako vztah mezi časem stráveným hraním videoher před složením testu a výsledky studentových zkoušek. V tomto hypotetickém scénáři by lineární regrese naznačovala, že čím více student před testem hrál videohry, tím nižší bylo jeho skóre. Další hypotetická regresní čára na souboru dat by mohla měřit náklady na položku nabídky k počtu prodejů, které položka nabídky obdrží, což implikuje negativní korelaci mezi prodejem a vyššími náklady.
3. Nulové hypotézy : Nulové hypotézy budou pravděpodobně výsledkem vztahů, které nemají žádnou indikační korelaci, jako je výška osoby a její skóre ve zkoušce nebo množství vypité limonády a velikost bot.