Co je to faktorová analýza?
Když statistici chtějí studovat účinky nepozorovaných proměnných na výsledky a iterace souboru dat, mohou sestavit model faktorové analýzy. Přitom se pokoušejí izolovat základní faktory spojené s konkrétními výsledky.
Co je to faktorová analýza?
Faktorová analýza je studium nepozorovaných proměnných, také známých jako latentní proměnné nebo latentní faktory, které se mohou kombinovat s pozorovanými proměnnými a ovlivnit výsledky. Statistici berou tyto nepozorované proměnné a studují, zda by mohly být společnými faktory za pozorovanými výstupy v souboru dat. Laicky řečeno, statistici chtějí vidět, zda určitý faktor produkuje společné výsledky v celé populaci.
Faktorová analýza hraje klíčovou roli ve světě deskriptivní statistiky a společenských věd. Dotýká se odvětví, jako je obchodní marketing, produktový management , psychometrika, strojové učení a finance.
2 typy faktorové analýzy
Existují dva základní typy faktorové analýzy, které přispívají k širší oblasti statistické analýzy a analýzy dat.
1. Explorativní faktorová analýza : Při explorativní faktorové analýze (EFA) výzkumník přistupuje k souboru dat bez předpojatých představ o jeho faktorové struktuře. Výzkumník doufá, že identifikací latentních faktorů a jejich zmapováním spolu s množstvím rozptylu mezi pozorovanými proměnnými izoluje faktory, které ovlivňují pozorovaná data. Všimněte si, že modely EFA vidí pozorované proměnné jako lineární kombinace, což z nich dělá pokročilou verzi analýzy hlavních komponent (PCA).
2. Konfirmační faktorová analýza : Konfirmační faktorová analýza (CFA) používá modelování strukturních rovnic k testování hypotéz porovnáním těchto hypotéz s pozorovanými daty. Výzkumníci pak mohou revidovat své strukturální rovnice, aby lépe odrážely data z reálného světa. Díky tomu je CFA podobný odhadu nejmenších čtverců, ale statistici považují CFA za více vstřícný k mírným chybám měření při studiu velkého počtu proměnných.
4 pojmy faktorové analýzy
Prozkoumejte nejběžnější termíny související s faktorovou analýzou.
1. Rozptyl : Když statistici mluví o množství rozptylu ve faktorové analýze, mluví o odchylce od průměru nebo průměru. Pokud datový bod vykazuje velký rozptyl od normálních výsledků, výzkumníci mohou chtít izolovat faktor, který je za takovou abnormalitou.
2. Vlastní hodnota : Při analýze dat je vlastní hodnota mírou rozptylu. Klíčové číslo, kterému je třeba věnovat pozornost, je 1. Když je vlastní hodnota větší než 1, znamená to, že faktorové řešení vykazuje větší rozptyl, než by mohl způsobit jedna jediná pozorovaná proměnná. To by mohlo poukazovat na existenci latentní proměnné, která způsobuje další rozptyl.
3. Faktorové skóre : Faktorové skóre nebo faktor zatížení je měření, které koreluje konkrétní proměnnou s daným faktorem. Když je skóre faktoru vysoké, naznačuje to, že mezi určitým faktorem a běžným rozptylem ve sledovaných datech existuje pozoruhodně silná souvislost.
4. Korelační koeficient : Korelační koeficienty fungují podobně jako faktorové skóre. Jsou to numerická měření korelace mezi dvěma proměnnými při ovlivňování výsledků. Pokud mají statistici podezření na silnou korelaci, mohou se pokusit rozšířit velikost vzorku, aby stanovili maximální pravděpodobnost, že se dva faktory vzájemně ovlivňují.
Příklady 3 faktorové analýzy
Nemusíte být statistik, abyste viděli, jak izolování a studium řady faktorů může poskytnout lepší pochopení jevů v reálném světě.
1. Mikrobiální střevní studie : Vědci se stále více zajímají o to, jak může lidský mikrobiom – kolonie mikroorganismů žijících v jejich střevech – ovlivnit zdravotní výsledky, tělesnou hmotnost a dokonce i emoce. Výzkumní biologové provedli analýzu faktorů, aby se pokusili spojit přítomnost určitých mikrobů s určitými zdravotními stavy.
2. Algoritmy doporučení : Strojové učení ustoupilo odvětví algoritmů doporučení, které navrhují novinky ke čtení, filmy ke streamování a produkty ke koupi. Věda za těmito algoritmy někdy zahrnuje izolování konkrétních faktorů, které by mohly člověka předurčit k tomu, aby si oblíbil určitý produkt nebo nabídku zábavy.
3. Průzkumy : Průzkumy a podniky mohou provádět nezávazné průzkumy, kde jsou odpovědi respondentů převedeny do bloků korelační matice. Architekti průzkumu se poté pokoušejí analyzovat reakce, aby předpověděli další preference a chování.