Regresija vs ANOVA
Regresija ir ANOVA (dispersijos analizė) yra du statistinės teorijos metodai, skirti analizuoti vieno kintamojo elgesį, palyginti su kitu. Regresijos atveju tai dažnai yra priklausomo kintamojo kitimas, pagrįstas nepriklausomu kintamuoju, o ANOVA atveju tai yra dviejų imčių iš dviejų populiacijų atributų kitimas.
Daugiau apie regresiją
Regresija yra statistinis metodas, naudojamas nustatyti ryšį tarp dviejų kintamųjų. Dažnai renkant duomenis gali būti kintamųjų, kurie priklauso nuo kitų. Tikslų ryšį tarp tų kintamųjų galima nustatyti tik regresijos metodais. Šio ryšio nustatymas padeda suprasti ir numatyti vieno kintamojo elgesį su kitu.
Dažniausiai taikoma regresinė analizė yra apskaičiuoti priklausomo kintamojo vertę tam tikrai vertei arba priklausomų kintamųjų verčių diapazonui. Pavyzdžiui, naudojant regresiją, galime nustatyti ryšį tarp prekės kainos ir vartojimo, remiantis duomenimis, surinktais iš atsitiktinės imties. Regresinė analizė sukurs duomenų rinkinio regresijos funkciją, kuri yra matematinis modelis, geriausiai atitinkantis turimus duomenis. Tai gali būti lengvai pavaizduota sklaidos diagrama. Grafiškai regresija yra lygiavertė geriausios kreivės, atitinkančios pateiktą duomenų rinkinį, paieškai. Kreivės funkcija yra regresijos funkcija. Naudojant matematinį modelį, galima numatyti prekės naudojimą už nurodytą kainą.
Todėl regresinė analizė plačiai naudojama prognozuojant ir prognozuojant. Jis taip pat naudojamas eksperimentinių duomenų ryšiams nustatyti fizikos, chemijos ir daugelio gamtos mokslų bei inžinerijos disciplinų srityse. Jei ryšys arba regresijos funkcija yra tiesinė funkcija, tada procesas vadinamas tiesine regresija. Sklaidos diagramoje ji gali būti pavaizduota kaip tiesia linija. Jei funkcija nėra tiesinis parametrų derinys, regresija yra nelinijinė.
Daugiau apie ANOVA (dispersijos analizę)
ANOVA neapima aiškios dviejų ar daugiau kintamųjų santykio analizės. Atvirkščiai, patikrinama, ar dviejų ar daugiau skirtingų populiacijų imčių vidurkis yra toks pat. Pavyzdžiui, apsvarstykite egzamino, laikomo mokykloje pažymiui, testo rezultatus. Nors testai skiriasi, kiekvienos klasės rezultatai gali būti vienodi. Vienas iš būdų tai patikrinti yra lyginti kiekvienos klasės vidurkius. ANOVA arba ANalysis Of Variance leidžia patikrinti šią hipotezę. Iš esmės ANOVA gali būti laikoma t testo išplėtimu, kai lyginamos dviejų imčių, paimtų iš dviejų populiacijų, vidurkiai.
Pagrindinė ANOVA idėja yra atsižvelgti į skirtumus imtyje ir skirtumus tarp imčių. Skirtumas imtyje gali būti siejamas su atsitiktinumu, o skirtumai tarp imčių gali būti siejami su atsitiktinumu ir kitais išoriniais veiksniais. Dispersijos analizė pagrįsta trimis modeliais; fiksuotų efektų modelis, atsitiktinių efektų modelis ir mišrių efektų modelis.
Kuo skiriasi regresija ir ANOVA?
• ANOVA yra dviejų ar daugiau imčių kitimo analizė, o regresija yra santykio tarp dviejų ar daugiau kintamųjų analizė.
• ANOVA teorija taikoma naudojant tris pagrindinius modelius (fiksuotų efektų modelį, atsitiktinių efektų modelį ir mišrių efektų modelį), o regresija taikoma naudojant du modelius (tiesinės regresijos modelį ir daugkartinės regresijos modelį).
• ANOVA ir Regresija yra dvi bendrojo linijinio modelio (GLM) versijos. ANOVA pagrįsta kategoriniais nuspėjamaisiais kintamaisiais, o regresija – kiekybiniais prognozuojamaisiais kintamaisiais.
• Regresija yra lankstesnė technika, ji naudojama prognozuojant ir numatant, o ANOVA naudojama dviejų ar daugiau populiacijų lygybei palyginti.