Regresija vs koreliacija
Statistikoje svarbu nustatyti ryšį tarp dviejų atsitiktinių dydžių. Tai suteikia galimybę prognozuoti vieną kintamąjį, palyginti su kitais. Regresinė analizė ir koreliacija taikoma orų prognozėms, finansų rinkų elgsenai, fizinių ryšių nustatymui eksperimentais ir kur kas realesniuose scenarijuose.
Kas yra regresija?
Regresija yra statistinis metodas, naudojamas nustatyti ryšį tarp dviejų kintamųjų. Dažnai renkant duomenis gali būti kintamųjų, kurie priklauso nuo kitų. Tikslų ryšį tarp šių kintamųjų galima nustatyti tik regresijos metodais. Šio ryšio nustatymas padeda suprasti ir numatyti vieno kintamojo elgesį su kitu.
Dažniausias regresinės analizės taikymas yra apskaičiuoti priklausomo kintamojo vertę tam tikrai vertei arba nepriklausomų kintamųjų verčių diapazonui. Pavyzdžiui, naudojant regresiją, galime nustatyti ryšį tarp prekės kainos ir vartojimo, remiantis duomenimis, surinktais iš atsitiktinės imties. Regresinė analizė sukuria duomenų rinkinio regresijos funkciją, kuri yra matematinis modelis, geriausiai atitinkantis turimus duomenis. Tai gali būti lengvai pavaizduota sklaidos diagrama. Grafiškai regresija yra lygiavertė tinkamiausios kreivės paieškai duotam duomenų rinkiniui. Kreivės funkcija yra regresijos funkcija. Naudojant matematinį modelį, galima numatyti prekės paklausą už nurodytą kainą.
Todėl regresinė analizė plačiai naudojama prognozuojant ir prognozuojant. Jis taip pat naudojamas eksperimentinių duomenų ryšiams nustatyti fizikos, chemijos ir daugelio gamtos mokslų bei inžinerijos disciplinų srityse. Jei ryšys arba regresijos funkcija yra tiesinė funkcija, tada procesas vadinamas tiesine regresija. Sklaidos diagramoje ji gali būti pavaizduota kaip tiesia linija. Jei funkcija nėra tiesinis parametrų derinys, regresija yra nelinijinė.
Kas yra koreliacija?
Koreliacija yra dviejų kintamųjų ryšio stiprumo matas. Koreliacijos koeficientas kiekybiškai įvertina vieno kintamojo pokyčio laipsnį, pagrįstą kito kintamojo pokyčiu. Statistikoje koreliacija siejama su priklausomybės sąvoka, kuri yra statistinis ryšys tarp dviejų kintamųjų.
Pearsons koreliacijos koeficientas arba tik koreliacijos koeficientas r yra reikšmė nuo -1 iki 1 (-1≤r≤+1). Tai dažniausiai naudojamas koreliacijos koeficientas ir galioja tik tiesiniam ryšiui tarp kintamųjų. Jei r=0, ryšio nėra, o jei r≥0, ryšys yra tiesiogiai proporcingas; y., vieno kintamojo reikšmė didėja didėjant kito. Jei r≤0, ryšys yra atvirkščiai proporcingas; y., vienas kintamasis mažėja, kai kitas didėja.
Dėl tiesiškumo sąlygos koreliacijos koeficientas r taip pat gali būti naudojamas nustatant tiesinį ryšį tarp kintamųjų.
Kuo skiriasi regresija ir koreliacija?
Regresija pateikia ryšio tarp dviejų atsitiktinių dydžių formą, o koreliacija – ryšio stiprumo laipsnį.
Regresijos analizė sukuria regresijos funkciją, kuri padeda ekstrapoliuoti ir numatyti rezultatus, o koreliacija gali suteikti informacijos tik apie tai, kokia kryptimi ji gali keistis.
Tikslesni tiesinės regresijos modeliai pateikiami analizės būdu, jei koreliacijos koeficientas yra didesnis. (|r|≥0,8)