Skirtumas tarp dispersijos ir kovariacijos

Skirtumas tarp dispersijos ir kovariacijos
Skirtumas tarp dispersijos ir kovariacijos

Video: Skirtumas tarp dispersijos ir kovariacijos

Video: Skirtumas tarp dispersijos ir kovariacijos
Video: Atsitiktinio dydžio dispersija ir vidutinis standartinis nuokrypis 2024, Lapkritis
Anonim

Variantas prieš kovariaciją

Variacija ir kovariacija yra du statistikoje naudojami matai. Sklaida yra duomenų sklaidos matas, o kovariacija rodo dviejų atsitiktinių dydžių kitimo laipsnį kartu. Variacija yra gana intuityvi sąvoka, tačiau kovariacija iš pradžių apibrėžiama matematiškai ne tokia intuityvi.

Daugiau apie skirtumą

Variantas yra duomenų sklaidos nuo vidutinės skirstinio vertės matas. Jis nurodo, kiek duomenų taškai yra nuo skirstinio vidurkio. Tai vienas iš pagrindinių tikimybių skirstinio deskriptorių ir vienas iš skirstinio momentų. Be to, dispersija yra visumos parametras, o imties dispersija nuo populiacijos veikia kaip visumos dispersijos įvertis. Iš vienos perspektyvos jis apibrėžiamas kaip standartinio nuokrypio kvadratas.

Paprasta kalba jį galima apibūdinti kaip atstumo tarp kiekvieno duomenų taško ir skirstinio vidurkio kvadratų vidurkį. Skirtumui apskaičiuoti naudojama ši formulė.

Var(X)=E[(X-µ)2] populiacijai ir

Var(X)=E[(X-‾x)2] pavyzdžiui

Galima dar labiau supaprastinti pateikiant Var(X)=E[X2]-(E[X])2.

Variance turi keletą parašo savybių ir dažnai naudojama statistikoje, kad būtų lengviau naudoti. Dispersija nėra neigiama, nes tai yra atstumų kvadratas. Tačiau dispersijos diapazonas nėra ribotas ir priklauso nuo konkretaus pasiskirstymo. Nuolatinio atsitiktinio dydžio dispersija yra lygi nuliui, o dispersija vietos parametro atžvilgiu nekinta.

Daugiau apie kovariaciją

Statistikos teorijoje kovariacija yra matas, nurodantis, kiek kartu keičiasi du atsitiktiniai dydžiai. Kitaip tariant, kovariacija yra dviejų atsitiktinių dydžių koreliacijos stiprumo matas. Be to, tai gali būti laikoma dviejų atsitiktinių dydžių dispersijos sampratos apibendrinimu.

Dviejų atsitiktinių dydžių X ir Y, kurie kartu pasiskirsto baigtiniu antruoju impulsu, kovariacija yra žinoma kaip σXY=E[(X-E[X])(Y-E[Y])]. Iš to dispersija gali būti vertinama kaip ypatingas kovariacijos atvejis, kai du kintamieji yra vienodi. Cov(X, X)=Var(X)

Normalizavus kovariaciją, galima gauti tiesinės koreliacijos koeficientą arba Pirsono koreliacijos koeficientą, kuris apibrėžiamas kaip ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Grafiškai kovariacija tarp duomenų taškų poros gali būti matoma kaip stačiakampio plotas, kurio duomenų taškai yra priešingose viršūnėse. Jis gali būti interpretuojamas kaip atskyrimo tarp dviejų duomenų taškų matas. Atsižvelgiant į visos populiacijos stačiakampius, stačiakampių, atitinkančių visus duomenų taškus, sutapimas gali būti laikomas atskyrimo stiprumu; dviejų kintamųjų dispersija. Kovariacija yra dviejų dimensijų dėl dviejų kintamųjų, tačiau supaprastinus ją iki vieno kintamojo gaunama vieno dispersija kaip atskirtis viename matmenyje.

Kuo skiriasi dispersija ir kovariacija?

• Sklaida yra paplitimo / sklaidos populiacijoje matas, o kovariacija laikoma dviejų atsitiktinių dydžių kitimo matu arba koreliacijos stiprumu.

• Dispersiją galima laikyti ypatingu kovariacijos atveju.

• Dispersija ir kovariacija priklauso nuo duomenų reikšmių dydžio ir negali būti lyginami; todėl jie normalizuojami. Kovariacija normalizuojama į koreliacijos koeficientą (padalijus iš dviejų atsitiktinių dydžių standartinių nuokrypių sandaugos), o dispersija – į standartinį nuokrypį (paimant kvadratinę šaknį)

Rekomenduojamas: