Pagrindinis skirtumas tarp klasifikavimo ir regresijos medžio yra tas, kad klasifikuojant priklausomi kintamieji yra kategoriški ir netvarkingi, o regresijos atveju priklausomi kintamieji yra ištisinės arba sutvarkytos visumos reikšmės.
Klasifikavimas ir regresija yra mokymosi metodai, skirti sukurti prognozavimo modelius iš surinktų duomenų. Abi technikos grafiškai pateikiamos kaip klasifikavimo ir regresijos medžiai, tiksliau – schemos su duomenų padalijimu po kiekvieno žingsnio, o tiksliau – „šaka“medyje. Šis procesas vadinamas rekursiniu skaidymu. Tokiose srityse kaip kasyba naudoja šiuos klasifikavimo ir regresijos mokymosi metodus. Šiame straipsnyje pagrindinis dėmesys skiriamas klasifikavimo ir regresijos medžiui.
Kas yra klasifikacija?
Klasifikavimas yra metodas, naudojamas norint gauti schemą, rodančią duomenų organizavimą, pradedant pirmtako kintamuoju. Priklausomi kintamieji klasifikuoja duomenis.
01 pav.: duomenų gavyba
Klasifikavimo medis prasideda nepriklausomu kintamuoju, kuris išsišakoja į dvi grupes, nustatytas pagal esamus priklausomus kintamuosius. Jis skirtas paaiškinti atsakymus kategorizavimo forma, kurį sukelia priklausomi kintamieji.
Kas yra regresija
Regresija yra numatymo metodas, pagrįstas numanoma arba žinoma skaitine išvesties reikšme. Ši išvesties reikšmė yra rekursinio skaidymo serijos rezultatas, kai kiekvienas žingsnis turi vieną skaitinę reikšmę ir kitą priklausomų kintamųjų grupę, kuri išsišakoja į kitą porą, pvz., šią.
Regresijos medis prasideda vienu ar daugiau pirmtakų kintamųjų ir baigiasi vienu galutiniu išvesties kintamuoju. Priklausomi kintamieji yra tęstiniai arba atskiri skaitiniai kintamieji.
Kuo skiriasi klasifikacija ir regresija?
Klasifikacija prieš regresiją |
|
Medžio modelis, kuriame tikslinis kintamasis gali turėti atskirą reikšmių rinkinį. | Medžio modelis, kuriame tikslinis kintamasis gali gauti nuolatines vertes, paprastai realius skaičius. |
Priklausomas kintamasis | |
Klasifikavimo medžiui priklausomi kintamieji yra kategoriški. | Regresijos medyje priklausomi kintamieji yra skaitiniai. |
Vertės | |
Yra nustatytas nesutvarkytų verčių kiekis. | Turi arba atskiras, bet sutvarkytas vertes, arba nediskrečias reikšmes. |
Statybos paskirtis | |
Regresijos medžio konstravimo tikslas yra pritaikyti regresijos sistemą kiekvienai determinantinei šakai taip, kad gautųsi laukiama išvesties vertė. | Klasifikacinis medis išsišakoja pagal priklausomą kintamąjį, gautą iš ankstesnio mazgo. |
Santrauka – klasifikacija prieš regresiją
Regresijos ir klasifikavimo medžiai yra naudingi metodai, padedantys nubrėžti procesą, kuris nurodo tiriamą rezultatą, nesvarbu, ar tai klasifikuojama, ar viena skaitinė vertė. Skirtumas tarp klasifikacinio medžio ir regresijos medžio yra nuo jų priklausomas kintamasis. Klasifikavimo medžiai turi priklausomus kintamuosius, kurie yra kategoriški ir netvarkingi. Regresijos medžiai turi priklausomus kintamuosius, kurie yra ištisinės reikšmės arba sutvarkytos visumos reikšmės.