Pagrindinis skirtumas – prižiūrimas ir neprižiūrimas mašininis mokymasis
Prižiūrimas mokymasis ir neprižiūrimas mokymasis yra dvi pagrindinės mašininio mokymosi sąvokos. Prižiūrimas mokymasis yra mašininio mokymosi užduotis, skirta išmokti funkciją, kuri susieja įvestį su išvestimi pagal pavyzdines įvesties ir išvesties poras. Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, pagal kurią iš nepažymėtų duomenų galima nustatyti funkciją, apibūdinančią paslėptą struktūrą. Pagrindinis skirtumas tarp prižiūrimo ir neprižiūrimo mašininio mokymosi yra tas, kad prižiūrimas mokymasis naudoja pažymėtus duomenis, o neprižiūrimas mokymasis naudoja nepažymėtus duomenis.
Mašininis mokymasis – tai kompiuterių mokslo sritis, suteikianti kompiuterinei sistemai galimybę mokytis iš duomenų, jos nėra aiškiai užprogramuotos. Tai leidžia analizuoti duomenis ir numatyti juose esančius modelius. Yra daug mašininio mokymosi programų. Kai kurie iš jų yra veido atpažinimas, gestų atpažinimas ir kalbos atpažinimas. Yra įvairių algoritmų, susijusių su mašininiu mokymusi. Kai kurie iš jų yra regresija, klasifikavimas ir klasterizavimas. Labiausiai paplitusios programavimo kalbos kuriant mašininiu mokymusi pagrįstas programas yra R ir Python. Taip pat galima naudoti kitas kalbas, pvz., Java, C++ ir Matlab.
Kas yra prižiūrimas mokymasis?
Mašininiu mokymusi pagrįstose sistemose modelis veikia pagal algoritmą. Vadovaujantis mokymuisi modelis yra prižiūrimas. Pirmiausia reikia išmokyti modelį. Turėdamas įgytas žinias, jis gali numatyti atsakymus būsimiems atvejams. Modelis mokomas naudojant pažymėtą duomenų rinkinį. Kai sistemai pateikiami nepavyzdiniai duomenys, ji gali numatyti rezultatą. Toliau pateikiama nedidelė ištrauka iš populiaraus IRIS duomenų rinkinio.
Pagal pirmiau pateiktą lentelę taurėlapio ilgis, taurėlapio plotis, žiedlapio ilgis, žiedlapio plotis ir rūšis vadinami atributais. Stulpeliai žinomi kaip funkcijos. Vienoje eilutėje yra visų atributų duomenys. Todėl viena eilutė vadinama stebėjimu. Duomenys gali būti skaitiniai arba kategoriški. Modeliui pateikiami stebėjimai su atitinkamo rūšies pavadinimu kaip įvestis. Kai pateikiamas naujas stebėjimas, modelis turėtų numatyti rūšies, kuriai jis priklauso, tipą.
Prižiūrimo mokymosi metu yra klasifikavimo ir regresijos algoritmai. Klasifikavimas yra žymėtų duomenų klasifikavimo procesas. Modelis sukūrė ribas, kurios skyrė duomenų kategorijas. Kai modeliui pateikiami nauji duomenys, jį galima suskirstyti į kategorijas pagal taško buvimo vietą. K-Artimiausi kaimynai (KNN) yra klasifikavimo modelis. Atsižvelgiant į k reikšmę, nustatoma kategorija. Pavyzdžiui, kai k yra 5, jei konkretus duomenų taškas yra arti aštuonių A kategorijos duomenų taškų ir šešių B kategorijos duomenų taškų, duomenų taškas bus klasifikuojamas kaip A.
Regresija yra ankstesnių duomenų tendencijos nuspėjimo procesas, siekiant numatyti naujų duomenų rezultatą. Regresijos atveju išvestis gali būti sudaryta iš vieno ar daugiau nuolatinių kintamųjų. Numatymas atliekamas naudojant liniją, apimančią daugumą duomenų taškų. Paprasčiausias regresijos modelis yra tiesinė regresija. Tai greita ir nereikalauja derinimo parametrų, tokių kaip KNN. Jei duomenys rodo parabolinę tendenciją, tiesinės regresijos modelis netinka.
Tai yra keletas prižiūrimų mokymosi algoritmų pavyzdžių. Paprastai rezultatai, gauti naudojant prižiūrimus mokymosi metodus, yra tikslesni ir patikimesni, nes įvesties duomenys yra gerai žinomi ir pažymėti. Todėl mašina turi analizuoti tik paslėptus šablonus.
Kas yra mokymasis be priežiūros?
Mokant be priežiūros, modelis neprižiūrimas. Modelis veikia savarankiškai, kad nuspėtų rezultatus. Jis naudoja mašininio mokymosi algoritmus, kad padarytų išvadas dėl nepažymėtų duomenų. Paprastai neprižiūrimi mokymosi algoritmai yra sunkesni nei prižiūrimi mokymosi algoritmai, nes yra mažai informacijos. Klasterizavimas yra neprižiūrimo mokymosi rūšis. Jis gali būti naudojamas sugrupuoti nežinomus duomenis naudojant algoritmus. K vidurkis ir tankiu pagrįstas klasterizavimas yra du grupavimo algoritmai.
k-mean algoritmas, kiekvienai klasteriui atsitiktinai įdeda k centroidą. Tada kiekvienas duomenų taškas priskiriamas artimiausiam centroidui. Euklidinis atstumas naudojamas atstumui nuo duomenų taško iki centroido apskaičiuoti. Duomenų taškai suskirstyti į grupes. Dar kartą apskaičiuojamos k centroidų pozicijos. Nauja centroido padėtis nustatoma pagal visų grupės taškų vidurkį. Vėlgi, kiekvienas duomenų taškas priskiriamas artimiausiam centroidui. Šis procesas kartojamas tol, kol centroidai nebesikeičia. k-mean yra greitas klasterizacijos algoritmas, tačiau nėra nurodytos grupavimo taškų iniciacijos. Be to, yra daug skirtingų grupių modelių, pagrįstų grupių taškų inicijavimu.
Kitas klasterizacijos algoritmas yra tankiu pagrįstas grupavimas. Jis taip pat žinomas kaip tankiu pagrįstos erdvinės klasterizacijos programos su triukšmu. Jis veikia apibrėždamas klasterį kaip didžiausią tankio prijungtų taškų rinkinį. Tai du parametrai, naudojami tankumu pagrįsti klasterizavimui. Jie yra Ɛ (epsilonas) ir minimalūs taškai. Ɛ yra didžiausias apylinkės spindulys. Minimalūs taškai yra mažiausias taškų skaičius Ɛ kaimynystėje, kad būtų galima apibrėžti klasterį. Tai yra keletas klasterizacijos, kuri patenka į neprižiūrimą mokymąsi, pavyzdžiai.
Paprastai rezultatai, gauti naudojant neprižiūrimus mokymosi algoritmus, nėra labai tikslūs ir patikimi, nes mašina turi apibrėžti ir pažymėti įvesties duomenis prieš nustatydama paslėptus šablonus ir funkcijas.
Koks yra prižiūrimo ir neprižiūrimo mašininio mokymosi panašumas?
Ir prižiūrimas, tiek neprižiūrimas mokymasis yra mašininio mokymosi rūšys
Kuo skiriasi prižiūrimas ir neprižiūrimas mašininis mokymasis?
Prižiūrimas ir neprižiūrimas mašininis mokymasis |
|
Prižiūrimas mokymasis yra mašininio mokymosi užduotis, skirta išmokti funkciją, kuri pagal įvesties ir išvesties porų pavyzdžius susieja įvestį su išvestimi. | Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, pagal kurią iš nepažymėtų duomenų galima nustatyti funkciją, apibūdinančią paslėptą struktūrą. |
Pagrindinės funkcijos | |
Prižiūrimo mokymosi metu modelis numato rezultatą pagal pažymėtus įvesties duomenis. | Mokantis be priežiūros, modelis numato rezultatą be pažymėtų duomenų, pats identifikuodamas modelius. |
Rezultatų tikslumas | |
Rezultatai, gauti naudojant prižiūrimus mokymosi metodus, yra tikslesni ir patikimesni. | Neprižiūrimų mokymosi metodų gauti rezultatai nėra labai tikslūs ir patikimi. |
Pagrindiniai algoritmai | |
Yra regresijos ir klasifikavimo algoritmai prižiūrimo mokymosi metu. | Yra algoritmų, skirtų klasterizuoti neprižiūrimo mokymosi metu. |
Santrauka – prižiūrimas ir neprižiūrimas mašininis mokymasis
Prižiūrimas mokymasis ir neprižiūrimas mokymasis yra du mašininio mokymosi tipai. Prižiūrimas mokymasis yra mašininio mokymosi užduotis, skirta išmokti funkciją, kuri įvestį susieja su išvestimi pagal pavyzdines įvesties ir išvesties poras. Neprižiūrimas mokymasis yra mašininio mokymosi užduotis, pagal kurią iš nepažymėtų duomenų galima nustatyti funkciją, apibūdinančią paslėptą struktūrą. Skirtumas tarp prižiūrimo ir neprižiūrimo mašininio mokymosi yra tas, kad prižiūrimas mokymasis naudoja pažymėtus duomenis, o neprižiūrimas mokymasis naudoja nepažymėtus duomenis.