Skirtumas tarp RDBMS ir „Hadoop“

Turinys:

Skirtumas tarp RDBMS ir „Hadoop“
Skirtumas tarp RDBMS ir „Hadoop“

Video: Skirtumas tarp RDBMS ir „Hadoop“

Video: Skirtumas tarp RDBMS ir „Hadoop“
Video: Hadoop против РСУБД 2024, Lapkritis
Anonim

Pagrindinis skirtumas tarp RDBMS ir Hadoop yra tas, kad RDBMS saugo struktūrizuotus duomenis, o Hadoop – struktūrinius, pusiau struktūruotus ir nestruktūruotus duomenis.

RDBMS yra duomenų bazių valdymo sistema, pagrįsta reliaciniu modeliu. „Hadoop“yra programinė įranga, skirta duomenims saugoti ir programoms paleisti prekinės aparatinės įrangos grupėse.

Vaizdas
Vaizdas

Kas yra RDBVS?

RDBMS reiškia Reliacinė duomenų bazių valdymo sistema, pagrįsta reliaciniu modeliu. RDBVS duomenims saugoti naudojamos lentelės, o lentelės sujungti padeda raktai ir indeksai. Lentelė yra duomenų elementų rinkinys, o jie yra objektai. Jame yra eilučių ir stulpelių. Eilutės žymi vieną lentelės įrašą. Stulpeliai rodo atributus.

Pavyzdžiui, pardavimo duomenų bazėje gali būti klientų ir produktų subjektų. Klientas gali turėti tokius atributus kaip kliento_id, vardas, adresas, telefono_nr. Prekė gali turėti atributus, tokius kaip produkto_id, pavadinimas ir tt Pirminis klientų lentelės raktas yra customer_id, o pirminis produkto lentelės raktas yra produkto_id. Produkto_id įdėjimas į klientų lentelę kaip išorinis raktas sujungia šiuos du objektus. Be to, lentelės taip pat yra susijusios viena su kita. Jie užtikrina duomenų vientisumą, normalizavimą ir daug daugiau. Keletas įprastų RDBVS yra MySQL, MSSQL ir Oracle. Užklausoms jie naudoja SQL.

Kas yra Hadoop?

Hadoop yra „Apache“atvirojo kodo sistema, parašyta „Java“. Tai padeda saugoti ir apdoroti didelį duomenų kiekį kompiuterių grupėse naudojant paprastus programavimo modelius. Pagrindinis „Hadoop“tikslas yra saugoti ir apdoroti didelius duomenis, kurie susiję su dideliu sudėtingų duomenų kiekiu. „Hadoop“pralaidumas, ty gebėjimas apdoroti duomenų kiekį per tam tikrą laikotarpį, yra didelis.

Skirtumas tarp RDBMS ir Hadoop
Skirtumas tarp RDBMS ir Hadoop

Yra keturi „Hadoop“architektūros moduliai. Tai yra „Hadoop common“, „YARN“, „Hadoop Distributed File System“(HDFS) ir „Hadoop MapReduce“. Bendrame modulyje yra „Java“bibliotekos ir paslaugų programos. Jame taip pat yra failų, skirtų Hadoop paleisti. „Hadoop YARN“atlieka darbų planavimą ir grupių išteklių valdymą.

Be to, „Hadoop Distributed File System“(HDFS) yra „Hadoop“saugojimo sistema. Jame naudojama šeimininko-vergo architektūra. Pagrindinis mazgas yra NameNode ir jis valdo failų sistemos metaduomenis. Kiti kompiuteriai yra pagalbiniai mazgai arba DataNodes. Jie saugo tikrus duomenis. Kita vertus, Hadoop MapReduce atlieka paskirstytą skaičiavimą. Jis turi algoritmus duomenims apdoroti. HDFS pagrindinis mazgas turi užduočių sekiklį. Jis paleidžia žemėlapio mažinimo užduotis pagalbiniuose mazguose. Kiekvienam pagalbiniam mazgui yra užduočių stebėjimo priemonė, kuri užbaigia duomenų apdorojimą ir siunčia rezultatą atgal į pagrindinį mazgą. Apskritai, „Hadoop“suteikia didžiulę duomenų saugyklą su didele apdorojimo galia.

Kuo skiriasi RDBMS ir Hadoop?

RDBMS prieš Hadoop

RDBMS yra sistemos programinė įranga, skirta kurti ir valdyti duomenų bazes, pagrįstas reliaciniu modeliu. Hadoop yra atvirojo kodo programinės įrangos rinkinys, sujungiantis daugybę kompiuterių, kad būtų išspręstos problemos, susijusios su dideliu duomenų kiekiu ir skaičiavimais.
Duomenų įvairovė
RDBMS saugo struktūrinius duomenis. Hadoop saugo struktūrizuotus, pusiau struktūrinius ir nestruktūrizuotus duomenis.
Duomenų saugykla
RDBMS saugo vidutinį duomenų kiekį. Hadoop saugo daug duomenų nei RDBMS.
Greitis
RDBMS nuskaitymas vyksta greitai. „Hadoop“skaitymas ir rašymas vyksta greitai.
Mastelio keitimas
RDBMS turi vertikalų mastelį. Hadoop turi horizontalų mastelį.
Aparatūra
RDBMS naudoja aukščiausios klasės serverius. Hadoop naudoja prekinę aparatinę įrangą.
Pralaidumas
RDBMS pralaidumas didesnis. Hadoop pralaidumas mažesnis.

Santrauka – RDBMS vs Hadoop

Šiame straipsnyje aptariamas skirtumas tarp RDBMS ir Hadoop. Pagrindinis skirtumas tarp RDBMS ir „Hadoop“yra tas, kad RDBMS saugo struktūrinius duomenis, o „Hadoop“– struktūrinius, pusiau struktūrinius ir nestruktūruotus duomenis.

Rekomenduojamas: