Rozdíl mezi RDBMS a Hadoop

klíčový rozdíl mezi RDBMS a Hadoop je to RDBMS ukládá strukturovaná data, zatímco Hadoop ukládá strukturovaná, polostrukturovaná a nestrukturovaná data.

RDBMS je systém správy databází založený na relačním modelu. Hadoop je software pro ukládání dat a spouštění aplikací na klastrech komoditního hardwaru.

OBSAH

1. Přehled a klíčový rozdíl
2. Co je to RDBMS
3. Co je Hadoop
4. Porovnání bok po boku - RDBMS vs Hadoop v tabulkové formě
5. Shrnutí

Co je to RDBMS?

RDBMS znamená Relational Database Management System založený na relačním modelu. V RDBMS se tabulky používají k ukládání dat a klíče a indexy pomáhají propojit tabulky. Tabulka je kolekce datových prvků a jsou to entity. Obsahuje řádky a sloupce. Řádky představují jeden záznam v tabulce. Sloupce představují atributy.

Například prodejní databáze může mít entity zákazníků a produktů. Zákazník může mít atributy, jako je customer_id, jméno, adresa, phone_no. Položka může mít atributy jako product_id, name atd. Primární klíč tabulky zákazníků je customer_id, zatímco primární klíč tabulky produktů je product_id. Umístění product_id do tabulky zákazníků jako cizího klíče spojuje tyto dvě entity. Tabulky jsou také vzájemně propojeny. Poskytují integritu dat, normalizaci a mnoho dalších. Málo běžných RDBMS je MySQL, MSSQL a Oracle. Pro dotazování používají SQL.

Co je Hadoop?

Hadoop je open source framework Apache napsaný v Javě. Pomáhá ukládat a zpracovávat velké množství dat v klastrech počítačů pomocí jednoduchých programovacích modelů. Hlavním cílem Hadoopu je ukládat a zpracovávat Big Data, což se týká velkého množství komplexních dat. Propustnost Hadoopu, což je schopnost zpracovat objem dat v určitém časovém období, je vysoká.

V architektuře Hadoop jsou čtyři moduly. Jsou to běžné Hadoop, YARN, Hadoop Distributed File System (HDFS) a Hadoop MapReduce. Společný modul obsahuje knihovny a obslužné programy Java. Má také soubory ke spuštění Hadoop. Hadoop YARN provádí plánování úloh a správu prostředků klastru.

Distribuovaný systém souborů Hadoop (HDFS) je dále úložný systém Hadoop. Používá architekturu master-slave. Hlavní uzel je NameNode a spravuje metadata souborového systému. Ostatní počítače jsou podřízené uzly nebo DataNodes. Ukládají skutečná data. Na druhou stranu Hadoop MapReduce provádí distribuovaný výpočet. Má algoritmy pro zpracování dat. V HDFS má hlavní uzel sledovač úloh. Spouští mapy snižující úlohy na podřízených uzlech. Pro každý podřízený uzel existuje nástroj Sledování úloh, který dokončuje zpracování dat a odesílá výsledek zpět do hlavního uzlu. Hadoop celkově poskytuje masivní ukládání dat s vysokým výkonem zpracování.

Jaký je rozdíl mezi RDBMS a Hadoop?

RDBMS vs Hadoop

RDBMS je systémový software pro vytváření a správu databází založených na relačním modelu. Hadoop je kolekce softwaru s otevřeným zdrojovým kódem, který spojuje mnoho počítačů za účelem řešení problémů týkajících se velkého množství dat a výpočtu.
 Odrůda dat
RDBMS ukládá strukturovaná data. Hadoop ukládá strukturovaná, polostrukturovaná a nestrukturovaná data.
Datové úložiště
RDBMS ukládá průměrné množství dat. Hadoop ukládá velké množství dat než RDBMS.
 Rychlost
V RDBMS jsou čtení rychlé. V Hadoopu jsou čtení a zápisy rychlé.
Škálovatelnost
RDBMS má vertikální škálovatelnost. Hadoop má horizontální škálovatelnost.
Hardware
RDBMS používají špičkové servery. Hadoop používá komoditní hardware.
  Propustnost
Propustnost RDBMS je vyšší. Propustnost Hadoopu je nižší.

Shrnutí - RDBMS vs Hadoop

Tento článek pojednává o rozdílu mezi RDBMS a Hadoop. Klíčový rozdíl mezi RDBMS a Hadoop je v tom, že RDBMS ukládá strukturovaná data, zatímco Hadoop ukládá strukturovaná, polostrukturovaná a nestrukturovaná data.

Odkaz:

1.Cvičení Bod. "Koncepty SQL RDBMS." , Výukový program Point, 8. ledna 2018. K dispozici zde  
2.Cvičení Bod. "Výukový program Hadoop." , Výukový program Point, 8. ledna 2018. K dispozici zde  

Obrázek se svolením:

1.'8552968000'by Intel Free Press (CC BY-SA 2.0) přes Flickr