Úlové dátové modely



Dátové modely Úlu obsahujú nasledujúce komponenty, ako sú databázy, tabuľky, oddiely a segmenty alebo klastre. Úľ podporuje primitívne typy, ako sú celé čísla, plaváky, štvorhry a reťazce.

Hive je systém dátových skladov pre Hadoop, ktorý umožňuje ľahkú sumarizáciu údajov, ad-hoc dotazy a analýzu veľkých súborov dát uložených v súborových systémoch kompatibilných s Hadoop. Úly štruktúrujte údaje do dobre pochopených databázových konceptov, ako sú tabuľky, riadky, stĺpce a oddiely. Podporuje primitívne typy ako celé čísla, plaváky, štvorhry a struny. Hive tiež podporuje asociatívne polia, zoznamy, štruktúry a rozhranie Serialize and Deserialized API sa používa na presun údajov do tabuliek a z tabuliek.





ako používať python anakonda

Pozrime sa podrobne na dátové modely úľov

Úlové dátové modely:

Úlové dátové modely obsahujú nasledujúce komponenty:



  • Databázy
  • Tabuľky
  • Priečky
  • Vedrá alebo zhluky

Priečky:

Oddiel znamená rozdelenie tabuľky na hrubozrnné časti na základe hodnoty stĺpca oddielu, napríklad „údajov“. Vďaka tomu je rýchlejšie vykonávanie dotazov na kúsky údajov

Java ako ukončiť program

Úlové dátové modely

Aká je teda funkcia oddielu? Kľúče oddielu určujú, ako sa ukladajú údaje. Tu každá jedinečná hodnota kľúča oddielu definuje oddiel tabuľky. Pre väčšie pohodlie sú oddiely pomenované po dátumoch. Je to podobné ako ‘Block Splitting’ v HDFS.



Vedrá:

Vedrá poskytujú ďalšiu štruktúru údajom, ktoré sa dajú použiť na efektívne dotazy. Spojenie dvoch tabuliek, ktoré sú umiestnené v rovnakých stĺpcoch, vrátane stĺpca spojenia, je možné implementovať ako spojenie na strane mapy. Bucketing pomocou použitého ID znamená, že môžeme rýchlo vyhodnotiť dopyt založený na používateľoch jeho spustením na randomizovanej vzorke z celkového počtu používateľov.

Máte na nás otázku? Uveďte ich prosím v sekcii komentárov a my sa vám ozveme.

Súvisiace príspevky:

zaokrúhlené dvojité na int java

Užitočné príkazy úľa