Absolútne! Nikdy nebol lepší čas pridať do svojho životopisu zručnosti Hadoop. Uveďme to na niekoľkých faktoch a príkladoch.
Zamysleli ste sa niekedy nad tým, čo je to za technológiou automatického označovania Facebooku? A čo sledovacie kamery, ktoré sú schopné vytvárať dokonalý obraz aj pri slabom osvetlení? Odpoveďou je Hadoop a jeho prelomové schopnosti ukladať, spracovávať a načítať údaje.
rozdiel medzi git a github
Ukladanie údajov je jedna vec, ale ich spracovanie a dopytovanie je úplne iná loptová hra. Ak je Big Data tímom Rugby, potom je Hadoop najlepším rozohrávačom, akého nájdete!
Vďaka Hadoopu je Facebook schopný ukladať všetky informácie o osobe a na jej profile poukazuje na presný čas a dátum aktivity. Všetky informácie o osobe sú veľké dáta a Hadoop ich pomáha všetky vykresliť.
Všetky dáta Hadoop sú uložené na vrchnej strane HDFS (Hadoop Distributed File System), ktorý umožňuje uloženie štruktúrovaných aj neštruktúrovaných dát. Konkurenti Hadoopu (napríklad RDBMS a Excel) môžu ukladať iba štruktúrované údaje. To je hlavný faktor, prečo je Hadoop veľkým otcom, ktorý dáva tradičným nástrojom na spracovanie údajov zabrať. Spoločnosť Hadoop vykonáva spracovanie v blízkosti údajov, zatiaľ čo program RDBMS vyžaduje, aby sa údaje prenášali cez sieť cez I / O, aby sa mohli spracovať rovnaké údaje.
Podnet na zamyslenie: Môže Hadoop predpovedať výsledky situácie na základe súboru údajov?
Tento graf ukazuje exponenciálny rast údajov v priebehu rokov. Keď sa na to pozriete bližšie a všimnete si, že neštruktúrované dáta tvoria 90% všetkých dát na svete. Jednoducho použite princíp dopytu a ponuky a môžeme si uvedomiť, že čoraz viac neštruktúrovaných údajov, ktoré kolujú okolo, vedie iba k profesionálom, ktorí tieto údaje dokážu opraviť. To je dostatočný dôvod na to, aby si človek hľadal prácu zaoberajúcu sa neštruktúrovanými dátami alias Big Data. Nepochybujte o tom, že je ten pravý čas naučiť sa Hadoop.
Aký efektívny je v skutočnosti Hadoop v porovnaní s RDBMS?
Hadoop zrazí akýkoľvek ďalší nástroj na spracovanie údajov priamo z parku. Programy RDBMS a Excel môžu byť efektívne pri správe údajov, ktoré nepresahujú niekoľko sto hárkov programu Excel, ale čo tisíc takýchto súborov, ktoré je potrebné udržiavať? Vráťme sa opäť k príkladu z Facebooku. Protokol údajov obsahujúci podrobnosti o aktivite používateľa Facebooku nie je možné uložiť v programe Excel, prinajmenšom nie všetky historické údaje používateľa z obdobia pred desaťročiami. Aj v Hadoope môžu byť dáta voľne štruktúrované, ale RDBMS vyžaduje, aby boli dáta konzistentnejšie a v rozpoznateľnom formáte.
java cast zdvojnásobiť na int
Pozrite sa na porovnanie medzi RDBMS a Hadoop a sami budete vedieť, ktoré ceny sú lepšie.
Mám pre vás jednu záverečnú štatistiku, ktorá utesní všetky pochybnosti o tom, či je Hadoop dobrou voľbou v kariéreľad.
Tento graf je ilustráciou rastúceho dopytu po odborníkoch spoločnosti Hadoop a bude stúpať až v nasledujúcich týždňoch.
Vy a ja bohužiaľ nemôžeme zmeniť technológiu. V najlepšom prípade dokážeme držať krok s ním, naučiť sa vyvíjajúce sa technológie a stať sa pre naše pracoviská nepostrádateľnými. Je správny čas naučiť sa Hadoop a zviesť sa na vlne veľkých dát.
Máte na nás otázku? Uveďte to prosím v sekcii komentárov a my sa vám ozveme.
Súvisiace príspevky:
aký je najlepší java ide