Aké sú kľúčové terminológie v bezpečnosti Hadoop?



Tento blog Edureka vám pomôže s podrobnými a komplexnými znalosťami o bezpečnosti hadoop, ktorá sa implementuje v reálnom čase.

je hlavným problémom pri zaobchádzaní s dôvernými údajmi. rovnakému problému čelí aj to, že je v oblasti spracovania údajov špičkovým. Nemá vlastné vyhradené zabezpečenie. Poďme pochopiť, ako sa týmto spôsobom vyriešil problém Zabezpečenie Hadoop článok.

Prečo potrebujeme zabezpečenie Hadoop?

hadoop-security-preco je hadoop bezpecnost dolezita





je najsilnejší, najsilnejší a vysoko škálovateľný rámec pre spracovanie veľkých dát, ktorý je dostatočne schopný na to kríza petabajtov dát S ľahkosťou. Vďaka svojim neprekonateľným schopnostiam začal v tom čase Hadoop používať každý obchodný sektor, zdravotníctvo, vojenské a finančné oddelenia.

Hadoop začal získavať popularitu. To je, keď vývojári Hadoop našli monumentálny nesprávny výpočet. Spoločnosti Hadoop chýbal špecializovaný bezpečnostný softvér v jej vnútri. To ovplyvnilo mnoho oblastí, kde sa Hadoop používal.



prečo potrebujeme serializáciu v Jave
  • Viacero obchodných sektorov

  • Národná bezpečnosť

  • Zdravotnícke a lekárske oddelenia



  • Sociálne médiá

  • Vojenské

Vyššie uvedené oblasti sú hlavnými používateľmi Hadoopu. Teraz, Bezpečnosť je hlavný skok, ktorý musí spoločnosť Hadoop urobiť.

Čo je zabezpečenie Hadoop?

Zabezpečenie Hadoop je všeobecne definovaný ako postup k zabezpečiť jednotka dátových úložísk Hadoop tým, že ponúka prakticky nepreniknuteľnú stenu bezpečnosti proti akejkoľvek potenciálnej kybernetickej hrozbe. Spoločnosť Hadoop dosahuje tento vysoko kvalitný bezpečnostný múr nasledujúcim spôsobom bezpečnostný protokol.

Overenie

Overenie je prvá fáza, kedy sa overujú prihlasovacie údaje používateľa. Poverenia zvyčajne zahŕňajú vyhradené údaje používateľa Užívateľské meno a a tajné heslo. Zadanéprihlasovacie údaje sa skontrolujú podľa dostupných podrobností v bezpečnostnej databáze. Ak bude platný, bude ním používateľ overený.

Povolenie

Povolenie je druhou fázou, v ktorej sa systém dostane k rozhodnutiu, či používateľovi poskytne povolenie, prístup k údajom alebo nie. Je založený na vopred určenom zozname riadenia prístupu. Dôvernéinformácie sú chránené a iba oprávnený personál má prístup.

Auditovanie

Auditovanie je posledná fáza, jednoducho sleduje operácie, ktoré vykonáva autentifikovaný užívateľ počas obdobia, v ktorom bol prihlásený do klastra. Toto jevýhradne pre bezpečnosť iba na účely.

Typy zabezpečenia Hadoop

  • Zabezpečenie Kerberos

Kerberos je jedným z popredných protokolov sieťovej autentifikácie navrhnutých tak, aby poskytovali výkonné overovacie služby obom Server a Konce klienta cez Tajný kľúč kryptografické techniky. Je preukázané, že je vysoko bezpečné, pretože počas celej relácie používa šifrované lístky na službu.

  • Šifrovanie HDFS

Šifrovanie HDFS je impozantný pokrok, ktorý spoločnosť Hadoop kedy prijala. Tu sú údaje z zdroj do cieľ (HDFS) sa úplne zašifruje. Tento postup nevyžaduje, aby sa vykonali akékoľvek zmeny v pôvodnej aplikácii Hadoop, ktoré vykonajú zákazník ako jediný oprávnený personál prístup dáta.

  • Šifrovanie prevádzky

Šifrovanie prevádzky nie je nikto iný ako HTTPS (HyperText Transfer Protocol Secure). Tento postup sa používa na zabezpečenie prenosu údajov, z webovej stránky rovnako ako aj prenos údajov na webovú stránku . Mnoho brán online bankovníctva používa túto metódu na zabezpečenie transakcií cez a Bezpečnostné osvedčenie

  • Povolenia súborov a adresárov HDFS

Povolenia adresára súborov HDFS práca v jednoduchom POSIX formát. The Čítať a Napíš povolenia sú poskytované ako r a s resp. Povolenia pre server Super užívateľ a Zákazník sú stanovené inak na základe dôvernosti spisu.

Kerberos

Kerberos je jednou z najjednoduchších a najbezpečnejších sietí autentifikačný protokol používa Hadoop na zabezpečenie svojich údajov a sietí. Vynašiel to S. Hlavným cieľom protokolu Kerberos je eliminovať potrebu výmeny hesiel v sieti a tiež zabezpečiť sieť pred akýmkoľvek potenciálnym kybernetické čuchanie.

Aby sme porozumeli terminológii protokolu Kerberos, najskôr sa musíme dozvedieť o komponentoch softvéru Kerberos.

KDC alebo Centrum distribúcie kľúčov je srdcom protokolu Kerberos. Skladá sa hlavne z troch zložiek. Menovite:

  • Databáza

The databázy ukladá prihlasovacie údaje používateľa ako meno používateľa a príslušné heslá. Uchováva tiež privilégiá prístupových práv poskytnuté používateľovi. Jednotka Kerberos KDC tiež ukladá ďalšie informácie ako Šifrovací kľúč, Platnosť lístka atď.

  • Autentifikačný server

Zadané poverenia používateľa budú skontrolované krížovou kontrolou. Ak je platný, Autentifikačný server poskytne TGT alebo Generácia lístka. TGT je možné vygenerovať, iba ak používateľ vstúpi platné poverenia.

  • Server udeľujúci lístky

Ďalšou etapou je TGS alebo Server udeľujúci lístky. Je to v podstate aplikačný server KDC, ktorý vám poskytne Služobný lístok. Servisný lístok je vyžadovaný používateľom pri komunikácii s Hadoop a získaní služby, ktorú potrebuje, alebo pri vykonaní operácie na Hadoop.

Kerberos môžete nainštalovať nasledujúcim príkazom:

sudo apt-get nainštalovať krb5-kdc krb5-admin-server

Teraz predpokladajme, že si prajete získať prístup ku klastru Hadoop zabezpečenému protokolom Kerberos. Ak chcete získať prístup ku klastru Hadoop, musíte prejsť nasledujúcimi fázami, ako je to popísané v nasledujúcich krokoch:

  • Musíte získať Overenie klastra Hadoop. Môžete sa overiť vykonaním Kinit velenie na klastri Hadoop.

kinit root / admin
  • The Kinit Vykonanie príkazu vás presmeruje na Prihlasovacie údaje stránka, na ktorej sa očakáva, že vstúpite do svojej meno používateľa a heslo.

  • The Kinit pošle Žiadosť o overenie do Autentifikačný server.

  • Ak sú vaše poverenia platný, potom autentifikačný server odpovie a Generácia lístkov (TGT).

  • The Kinit uloží TGT vo vašich povereniach Cache Pamäť. Nasledujúci príkaz vám pomôže prečítať vaše prihlasovacie údaje

klist
  • Teraz ste úspešne prihlásení do KDS.

  • Pred prístupom do klastra Hadoop musíte nastaviť klientov Kerberos. urobíte to pomocou nasledujúceho príkazu.

sudo apt-get nainštalovať krb5-užívateľ libpam-krb5 libpam-ccreds auth-client-config
  • Teraz sa pokúsite vykonať a Velenie Hadoop. Toto je Hadoop klient.

  • The Hadoop klient použije vaše TGT a žiadosti TGS na schválenie.

  • The TGS schváli žiadosť a poskytne vám Servisný lístok.

  • Toto Servisný lístok bude uložený v pamäti Hadoop klient.

  • Toto Servisný lístok použije klient Hadoop na komunikovať s Namenode Hadoop.

  • The Namenode sa stotožní s Lístok.

  • Obaja Lístok na namenode a Hadoop Client Služobné lístky budú navzájom skontrolované.

    návod na integráciu serverov sql
  • Obaja sú si istí, že komunikujú s autentifikovaná entita.

  • Toto sa volá Vzájomné overovanie.

  • Ďalšia fáza je Povolenie. Namenode vám poskytne služby za ktoré ste dostali povolenie.

  • Nakoniec je posledná etapa Auditovanie. Tu je váš činnosť bude prihlásený pre bezpečnostné účely.

Týmto sa dostávame na koniec tohto článku . Dúfam, že som vniesol trochu svetla do vašich vedomostí o a Zabezpečenie Hadoop.

Teraz, keď ste pochopili Hadoop a jeho bezpečnosť, pozrite sa na autor: Edureka, dôveryhodná online vzdelávacia spoločnosť so sieťou viac ako 250 000 spokojných študentov rozmiestnených po celom svete. Kurz certifikácie Edureka Big Data Hadoop Certification Training pomáha študentom stať sa odborníkmi na HDFS, Yarn, MapReduce , Pig, Hive, HBase, Oozie, Flume a Sqoop pomocou prípadov použitia v reálnom čase v oblasti maloobchodu, sociálnych médií, letectva, cestovného ruchu, financií.

Ak máte akékoľvek otázky týkajúce sa tohto „Zabezpečenie Hadoop“ článku, potom nám prosím napíšte do sekcie komentárov nižšie a my vám odpovieme čo najskôr.