Oracle na HDFS pomocou Sqoop



Oracle na HDFS pomocou Sqoop - Pozrite sa na kroky pre Oracle na HDFS pomocou Sqoop.

1. Stiahnite si Oracle Expresss Edition z nižšie uvedeného odkazu a rozbaľte ho.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. Po rozbalení nájdete spustiteľný súbor verzie Oracle XE Edition, ako na obrázku nižšie.

3. Dvakrát kliknite na OracleXEUniv, aby ste nainštalovali databázu Oracle do vášho systému, a kliknite na Run.



4. Kliknite na Ďalej

5. Prijmite licenčnú zmluvu a kliknite na Ďalej.

6. V predvolenom nastavení bude Oracle brať systém ako názov databázy. Zadajme heslo

pre túto databázu.

Zadajte heslo -> systém

Potvrdiť heslo -> systém

Kliknite na Ďalej:

7. Kliknite na Inštalovať

8. Kliknite na Dokončiť

9. Upravme súbor sqlnet.ora v priečinku

C: oraclexepporacleproduct.2.0serverNETWORKADMIN

Po otvorení nájdete nasledujúci obsah.

Upravte to ako na snímke nižšie

10. Začnime príkazový riadok SQL systému Oracle.

Prejdite na ponuku Štart -> Všetky programy -> Oracle Database 10g Express Edition ->

Spustite príkazový riadok SQL a dvakrát na neho kliknite.

11. Získate Cli fo Oracle Database.

12. Pripojme sa k databáze Oracle.

Užívateľské meno: systém

Heslo: systém

Zobrazí sa správa úspešne pripojená.

13. Vytvorme jednoduchú tabuľku.

Príkaz:

vytvoriť tabuľku emp (identifikačné číslo)

14. Vložme doň nejaké hodnoty pomocou príkazu Vložiť.

Príkaz:

vložiť do emp hodnôt (2)

15. Dajte nám skontrolovať, či sú údaje vložené do tabuľky pomocou príkazu Select.

Príkaz:

vyberte * z emp

16. Zadajme údaje.

Príkaz:

spáchať

17. Na import údajov z Oracle Database do Sqoop je potrebné pridať

Oracle Connector (ojdbc6_g.jar).

Nádobu si môžete stiahnuť z nasledujúceho odkazu.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18. Otvorte Cloudera cdh3 a pomocou FileZilla presuňte konektor Oracle do Cloudera cdh3 (na plochu).

Použite nasledujúci odkaz na pochopenie toho, ako presunúť súbor z Windows do cloudera cdh3 vm.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19. Keď je na serveri Cloudera Cdh3 Desktop konektor Oracle, presuňte ho do priečinka lib na serveri

sqoop vykonaním nasledujúceho príkazu:

Príkaz:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

čo je skener v jave

20. Zmeňte adresár na Sqoop vykonaním nasledujúceho príkazu:

Príkaz:

cd / usr / lib / sqoop /

21. V systéme Windows otvorte príkazový riadok (CMD) a skontrolujte IPv4 adresa

vykonaním

pod príkazom:

Príkaz:

ipconfig

22. Importujte údaje emp tabuľky z databázy Oracle do súboru hdfs vykonaním nižšie uvedeného

príkaz:

Povinné položky pre príkaz:

Adresa IPv4 - vaša adresa IPv4. V mojom prípade je to 192.168.46.1

Názov databázy - systém

Názov tabuľky - emp

Používateľské meno - systém

Heslo - systém

Výstupný adresár - môže to byť akýkoľvek. Použil som sqoopoutput1

Príkaz:

sudo bin / sqoop import –connect jdbc: oracle: thin: system /

system@192.168.46.1: 1521: vozidlo

–Username system -P –tabulka system.emp –stĺpce „ID“ –target-dir /

sqoopoutput1 -m 1

23. Po úspešnom vykonaní príkazu dostanete správu

že načítané záznamy ako na nasledujúcom obrázku.

24. Otvorte prehľadávač a prejdite na adresu URL uvedenú nižšie:

URL: http: // localhost: 50070 / dfshealth.jsp

Kliknite na Prehľadávať súborový systém

25. Kliknite na adresár sqoopoutput1

26. Kliknite na súbor part-m-00000:

27. Nižšie sú uvedené údaje, ktoré boli importované z databázy Oracle:

Blahoželáme! Úspešne ste importovali údaje z databázy Oracle

na HDFS pomocou Sqoop ..!