Spracovanie veľkých dát s Apache Spark a Scala



Apache Spark sa stal veľkým pokrokom v oblasti spracovania veľkých dát.

čo je bufferedreader java

IST: 17:00 - 8:00 ráno, 17. októbra’14





PDT: 18:30 - 19:30, 16. októbra ’14

Obmedzené miesta !! Vyplňte formulár vpravo a zarezervujte si svoj slot ešte dnes.



Ahoj všetci, 18. októbra 2014 organizujeme bezplatný webinár o Apache Spark a Scala. Názov webinára je „Veľké spracovanie dát s Apache Spark a Scala“ . Na tomto webinári sa budeme venovať základným témam týkajúcich sa Apache Spark a Scala. Akékoľvek otázky alebo pochybnosti je možné objasniť počas relácie.

Témy, ktorým sa treba venovať:

  • Čo sú to veľké dáta?
  • Čo je Spark?
  • Prečo Spark?
  • Iskrový ekosystém
  • Poznámka o Scale
  • Prečo Scala?
  • Ahoj Spark - ruky

Prečo Spark?

Apache Spark je open-source klastrový výpočtový rámec pre komunitné klastre Hadoop. Vďaka svojej neprekonateľnej rýchlosti, ľahkému použitiu a sofistikovanej analýze sa kvalifikuje ako jeden z najlepších nástrojov na analýzu a spracovanie údajov pre rozsiahle údaje. Nasledujú výhody a funkcie, vďaka ktorým je Apache Spark hitom crossover pre prevádzkové aj vyšetrovacie analýzy:

  • Programy vyvinuté nad programom Spark bežia stokrát rýchlejšie ako programy vyvinuté v programe Hadoop MapReduce.
  • Spark zostavuje 80 operátorov na vysokej úrovni.
  • Streamovanie Spark umožňuje spracovanie údajov v reálnom čase.
  • GraphX ​​je knižnica pre grafické výpočty.
  • MLib je knižnica strojového učenia pre Spark.
  • Spark, ktorý je primárne napísaný v jazyku Scala, je možné vložiť do ľubovoľného operačného systému založeného na JVM, súčasne ho možno použiť aj spôsobom REPL (čítanie, hodnotenie, spracovanie a načítanie).
  • Má výkonné možnosti ukladania do pamäte cache a vytrvalosti disku.
  • Spark SQL mu umožňuje odborne vybavovať dotazy SQL
  • Apache Spark je možné nasadiť cez Apache Mesos, Yarn v HDFS, HBase, Cassandra alebo Spark Cluster Manager (vlastný správca klastrov Spark).
  • Spark simuluje funkčný štýl a zbierky API Scaly, čo je veľká výhoda pre vývojárov Scala a Java.

Potrebujete Apache Spark:

Spark prináša odvetviu obrovské výhody, pokiaľ ide o rýchlosť, rozmanitosť úloh, ktoré môže vykonávať, flexibilitu, analýzu kvalitných údajov, nákladovú efektívnosť atď., Ktoré sú potrebami dňa. Poskytuje špičkové riešenia pre analýzu veľkých dát v reálnom čase pre IT priemysel, ktoré uspokojujú rastúci dopyt zákazníkov. Analýza v reálnom čase využíva obchodné schopnosti na plné obrátky. Jeho kompatibilita s Hadoop umožňuje spoločnostiam jeho rýchle prijatie rýchlo. Sparkom naučení odborníci a vývojári sú veľmi potrební, pretože ide o relatívne novú technológiu, ktorá sa čoraz viac prijíma.