Prípady použitia Apache Storm



Apache Storm je populárny kvôli svojim vlastnostiam spracovania v reálnom čase a bol implementovaný práve z tohto dôvodu. Tu je niekoľko prípadov použitia Apache Storm.

Apache Storm je populárny vďaka svojim vlastnostiam spracovania v reálnom čase a mnoho organizácií ho implementovalo ako súčasť svojho systému práve z tohto dôvodu. Poďme sa pozrieť na to, ako organizácie integrujú Apache Storm.





Prípady použitia Apache Storm:

Twitter

Storm sa používa na napájanie rôznych systémov Twitter, ako sú analýzy v reálnom čase, personalizácia, vyhľadávanie, optimalizácia výnosov a mnoho ďalších. Apache Storm sa prispôsobuje zvyšku infraštruktúry Twitteru, ktorá zahŕňa databázové systémy ako Cassandra, Memcached atď., Infraštruktúru pre zasielanie správ, Mesos a monitorovacie a výstražné systémy. Plánovač izolácie spoločnosti Storm umožňuje efektívne využívať rovnaký klaster aj pre produkčné aplikácie a pre vývojové aplikácie. Poskytuje efektívny spôsob plánovania kapacity.

čo je to objekt skenera

Yahoo!
Yahoo! pracuje na platforme novej generácie, ktorá umožňuje zlúčenie veľkých dát a spracovanie s nízkou latenciou. Aj keď je Hadoop primárnou technológiou používanou tu na dávkové spracovanie, Apache Storm umožňuje streamové spracovanie udalostí používateľov, informačných kanálov obsahu a protokolov aplikácií.



Infochimps
Spoločnosť Infochimps používa server Apache Storm ako zdroj pre jednu z troch svojich cloudových dátových služieb - Data Delivery Services (DDS), ktorá využíva Storm na zabezpečenie odolného a lineárne škálovateľného podnikového zberu dát, prepravy a komplexnej cloudovej služby na spracovanie dát. . Podobne ako Hadoop, ktorý poskytuje dávkové ETL a hromadné dávkové analytické spracovanie, poskytuje DDS aj ETL v reálnom čase a rozsiahle spracovanie v reálnom čase.

Flipboard
Flipboard je jediné miesto na preskúmanie, zhromažďovanie a zdieľanie správ, ktoré vás zaujímajú. Flipboard využíva búrku pre širokú škálu služieb, ako je vyhľadávanie obsahu, analýza v reálnom čase, vlastné zdroje časopisov, atď. Apache Storm je integrovaný do infraštruktúry, ktorá obsahuje systémy ako ElasticSearch, Hadoop, HBase a HDFS, aby vytvoril vysoko škálovateľnú dátovú platformu.

Ooyala
Ooyala je súkromná spoločnosť s ručením obmedzeným, ktorá poskytuje produkty a služby online videotechnológie pre niektoré z najväčších svetových sietí, značiek a mediálnych spoločností. Ooyala má analytický nástroj, ktorý každý deň spracúva viac ako dve miliardy analytických udalostí generovaných od takmer 200 miliónov divákov po celom svete, ktorí sledujú video na prehrávači poháňanom technológiou Ooyala. Spoločnosť Ooyala využíva server Apache Storm na poskytovanie svojich zákazníkov analytike streamingu v reálnom čase týkajúcej sa správania spotrebiteľov pri sledovaní a trendov digitálneho obsahu. Storm umožňuje rýchlu ťažbu ich online video dátových súborov, aby priniesli aktuálne obchodné informácie, ako je prezeranie vzorov v reálnom čase, prispôsobené návrhy obsahu, programovacie príručky a cenné poznatky o spôsoboch zvýšenia výnosov.



Taobao
Taobao s pomocou Apache Storm vytvára štatistiku protokolov a extrahuje zo štatistík užitočné informácie v reálnom čase. Protokoly sa načítajú z perzistentných frontov správ do výleviek, spracujú sa a potom sa odovzdajú topológiám, aby sa vypočítali požadované výsledky. Počet vstupných protokolov Taobao sa každý deň pohybuje medzi 2 miliónmi až 1,5 miliardami.

Klout
Klout je aplikácia, ktorá pomocou analytiky sociálnych médií hodnotí svojich používateľov na základe sociálneho vplyvu online prostredníctvom „skóre Klout“, čo je číselná hodnota medzi 1 a 100. Klout využíva vstavanú abstrakciu Trident od Apache Storm na vytváranie zložitých topológií, ktoré prenášajú dáta zo sieťových kolektorov cez Kafku, potom sú spracované a zapísané na HDFS.

Ideme
Wega je komplexný svetový metasearch engine pre cestovanie, ktorý funguje po celom svete a používa ho nespočetné množstvo cestujúcich, aby získal viac možností platiť menej a cestovať viac. Wego porovnáva a zobrazuje letové poriadky v reálnom čase, dostupnosť hotela, cenu a zobrazuje ďalšie stránky o cestovaní po celom svete. Apache Storm tu streamuje metasearchové údaje z pridružených spoločností v reálnom čase od koncových používateľov. Koncepty topológie v službe Storm riešia problémy so súbežnosťou a zároveň im pomáhajú neúnavne integrovať, rozoberať a čistiť údaje. Nástroje poskytované v službe Storm navyše umožňujú prírastkovú aktualizáciu na vylepšenie ich údajov.

RocketFuel
Rocket Fuel dodáva poprednú platformu na nákup médií v rozsahu veľkých dát, ktorá využíva silu umelej inteligencie (AI) na rozšírenie marketingovej návratnosti investícií v digitálnych médiách. Na vrchole Stormu budujú platformu v reálnom čase, ktorá napodobňuje časovo kritické pracovné toky, ktoré už existujú v potrubí ETL založenom na Hadoop. Táto platforma sleduje v reálnom čase zobrazenia, kliknutia, konverzie, žiadosti o cenové ponuky atď.

Navsite
Spoločnosť Navsite používa server Apache Storm ako súčasť svojho systému monitorovania a auditu protokolov udalostí. Správy protokolu z tisícov serverov sa odosielajú do klastra RabbitMQ a služba Storm sa používa na porovnanie každej správy so sadou regulárnych výrazov. Ak existuje zhoda, správa sa odošle skrutke, ktorá ukladá údaje do MongoDB. Momentálne sa spracováva 5 - 10 000 správ za sekundu, avšak existujúce klastre RabbitMQ + Storm boli testované až do približne 50 000 za sekundu.

Existuje oveľa viac organizácií implementujúcich Apache Storm a očakáva sa, že sa k tejto hre pripojí ešte viac, pretože Apache Storm je naďalej lídrom v oblasti analýzy v reálnom čase.

Vyskúšajte naše .

aký je rozdiel medzi preťažením a prvoradým účinkom