OLTP vs OLAP



Nasledujúci blog stručne hovorí o OLTP vs OLAP a rôznych prípadoch použitia.

OLTP vs OLAP

Hovorí sa, že OLTP je skôr online transakčný systém alebo systém na ukladanie údajov, kde používateľ vykonáva množstvo online transakcií pomocou dátového úložiska. Hovorí sa tiež, že sa v reálnom čase deje viac ad-hoc čítaní a zápisov.





OLAP je skôr offline úložisko dát. Je prístupnéniekoľkokrátoffline spôsobom. Napríklad sa načítajú hromadné súbory denníka a potom sa zapíšu späť do dátových súborov. Medzi bežné oblasti, kde sa používa OLAP, patria Log Jobs, Data mining Jobs atď.

O Cassandre sa hovorí, že je viac OLTP, pretože je to v reálnom čase, zatiaľ čo Hadoop je viac OLAP, pretože sa používa na analytiku a hromadné zápisy.



Prečo integrovať OLAP a OLTP?

Ak v prípade, že hľadáte najlacnejšiu cenu za rezerváciu hotelov v nasledujúcich 365 dňoch, máte tu obrovský súbor dát pre Cassandru a chcete mať odporúčanie v databáze v reálnom čase, spustí sa promo akcia na základe ceny.

V takom scenári musíme iterovať všetky záznamy a udržiavať nad nimi analytiku, čo je obrovská offline práca, ktorú treba často naštartovať. Hadoop tu prichádza do hry pre hromadné prelomenie údajov.

Ďalšou výhodou je, že môžeme prevádzkovať jeden klaster a prerušiť fungovanie iného klastra Hadoop.



Treťou výhodou je, že je možné tiež znížiť veľa prevádzkových nákladov.

Vzhľadom na scenár, v ktorom, ak sa používateľ dobre orientuje v rôznych ekosystémoch Hadoop, ako sú Hive, Pig Latin a potrebuje do nich integrovať údaje, musí byť pripojený nejaký zdroj údajov v Cassandre a pokúsiť sa spustiť Map Znížte tiež počet pracovných miest.

Medzi OLTP a OLAP je viditeľný vzor. V OLTP je menší počet zápisov, napr. Informácie o hoteli. Za predpokladu, že sa ceny budú meniť každých 5 000 krát za sekundu, môžu byť hodnoty tu viac. V takomto scenári môže existovať 1 zápis za sekundu, ale načítania by mohli byť stovky a tisíce. Takže pomer sa tu pohybuje okolo 1: 1000.

Je zaujímavým postrehom, že Cassandra sa ľahko hodí do tohto modelu, ktorý obsahuje modely, pri ktorých je čítanie a zápis rovnaké. Pokiaľ ide o OLTP, aj keď sa človek dostane do laditeľného a silného modelu konzistencie, môže vidieť milisekundovú medzeru medzi prípadnými konzistentnými modelmi a najsilnejšími konzistentnými modelmi. Cassandra sa teda môže zmestiť do OLTP.

Pri príchode na OLAP je možné vidieť rôzne vzory OLAP, čo znamená, že sa súčasne deje niekoľko zápisov. V OLAP ukladáme údaje naraz, to znamená, že všetky súbory denníka sa ukladajú do dátového úložiska a potom začneme spracovávať. Dátový vzor alebo prístupový vzor je presne opačný k typu aplikácie OLTP. Tu budú užitočné Hadoop alebo MapReduce.

Máte na nás otázku? Uveďte ich v sekcii komentárov a my sa vám ozveme.

Súvisiace príspevky:

Top 5 dôvodov, prečo sa učiť Cassandru

ako nastaviť cestu v