Do šperkovnice som dostal dáta



Tento blog sa pokúša popísať použitie a funkcie dátového skladu a jeho význam v spoločnostiach.

Každá žena má problém so správou svojich vecí. Od oblečenia po doplnky potrebuje tú jednu vec, ktorá jej pomôže uložiť všetky svoje veci na jednom mieste. Neviem si predstaviť, že by som bol neorganizovaný a som si istý, že väčšina z vás, ktorí to čítate, by so mnou súhlasili. Prečo je také ťažké byť organizovaný? Väčšinou som bol otrhaný práve z toho dôvodu, že som obsedantne kompulzívny človek.





Dôvod, prečo som to uviedol, bol teraz ten, že som si prečítal niekoľko článkov o ukladaní dát a pripomenul som si sám seba. Rovnako ako moja základná posadnutosť mať všetky svoje veci na jednom mieste v správnom poradí, aj dnes spoločnosti očakávajú to isté. Je pravdepodobné, že vaše predstavy o skladovaní dát budú zahmlené. Existuje veľa ľudí, ktorí sú stále rovnako bezradní.

Dátové sklady sa dnes v organizáciách široko využívajú. Predpokladá sa, že v najbližších niekoľkých rokoch sa využitie bude postupne zvyšovať. V náročných časoch je veľmi dôležité prijímať inteligentné rozhodnutia a efektívna správa údajov, a to vtedy, keď dátový sklad do seba zapadá úplne dokonale. Pojem dátové sklady nie je ťažké pochopiť. Ide o vytvorenie trvalého úložného priestoru pre údaje potrebné na podporu vykazovania, analýzy a ďalších funkcií BI.



Koncept dátového skladu je jednoduchý. Dáta sa pravidelne extrahujú z aplikácií, ktoré podporujú obchodné procesy, a kopírujú sa do špeciálnych počítačov. Tam ho možno overiť, preformátovať, reorganizovať, zosumarizovať, reštrukturalizovať a doplniť údajmi z iných zdrojov (Dátový sklad je moja schránka na príslušenstvo. Rovnako ako správa mojej škály rozptýleného príslušenstva do mini škatúľ, zase uložená v jednej veľkej schránke) . Dátový sklad sa stáva hlavným zdrojom informácií pre generovanie, analýzu a prezentáciu správ prostredníctvom ad hoc správ, portálov a dashboardov. (Je pre mňa jednoduchšie vyhľadať, ktoré príslušenstvo je v ktorej krabici uložené)

Funkcie dátového skladu

1. Beží na počítačoch určených pre túto funkciu. (Moja myseľ)

2. Beží na systéme správy databáz (DBMS) (séria ďalších mini skriniek, v ktorých je uložené moje príslušenstvo)



3. Uchováva údaje na dlhú dobu. (Ukladá moje príslušenstvo na dlhú dobu)

4. Kombinuje údaje získané z mnohých zdrojov (Ukladá rad príslušenstva, ktoré boli rozptýlené na rôznych miestach).

5. Postavený na starostlivo navrhnutom dátovom modeli, ktorý transformuje produkčné dáta z vysokorýchlostného dizajnu na zadávanie údajov do podoby, ktorá podporuje vysokorýchlostné načítanie. (Moja voľba vybrať perfektne navrhnutú škatuľu, do ktorej sa zmestí všetko moje príslušenstvo, a rozlišovať medzi dobrou škatuľou a priemernou škatuľkou)

Najťažšou vecou na vytvorení dobrého dátového skladu je návrh modelu, okolo ktorého bol postavený. Je potrebné prijať rozhodnutia o názvoch, ktoré sa majú dať každému poľu, či je potrebné preformátovať každý dátový model a aké polia metaúdajov by sa mali vypočítať a pridať. Keď je dátový sklad funkčný, je dôležité, aby dátový model zostal stabilný. Ak sa tak nestane, bude treba správy vytvorené z údajov meniť vždy, keď sa zmení dátový model.

Akonáhle je dátový sklad na mieste a je dobre naplnený dátami, dobré veci začnú praskať. Niektoré z nich sú nasledujúce:

1. Generovanie plánovaných správ

2. Zabalené analytické aplikácie

3. Ad hoc podávanie správ a analýza

4. Dynamická prezentácia prostredníctvom informačných panelov

5. Schopnosť rozčlenenia

6. Dolovanie dát

7. Bezpečnosť

Tieto výhody robia z BI založeného na dátovom sklade rozhodujúci nástroj pre správu pre spoločnosti, ktoré dosiahli určitú úroveň zložitosti.

Niektoré z veľkých značiek s Data Warehouse

Apple

Spoločnosť Apple prevádzkuje systém Teradata s viacerými petabajtmi. Spoločnosť Apple využíva dátový sklad na lepšie pochopenie svojich zákazníkov naprieč produktovými skupinami. Teraz každá identifikovateľná informácia a tie interakcie, ktoré ladím, generujú množstvo údajov, ktoré vstupujú do systému, aby spoločnosť vedela, kto je kto a čo chystá.

Walmart

Maloobchodný gigant nasadil vôbec prvú terabajtovú databázu Teradata v roku 1992 a odvtedy sa o niečo zväčšila. Jeho operačný systém bol na úrovni 2,5 petabajtov od roku 2008 a je určite o míle väčší ako teraz - pravdepodobne až do dvojciferných čísel, keď si uvedomíte, že pracuje oddelene pre Walmart a Sam’s Club, ako aj ako záložný systém. Analytické úsilie v zásade pomohlo spoločnosti Walmart stať sa obrovským konsignačným obchodom.

aktívne a pasívne transformácie v informatike

ebay

eBay má zavedené dva systémy a oba sú veľké. Jej primárny dátový sklad je 9,2 petabajtov od „systému singularity“, ktorý ukladá kliknutia na webe, a ďalšie „veľké“ dáta majú viac ako 40 petabajtov. Má jednu tabuľku, ktorá má 1 bilión riadkov. Áno, je to menej ako kapacita eBay Hadoop v hodnote 50 petabajtov pridaná minulý rok, ale Teradata rýchlo upozorňuje, že všetky jej systémy podporujú dáta do a z Hadoop, takže to nie je tak, akoby eBay prevádzkoval dve úplne odlišné dáta prostrediach.

Starbucks

Od roku 1971 sa spoločnosť Starbucks Coffee Company zaviazala eticky získavať a pražiť kávu najvyššej kvality na svete. Využívajú vysoko výkonný podnikový dátový sklad obsahujúci údaje o predaji, marketingu, správe obchodov, mieste predaja, lojalite zákazníkov a dodávateľskom reťazci na podporu informovanejších obchodných rozhodnutí na podnikovej, regionálnej a obchodnej úrovni.

Tu je niekoľko zaujímavých prípadov použitia:

Spoločnosť Continental Airlines sa rozhodla, že chce byť spokojná so svojimi zákazníkmi, začala ich hodnotiť podľa životnosti a začala pre nich robiť alternatívne opatrenia, akonáhle letecká spoločnosť zistí, že lety budú meškať.

Spoločnosť pre luxusné automobily použila spoločnosť Aster Data na analýzu vzoru porúch rôznych komponentov vo svojich automobiloch. Zistilo sa, že osvetlenie, sedadlá a infotainment často zlyhali spolu (sú na rovnakom okruhu), a začal kontrolovať všetky tri, keď zákazník príde na servis na ktoromkoľvek z nich.

Prečo vám nemôže chýbať Data Warehouse?

Hodnota dátového skladu sa časom zvyšuje a oplatí sa začať ukladať všetko na jedno miesto. Oneskorenie, keď ho budete mať, vás môže stáť, pretože príležitosť využili vaši konkurenti.

1. Tvrdé úspory pochádzajú z vecí, ako je zistenie stratených zliav v záväzkoch alebo z toho, že predajcovia ponúkajú zľavy presahujúce schválené limity.

2. Konsolidácia finančných údajov v reálnom čase sa stáva praktickou a prestávajú debaty o tom, ktorý zdroj údajov je správny.

3. Náklady na IT a pracovníci zodpovední za výkazníctvo sú výrazne znížené.

4. Poskytovaním údajov z rôznych zdrojov už manažéri a riadiaci pracovníci nebudú musieť robiť obchodné rozhodnutia na základe obmedzených údajov alebo ich vnútorností.

5. Dátový sklad uchováva veľké množstvo historických údajov, aby ste mohli analyzovať rôzne časové obdobia a trendy a vytvárať tak budúce predpovede.

čo je podreťazec v jave

6. Dátový sklad pracuje v prospech toho, aby vám toľko času ušetril. Šetria čas tým, že ukladajú informácie o spoločnosti na jednom mieste. Namiesto centralizovaného umiestnenia je to lepšie.

Potrebuje vaša spoločnosť dátový sklad?

Údaje, ktoré vaša spoločnosť generuje, majú pre vaše podnikanie veľkú hodnotu. Chcete sa ubezpečiť, že všetky vaše údaje sú zabezpečené a prístupné kedykoľvek. Ale dnes dáta enormne pribúdajú a spoločnosti nachádzajú spôsob, ako ich spravovať. Dátový sklad sa v tomto prípade javí ako dobrá stávka. Skutočnou otázkou však je, či ich vaša spoločnosť skutočne potrebuje?

1. Závislosť na tabuľkách

Používanie tabuliek má veľkú hodnotu, pretože je dnes jedným z najdôležitejších obchodných nástrojov. V týchto tabuľkách je možné uložiť obrovské množstvo údajov. Problém nastáva, keď sa veľkosť dát začne zväčšovať. Každé oddelenie má tabuľky, z ktorých budete musieť načítať údaje, aby ste mohli vygenerovať prehľad. Ak je to váš prípad, môžete začať s vytváraním manuálnych prehľadov, ktoré vám môžu trvať veľa času. Keď sa to stane, dátový sklad príde na obrázok, aby to uľahčil, pretože je ťažké nájsť dáta, ktoré sú rozložené na rôznych listoch.

2. Dlhé čakacie obdobie

Ak pripravujete prehľad, len aby ste zistili, že musíte počkať, kým kolegovia poskytnú informácie zo svojich tabuliek, alebo analyzovať svoje údaje, môžete sa ocitnúť v čakaní dlhšie. Implementácia dátového skladu môže pomôcť centralizovať dáta a efektívnejšie ich sprístupniť všetkým členom tímu. Takto sa skracuje čas strávený skutočným sledovaním a komunikáciou s kolegami.

3. Nezrovnalosti v údajoch a správach

Keď vedúci tímu alebo členovia rôznych oddelení vytvárajú správy, údaje alebo zistenia sa líšia od tých vašich alebo od iných správ. Je to nielen frustrujúce, ale aj časovo náročné jeho vyriešenie, čo by mohlo viesť k nákladným chybám. Ak kedykoľvek máte pocit, že vo vašich údajoch nie sú konzistencie, možno by ste mohli premýšľať nad zaobstaraním dátového skladu.

4. Čas strávený generovaním správ

V ideálnom prípade by sme mali byť schopní vygenerovať prehľad pomocou existujúcich údajov takmer okamžite. Pri generovaní správy, ak zistíte, že musíte neustále chodiť do rôznych zdrojov, aby ste skontrolovali, či sú údaje aktualizované, alebo manuálne aktualizovať iné zdroje, si všimnete množstvo času potrebného na vypracovanie správy.

Pretože dátové sklady konsolidujú údaje, musíte sa obrátiť iba na jeden zdroj údajov. Kombinujte s tým, že je možné nastaviť mnoho dátových skladov tak, aby sa automaticky aktualizovali, ak sa zdrojové údaje aktualizujú alebo menia, a môžete tak zaručiť, že údaje, ktoré používate, sú vždy správne.

Máte na nás otázku? Uveďte ich prosím v sekcii komentárov a my sa vám ozveme.

Súvisiace príspevky: