Proces prediktívnej analýzy v Business Analytics s R.



Blog poskytuje krátku predstavu o procese prediktívnej analýzy v Business Analytics s R.

Typický proces modelovania:

V typickom procese modelovania je dôležité začať vytvárať hypotézu. Je prijatá žiadosť o ponuku (RFP) a je zostavená hypotéza.





python čo je __init__
  1. Určite správny zdroj údajov - Tu môže zákazník uviesť zdroj údajov, ak nie, musíme hľadať zdroj údajov. Vzhľadom na scenár, v ktorom sa snažíme vyhodnotiť, kto by vo voľbách zvíťazil, sa vykonáva verejná analýza údajov so zdrojmi, ktoré zahŕňajú sociálne médiá, spravodajské kanály alebo verejnú mienku. Musíme tiež pochopiť množstvo údajov potrebných na analýzu problému. V tomto prípade zvyčajne hľadáme veľké vzorky, pretože ide o volebný prípad. Na druhej strane, ak sa vykoná analýza v zdravotníctve, je ťažké vyhľadať veľkú populáciu, pretože existuje možnosť, že nebude dostatok ľudí na overenie hypotézy. Veľmi dôležitá je tiež kvalita údajov.
  2. Extrahujte údaje - Napríklad, ak odoberieme vzorku populácie, môžeme sa zamerať na atribúty, ako je vysoký príjem, nízky príjem, vek, pracujúca populácia (mimo pracoviska / na mieste), obyvatelia, NRI, pokrytie nemocníc atď., Aby sme mohli zahájiť štúdiu . Tu nebudeme možno potrebovať toľko atribútov pre hypotézu. Chápeme, že atribúty, ako napríklad vysoký a nízky príjem, nemusia byť faktorom, ktorý prispieva k rozhodovaniu o tom, kto vyhrá voľby. Ale vek môže zmeniť, pretože dá priamy počet, koľko ľudí bude voliť. Mnohokrát môžeme vylúčiť menej používané atribúty alebo zahrnúť atribúty, ktoré sú užitočné. Mohlo by sa to pokaziť v oboch prípadoch. Z tohto dôvodu je analytika výzvou.
  3. Masírujte údaje, aby sa zmestili do nástroja - Je to tak preto, lebo nie všetky nástroje dokážu prijať všetky údaje. Niektoré nástroje akceptujú iba údaje vo formáte CSV alebo Excel. Nedostatok nástrojov je výzvou.
  4. Spustite analýzu - Túto operáciu je možné vykonať pomocou mnohých analytických techník.
  5. Vyvodiť závery - Analýza udáva presnejšie čísla. Je však na užívateľovi, aby z týchto čísel vyvodil závery. Napríklad, ak je to 10% alebo 20%, musíme pochopiť, čo to znamená? Odvodzuje to koreláciu medzi atribútom A a atribútom B?
  6. Implementovať výsledky - Je dôležité implementovať závery, aby ste videli výsledky v podnikaní. Možno napríklad vyvodiť záver, že „Ľudia si kupujú dáždnik v období dažďov“ čo môže mať za následok viac podnikania. Tu musíme zaviesť záver, kde urobíme dáždnik, dostupný v obchodoch, ale potom to môže mať problémy s riadením. V okamihu, keď štatistika prinesie výsledok, implementácia sa môže pokaziť.
  7. Monitorujte pokrok - Posledným krokom je monitorovanie. Dôležitú úlohu tu zohráva monitorovanie. Monitorovanie sa môže pokaziť, pretože len málo organizácií chce monitorovať pokrok, a považuje sa to za zanedbateľný krok. Monitorovanie je však dôležité, pretože dokážeme pochopiť, či sa náš výskum a závery uberajú správnym smerom.

Skontrolujte tiež tento článokKorelácia neznamená Príčinná súvislosťktorý poskytuje pohľad na to, ako sa môžu analytici pokaziť. Dôležitým bodom, ktorý je potrebné poznamenať v tomto grafe, je, že spustenie analýzy je jediným krokom, za ktorý je stroj zodpovedný, a nad rámec toho až po človeka, ktorý nakoniec určí, ako sa bude výskum uskutočňovať.

Máte na nás otázku? Uveďte ich v sekcii komentárov a my sa vám ozveme.



riadenie obstarávania v projektovom manažmente

Súvisiace príspevky: