Techniky modelovania v Business Analytics s R.



Tento blog poskytuje krátke predstavenie modelovacích techník v nástroji Business Analytics s R.

Rôzne techniky modelovania:

Akýkoľvek problém môžeme rozdeliť na menšie procesy:





Klasifikácia - je miesto, kde klasifikujeme údaje. Napr. choroby všetky choroby vykazujú určité správanie a môžeme ich ďalej klasifikovať.

Napríklad: choroby znižujúce imunitu, choroby, ktoré spôsobujú bolesť hlavy atď.



Regresia - zahŕňa zisťovanie vzťahu medzi viacerými premennými.

Napríklad: ako váha človeka súvisí s jeho výškou.

koľko je 6 spôsobov použitia tohto kľúčového slova?

AnomolyDetekcia - je v podstate fluktuácia.



Napríklad: V prípade vysokého napätia alebo nízkeho napätia.

Ďalším príkladom môže byť regulované správanie, ktoré spočíva v jazde na pravej alebo ľavej strane podľa krajiny. Anomoliou tu je niekto, kto jazdí opačne.

Ďalším príkladom môže byť narušenie siete. Tu sa autentifikovaný užívateľ prihlási na web vašej spoločnosti a potom, ak sa prihlási niekto neautentizovaný, jedná sa oAn0moly.

Dôležitosť atribútu - V zásade poskytuje viac atribútov, ako je výška, váha, teplota, tep. Je potrebné poznamenať, že všetky tieto atribúty sú pre úlohu dôležité.

prepísanie a preťaženie v Jave

Napríklad: Niekto sa snaží predpovedať, v akom čase sa človek dostane do kancelárie. Každý atribút hrá dôležitú úlohu, ale nie všetky atribúty sú dôležité.

Asociačné pravidlá - Zjednodušene povedané, je to analyzovať alebo predpovedať ďalšie správanie, ktoré sa bude točiť okolo modulu odporúčaní.

Napríklad: Osoba kupujúca chlieb si môže kúpiť aj mlieko. Ak analyzujeme minulé nákupné správanie, všetky položky v košíku majú vzťah. V takom prípade by mohla existovať pravdepodobnosť, že osoba kupujúca chlieb bude kupovať aj mlieko.

Zhlukovanie - Je to jedna z najstarších techník v štatistike. V skutočnosti možno vždy modelovať akýkoľvek problém, či už ide o klasifikáciu alebo zoskupenie, čo znamená zoskupenie podobných entít.

Napríklad:

1) Vezmite kôš s jablkami a pomarančmi, v ktorom môžeme oddeliť jablká od pomarančov.

2) Dôležitým prípadom použitia zoskupovania je zdravotná starostlivosť. Takmer všetky štatistiky a analýzy sa začali prípadmi použitia zdravotnej starostlivosti. Aby sme to prehĺbili, existuje pojem zoskupenia, ktorý sa nazýva kohorty (ľudia s podobnými chorobami), aby ich bolo možné študovať oddelene od existujúcich zákazníkov. Napríklad, ak 10 ľudí trpí horúčkou a ďalších 10 ľudí bolesťami hlavy, nájdeme to, čo je medzi nimi bežné, a vygenerujeme liek.

Extrakcia funkcií - Pri presnosti extrakcie prvkov je platnosť a zlyhanie celkom relevantné. Inými slovami, extrakciu prvkov možno nazvať rozpoznávaním vzorov.

predpoklady naučiť sa strojové učenie

Napríklad:

Keď používateľ vo vyhľadávaní Google zadá výraz, dospeje k výsledkom. Teraz si treba položiť dôležitú otázku: Ako to, ktorá stránka je pre daný výraz relevantná a nerelevantná? Na to je možné odpovedať extrakciou funkcií a rozpoznávaním vzorov, kde sú pridané výrazné prvky. Povedzme, že je daná fotografia, niektoré fotoaparáty detekujú tváre, zvýraznením tváre vytvárajú nádherné obrázky, ktoré tiež využívajú rozpoznávanie funkcií.

Učenie pod dohľadom vs Učenie bez dozoru

do) Predikčná kategória - Medzi techniky patrí regresia, logistika, neurónové siete a rozhodovacie stromy. Niektoré príklady zahŕňajú detekciu podvodu (keď sa počítač dozvie a predikuje ďalší podvod z predchádzajúcej histórie podvodov). Pri učení bez dozoru nemožno na príkladoch predpovedať, pretože neexistujú historické údaje.

b) Klasifikačná kategória - Na príklade, či je transakcia podvodná alebo nie, vstupuje do klasifikačnej kategórie. Tu vezmeme historické údaje a klasifikujeme ich pomocou rozhodovacích stromov alebo v prípade, že nebudeme brať vôbec žiadne historické údaje, začneme priamo od údajov a pokúsime sa využívať funkcie sami. Napríklad, ak potrebujeme poznať zamestnancov, ktorí pravdepodobne odídu z organizácie alebo zostanú. V prípade, že ide o novú organizáciu, kde nemôžeme použiť historické údaje, môžeme na extrakciu údajov kedykoľvek použiť klastrovanie.

c) Kategória prieskumu - Toto je priama metóda, ktorá prichádza s tým, čo znamenajú veľké dáta. Pri učení bez dozoru sa to nazýva základné komponenty a zhlukovanie.

d) Kategória záujmov - tu je zahrnutých viac prvkov, ako je krížový predaj / predaj, analýza trhového košíka. V analýze koša nie je učenie pod dohľadom, pretože nie sú k dispozícii žiadne historické údaje. Berieme teda dáta priamo a nachádzame asociácie, sekvenovanie a faktorovú analýzu.

Máte na nás otázku? Uveďte ich v sekcii komentárov a my sa vám ozveme.

Súvisiace príspevky: