Čo je to neurónová sieť? Úvod do umelých neurónových sietí



Tento blog o neurónových sieťach vám predstaví základné pojmy neurónových sietí a ich riešenie pri riešení zložitých problémov založených na údajoch.

S pokrokom v strojovom učení sa išiel po vysokej ceste. Deep Learning sa považuje za najpokročilejšiu technológiu postavenú na riešenie zložitých problémov, pri ktorých sa využívajú obrovské množiny údajov. Tento blog o neurónových sieťach vám predstaví základné pojmy neurónových sietí a ich riešenie pri riešení zložitých problémov založených na údajoch.

Ak chcete získať podrobné informácie o umelej inteligencii a hlbokom učení, môžete sa zaregistrovať naživo od spoločnosti Edureka s nepretržitou podporou a doživotným prístupom.





Tu je zoznam tém, ktorým sa bude táto téma venovať Blog:

  1. Čo je to neurónová sieť?
  2. Čo je to Deep Learning?
  3. Rozdiel medzi AI, ML a DL
  4. Need for Deep Learning
  5. Prípad použitia Deep Learning
  6. Ako fungujú neurónové siete?
  7. Neurónová sieť vysvetlená na príklade

Jednoduchá definícia neurónovej siete

Modelované v súlade s ľudským mozgom, a Neurónová sieť bola postavená tak, aby napodobňovala funkčnosť ľudského mozgu . Ľudský mozog je neurónová sieť tvorená viacerými neurónmi, podobne ako umelá neurónová sieť (ANN) je tvorená viacerými perceptrónmi (vysvetlené ďalej).



Neurónová sieť - Čo je to neurónová sieť - Edureka

Neurónová sieť sa skladá z troch dôležitých vrstiev:

  • Vstupná vrstva: Ako naznačuje názov, táto vrstva prijíma všetky vstupy poskytované programátorom.
  • Skrytá vrstva: Medzi vstupnou a výstupnou vrstvou je skupina vrstiev známa ako Skryté vrstvy. V tejto vrstve sa vykonávajú výpočty, ktorých výsledkom je výstup.
  • Výstupná vrstva: Vstupy prechádzajú sériou transformácií cez skrytú vrstvu, ktorá nakoniec vedie k výstupu, ktorý sa cez ňu dodáva vrstva.

Predtým, ako sa dostaneme do hĺbky fungovania neurónovej siete, poďme pochopiť, čo je Deep Learning.



Čo je to Deep Learning?

Deep Learning je pokročilá oblasť strojového učenia, ktorá využíva koncepcie neurónových sietí na riešenie vysoko výpočtových prípadov použitia, ktoré zahŕňajú analýzu multidimenzionálnych údajov. Automatizuje proces extrakcie funkcií a zaisťuje minimálny zásah človeka.

Čo to vlastne Deep Learning je?

Deep Learning je pokročilý podoblasť strojového učenia, ktorá využíva algoritmy inšpirované štruktúrou a funkciou mozgu s názvom Artificial Neural Networks.

Rozdiel medzi AI, ML a DL (Artificial Intelligence vs Machine Learning vs. Deep Learning)

Ľudia si to často zvyknú myslieť , a Hlboké učenie sú rovnaké, pretože majú spoločné aplikácie. Napríklad Siri je aplikácia AI, strojového učenia a hlbokého učenia.

Ako teda tieto technológie súvisia?

ako zostaviť java kód -
  • Umela inteligencia je veda o získavaní strojov na napodobňovanie správania ľudí.
  • Strojové učenie je podmnožina umelej inteligencie (AI), ktorá sa zameriava na to, aby sa stroje dostávali k rozhodovaniu tak, že im dodávajú údaje.
  • Hlboké učenie je podmnožina strojového učenia, ktorá využíva koncept neurónových sietí na riešenie zložitých problémov.

Keď to zhrnieme, AI, Machine Learning a Deep Learning sú vzájomne prepojené polia. Strojové učenie a hlboké učenie pomáha umelej inteligencii tým, že poskytuje sadu algoritmov a neurónových sietí na riešenie problémy založené na dátach.

Teraz, keď už ovládate základné informácie, pochopme, čo viedlo k potrebe hlbokého učenia.

Potreba hlbokého učenia: Obmedzenia tradičných algoritmov a techník strojového učenia

Machine Learning bolo veľkým prielomom v technickom svete, viedlo k automatizácii monotónnych a časovo náročných úloh, pomohlo pri riešení zložitých problémov a pri inteligentnejších rozhodnutiach. Strojové učenie však malo niekoľko nevýhod, ktoré viedli k vzniku hlbokého učenia.

Tu sú niektoré obmedzenia strojového učenia:

  1. Nie je možné spracovať vysoko dimenzionálne údaje: Strojové učenie dokáže spracovať iba malé dimenzie údajov, ktoré obsahujú malú množinu premenných. Ak chcete analyzovať údaje obsahujúce 100 s premenných, potom Machine Learning nemožno použiť.
  2. Technológia funkcií je manuálna: Zvážte prípad použitia, keď máte 100 predikčných premenných a potrebujete zúžiť iba tie významné. Ak to chcete urobiť, musíte manuálne študovať vzťah medzi každou z premenných a zistiť, ktoré z nich sú dôležité pri predpovedaní výstupu. Táto úloha je pre vývojára mimoriadne zdĺhavá a časovo náročná.
  3. Nie je ideálne na vykonávanie detekcie objektov a spracovania obrazu: Pretože detekcia objektov vyžaduje vysokorozmerné údaje, nie je možné strojové učenie použiť na spracovanie súborov obrazových údajov, a preto je ideálne iba pre množiny údajov s obmedzeným počtom funkcií.

Predtým, ako sa dostaneme do hlbín Neurónové siete, zvážme prípad použitia v reálnom svete, keď je implementované Deep Learning.

Prípad / aplikácie hlbokého učenia

Vedeli ste, že PayPal spracuje platby viac ako 235 miliárd dolárov zo štyroch miliárd transakcií od viac ako 170 miliónov zákazníkov? Využíva toto obrovské množstvo údajov na identifikáciu možných podvodných aktivít okrem iných dôvodov.

Pomocou algoritmov Deep Learning PayPal okrem kontroly vzorov pravdepodobných podvodov uložených v jeho databázach vyťažil údaje z nákupnej histórie svojich zákazníkov a predpovedal, či je konkrétna transakcia podvodná alebo nie.

Spoločnosť sa spolieha na technológiu Deep Learning & Machine Learning asi 10 rokov. Tím na sledovanie podvodov spočiatku používal jednoduché lineárne modely. V priebehu rokov sa však spoločnosť preorientovala na pokročilejšiu technológiu strojového učenia s názvom Deep Learning.

Manažér rizika podvodov a Data Scientist v PayPal, Ke Wang, citoval:

„To, čo nás baví na modernejšom a pokrokovom strojovom učení, je jeho schopnosť spotrebovať oveľa viac údajov, zvládnuť vrstvy a vrstvy abstrakcie a byť schopní„ vidieť “veci, ktoré by jednoduchšia technológia nebola schopná vidieť, dokonca ani ľudia nevidieť. “

Jednoduchý lineárny model dokáže spotrebovať okolo 20 premenných. S technológiou Deep Learning však možno spustiť tisíce dátových bodov. Preto implementáciou Vďaka technológii Deep Learning môže PayPal konečne analyzovať milióny transakcií a identifikovať tak akékoľvek podvodné transakcie činnosť.

Poďme teraz do hĺbky neurónovej siete a pochopme, ako fungujú.

Ako funguje neurónová sieť?

Aby sme porozumeli neurónovým sieťam, musíme ich rozdeliť a pochopiť najzákladnejšiu jednotku neurónovej siete, teda Perceptron.

Čo je to Perceptron?

Perceptron je neurónová sieť s jednou vrstvou, ktorá sa používa na klasifikáciu lineárnych údajov. Má 4 dôležité komponenty:

  1. Vstupy
  2. Váhy a predpätie
  3. Sumačná funkcia
  4. Funkcia aktivácie alebo transformácie

Základná logika perceptronu je nasledovná:

Vstupy (x) prijaté zo vstupnej vrstvy sa vynásobia ich priradenými váhami w. Vynásobené hodnoty sa potom pridajú a vytvoria vážený súčet. Vážený súčet vstupov a ich príslušné váhy sa potom použijú na príslušnú aktivačnú funkciu. Aktivačná funkcia mapuje vstup na príslušný výstup.

koľko je 6 spôsobov použitia tohto kľúčového slova?

Váhy a zaujatosť pri hlbokom učení

Prečo musíme každému vstupu priradiť váhy?

Akonáhle je vstupná premenná privádzaná do siete, náhodne zvolená hodnota sa priradí ako váha tohto vstupu. Váha každého vstupného údajového bodu naznačuje, aký dôležitý je tento vstup pri predpovedaní výsledku.

Na druhej strane parameter bias umožňuje upraviť krivku aktivačnej funkcie tak, aby sa dosiahol presný výstup.

Sumačná funkcia

Keď sa vstupom priradí nejaká váha, vezme sa súčin príslušného vstupu a hmotnosti. Pridaním všetkých týchto produktov získate vážený súčet. To sa deje pomocou funkcie súčtu.

Aktivačná funkcia

Hlavným cieľom aktivačných funkcií je namapovať vážený súčet na výstup. Príkladom transformačných funkcií sú aktivačné funkcie, ako napríklad tanh, ReLU, sigmoid atď.

Ak sa chcete dozvedieť viac informácií o funkciách Perceptronu, môžete si prejsť toto Blog.

Skôr ako my Keď zhrnieme tento blog, vezmime si na jednoduchom príklade pochopenie fungovania neurónovej siete.

Neurónové siete vysvetlené na príklade

Zvážte scenár, v ktorom chcete vytvoriť umelú neurónovú sieť (ANN), ktorá klasifikuje obrázky do dvoch tried:

  • Trieda A: Obsahujúca obrazy chorých listov
  • Trieda B: Obsahujúca obrazy chorých listov

Ako teda vytvoriť neurónovú sieť, ktorá klasifikuje listy na choré a choré plodiny?

Proces vždy začína spracovaním a transformáciou vstupu tak, aby ho bolo možné ľahko spracovať. V našom prípade bude každý listový obrázok rozdelený na pixely v závislosti od jeho rozmeru.

Napríklad ak sa obrázok skladá z 30 x 30 pixelov, potom bude celkový počet pixelov 900. Tieto pixely sú reprezentované ako matice, ktoré sa potom zavedú do vstupnej vrstvy neurónovej siete.

Rovnako ako to, že náš mozog má neuróny, ktoré pomáhajú pri budovaní a prepájaní myšlienok, má ANN perceptróny, ktoré prijímajú vstupy a spracúvajú ich prenosom zo vstupnej vrstvy do skrytej a nakoniec do výstupnej.

Keď sa vstup prenáša zo vstupnej vrstvy do skrytej vrstvy, každému vstupu sa priradí počiatočná náhodná váha. Vstupy sa potom vynásobia ich zodpovedajúcimi váhami a ich súčet sa odošle ako vstup do ďalšej skrytej vrstvy.

Tu je každému perceptronu priradená číselná hodnota nazývaná skreslenie, ktorá je spojená s váhou každého vstupu. Ďalej každý perceptrón prechádza aktiváciou alebo transformačnou funkciou, ktorá určuje, či sa konkrétny perceptrón aktivuje alebo nie.

Na prenos údajov do nasledujúcej vrstvy sa používa aktivovaný perceptrón. Týmto spôsobom sa údaje šíria (šírenie dopredu) neurónovou sieťou, kým perceptróny nedosiahnu výstupnú vrstvu.

Na výstupnej vrstve sa odvodí pravdepodobnosť, ktorá rozhodne, či údaje patria do triedy A alebo triedy B.

Znie to jednoducho, však? Koncept za neurónovými sieťami je založený čisto na fungovaní ľudského mozgu. Vyžadujete dôkladné znalosti rôznych matematických konceptov a algoritmov. Tu je zoznam blogov, ktoré vám pomôžu začať:

  1. Čo je to Deep Learning? Začíname s hlbokým učením
  2. Hlboké učenie s Pythonom: Sprievodca hlbokým učením pre začiatočníkov

Ak považujete tento blog za relevantný, pozrite si stránku autor: Edureka, dôveryhodná online vzdelávacia spoločnosť so sieťou viac ako 250 000 spokojných študentov rozmiestnených po celom svete. Kurz Edureka Deep Learning with TensorFlow Certification Training pomáha študentom stať sa odborníkmi v oblasti tréningu a optimalizácie základných a konvolučných neurónových sietí pomocou projektov a úloh v reálnom čase spolu s konceptmi, ako je funkcia SoftMax, neurónové siete s automatickým kódovaním, obmedzený Boltzmann Machine (RBM).