Výukový program R - Sprievodca učením sa programovania R pre začiatočníkov



Tento blog o výučbe R vám predstaví nástroj R a pomôže vám s príkladmi podrobne pochopiť rôzne základy programovania R.

R je najpopulárnejší nástroj na analýzu údajov, pretože je open-source, flexibilný, ponúka viac balíkov a má obrovskú komunitu. Je určený pre softvérových programátorov, štatistikov a ťažiarov dát, a teda, kvôli zvyšovaniu popularity .V tomto blogu R Tutorial vám poskytnem kompletný prehľad o R s príkladmi.

Ďalej sú uvedené témy v tomto blogu R Rutorial, o ktorých budem diskutovať v nasledujúcom poradí:





  1. Prečo potrebujeme službu Analytics ?
  2. Čo je to Business Analytics ?
  3. Prečo R a kto používa R ?
  4. Inštalácia R.
  5. Prevádzkovatelia údajov
  6. Dátové typy
  7. Kontrola prietoku

Výukový program R: Prečo potrebujeme analýzu?

Predtým, ako odpoviem na otázku, dovoľte mi, aby som vás stručne informoval o niektorých problémoch a ich riešeniach v R vo viacerých doménach.



bankovníctvo - Výukový program R - Edureka

Bankovníctvo :

Denne sa v bankách generuje veľké množstvo údajov o zákazníkoch. Žpri pravidelnom jednaní s miliónmi zákazníkov je ťažké sledovať ich hypotéky.



Riešenie :

Spoločnosť R zostavuje vlastný model, ktorý udržiava pôžičky poskytované každému jednotlivému zákazníkovi, čo nám pomáha rozhodnúť sa o sume, ktorú má zákazník v priebehu času zaplatiť.

Poistenie :

Poistenie vo veľkej miere závisí od prognóz. Je ťažkérozhodnúť, ktorú politiku prijať alebo odmietnuť.

Riešenie:

Použitím nepretržitej úverovej správy ako vstupu môžeme vytvoriť model v R, ktorý bude hodnotiť nielen chuť do rizika, ale aj prediktívnu predpoveď.

Zdravotná starostlivosť:

Každý rok sú hospitalizovaní milióny ľudí a miliardy sa ročne minú len v procese prijímania.

Riešenie :

Vzhľadom na anamnézu pacientov a anamnézu je možné vytvoriť prediktívny model na identifikáciu toho, kto je vystavený riziku hospitalizácie a v akom rozsahu by malo byť zdravotnícke vybavenie zmenšené.

Teraz vieme, ako analýza dát pomáha organizáciám využívať svoje dáta a používať ich na identifikáciu nových príležitostí. Ak hovoríme o potrebe analytiky v organizácii, musíte naraziť na tieto 4 aspekty:

Ďalej sa posuňme vpred v blogu R tutorial, kde najskôr pochopíme, čo presne je obchodná analýza.

Výukový program R: Čo je Business Analytics?

Business analytics je proces skúmania veľkých súborov údajov a dosahovania skrytých vzorov, korelácií a ďalších poznatkov. V zásade vám pomôže pochopiť všetky údaje, ktoré ste zhromaždili, či už sú to údaje o organizácii, údaje o výskume trhu alebo produktu alebo akýkoľvek iný druh údajov. Ľahko sa vám bude robiť lepšie rozhodnutia, lepšie produkty, lepšie marketingové stratégie atď. Lepšie pochopenie nájdete na nasledujúcom obrázku:

Ak sa pozriete na vyššie uvedený obrázok, vaše údaje na prvom obrázku sú rozptýlené. Ak teraz chcete v databáze niečo konkrétne, napríklad konkrétny záznam, stane sa to ťažkopádnym. Aby ste to zjednodušili, potrebujete analýzu. Pomocou analýzy je ľahké nájsť koreláciu medzi údajmi. Len čo sa dozviete, čo máte robiť, bude pre vás celkom ľahké prijímať rozhodnutia ako napríklad, ktorou cestou sa chcete vydať alebo z hľadiska obchodnej analýzy, ktorá z nich povedie k zlepšeniu vašej organizácie.

Nemôžete však očakávať, že ľudia vo vyššie uvedenom reťazci po analýze vždy pochopia nespracované údaje, ktoré im poskytujete. Na prekonanie tejto medzery teda máme koncept vizualizácia údajov .

Vizualizácia údajov : Vizualizácia údajov je vizuálny prístup k obrovskému množstvu údajov, ktoré ste vygenerovali po analýze. Ľudská myseľ spracováva vizuálne obrazy a vizuálna grafika sú lepšie ako v porovnaní so surovými údajmi. Je pre nás vždy ľahké pochopiť koláčový graf alebo stĺpcový graf v porovnaní s hrubými číslami. Možno sa teraz pýtate, ako môžete dosiahnuť túto vizualizáciu údajov z údajov, ktoré ste už analyzovali?
Na trhu s vizualizáciou údajov sú k dispozícii rôzne nástroje:

Všetci sa musíte čudovať, že už existuje toľko nástrojov, ktoré vám pomôžu dosiahnuť vizualizáciu údajov a určité množstvo analýz, prečo ísť práve na R?

Moja ďalšia téma v blogu tutoriálov R sa teda venuje otázkam „prečo R“ a „kto používa R“.

Výukový program R: Prečo R a kto používa R?

Prečo R?

R je programovací a štatistický jazyk.

R sa používa na analýzu a vizualizáciu údajov.

R je jednoduchý a ľahko sa učí, číta a píše.

R je príklad FLOSS (Free Libre a Open Source Software), kde je možné voľne distribuovať kópie tohto softvéru, čítať jeho zdrojový kód, upravovať ho atď.

Kto používa R?

  • Úrad na ochranu spotrebiteľa používa R na analýzu údajov
  • Štatistici spoločnosti John Deere používajú R na modelovanie časových radov a geopriestorové analýzy spoľahlivým a reprodukovateľným spôsobom.
  • Bank of America používa na vykazovanie písmeno R.
  • R je súčasťou technologického radu za slávnym Foursquareovým odporúčacím motorom.
  • ANZ, štvrtá najväčšia banka v Austrálii, ktorá používa R na analýzu kreditného rizika.
  • Google používa R na predpovedanie ekonomickej aktivity.
  • Mozilla, nadácia zodpovedná za webový prehliadač Firefox, používa R na vizualizáciu aktivity na webe.

Ďalej uvádzame niektoré z domén, kde sa používa R:

Teraz sa posuňme v blogu R tutorial a nainštalujme R.

Výukový program R: Inštalácia R.

Dovoľte mi, aby som vás sprevádzal procesom inštalácie R vo vašom systéme. Postupujte podľa nasledujúcich krokov:

Krok 1 : Prejdite na odkaz- https://cran.r-project.org/

Krok 2 : Stiahnite si a nainštalujte R 3.3.3 do vášho systému.

Pre lepšie pochopenie si pozrite nasledujúcu snímku obrazovky.

Vykonaním vyššie uvedených krokov ste hotoví s inštalačnou časťou R. Teraz môžete priamo začať kódovať v R stiahnutím RStudio IDE. Ak ju chcete stiahnuť, postupujte takto:

Krok 1 : Prejdite na odkaz- https://www.rstudio.com/

Krok 2 : Stiahnite a nainštalujte si Rstudio do svojho systému.

Po nainštalovaní všetkého ste pripravení na kód!

Výukový program R pre začiatočníkov Výukový program pre programovanie R Edureka

Ďalej sa posuňme v blogu R Tutorial a pochopme, čo sú dátové operátory v R.

Výukový program R: Dátové operátory v R.

Existuje hlavne 5 rôznych typov operátorov, ktoré sú uvedené nižšie:

  1. Aritmetické operátory : Vykonajte aritmetické operácie, ako je sčítanie, odčítanie, násobenie, delenie atď.
  2. Prevádzkovatelia pridelenia :Na priradenie hodnôt sa používajú operátory priradenia. Napríklad:
  • Prevádzkovateľ pridelenia
    Syntax:
    názov premennej = hodnota
> x = 5 >X 
Výstup: [1] 5
  • Operátor pridelenia<-
    Syntax:
    názov premennej<- value

    > x<- 15 > x
    Výstup: [1] 15
  • Operátor pridelenia<<-
    Syntax:
    názov premennej<<- value
> x<<- 2 > x
Výstup: [1] 2
  • Operátor zadania ->
    Syntax:
    hodnota -> názov premennej

    > 25 -> x > x 
    Výstup: [1] 25

3. Relačný operátor : Definuje vzťah medzi dvoma entitami. Napríklad: ,<=,!= etc.

> xx! = 2
Výkon:[1] PRAVDA

4. Logickí operátori : Tieto operátory porovnávajú tieto dve entity a zvyčajne sa používajú s boolovskými (logickými) hodnotami, ako napríklad &, | a!.

> x2 a 3
Výkon:[1] PRAVDA

5. Špeciálni operátori : Tieto operátory sa používajú na konkrétny účel, nie na logický výpočet. Napríklad:

  • Vytvára sériu čísel za sebou pre vektor.

    > xx
    Výstup: [1] 2 3 4 5 6 7 8
  • % v% Tento operátor sa používa na identifikáciu, či prvok patrí do vektora.
    Príklad

    > xyy% v% x
    Výstup: [1] PRAVDA

Výukový program R: Dátové typy

Na ukladanie informácií sa používajú dátové typy. V jazyku R nemusíme deklarovať premennú ako nejaký dátový typ. Premenné sú priradené k R-objektom a dátový typ R-objektu sa stane dátovým typom premennej.V R je prítomných hlavne šesť dátových typov:

Poďme sa podrobnejšie venovať každému z nich:

Vektor : Vektor je sekvencia dátových prvkov rovnakého základného typu. Príklad:

vtr = (1, 3, 5, 7 9)

alebo

vtr<- (1, 3, 5 ,7 9)

Existuje 5 atómových vektorov, ktoré sa tiež nazývajú päť tried vektorov.

Zoznam : Zoznamy sú objekty R, ktoré obsahujú prvky rôznych typov, ako napríklad & mínus čísla, reťazce, vektory a ďalší zoznam.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = zoznam (n, s, PRAVDA) > x

Výkon -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] PRAVDA

Polia : Polia sú dátové objekty typu R, ktoré môžu ukladať údaje vo viac ako dvoch dimenziách. Ako vstup berie vektory a na vytvorenie poľa použije hodnoty v parametri dim.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) výsledok<- array(c(vector1,vector2),dim = c(3,3,2))

Výkon -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Polia : Matice sú objekty R, v ktorých sú prvky usporiadané v dvojrozmernom obdĺžnikovom usporiadaní. Matica sa vytvára pomocou funkcie matrix (). Príklad: matica (data, nrow, ncol, byrow, dimnames) kde,

údaje je vstupný vektor, ktorý sa stáva dátovými prvkami matice.

nrow je počet riadkov, ktoré sa majú vytvoriť.

ncol je počet stĺpcov, ktoré sa majú vytvoriť.

byrow je logická stopa. Ak je TRUE, potom sú vstupné vektorové prvky usporiadané podľa riadkov.

dimname sú názvy priradené riadkom a stĺpcom.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Výkon :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Faktory : Faktory sú dátové objekty, ktoré sa používajú na kategorizáciu údajov a ich ukladanie ako úrovne. Môžu ukladať reťazce aj celé čísla. Sú užitočné pri analýze dát pre štatistické modelovanie.

> údaje<- c('East','West','East','North','North','East','West','West“,'East“) > factor_data<- factor(data) > factor_data

Výkon :

[1] Východ Západ Východ Sever Sever Východ Západ Západ Východ Úrovne: východ severozápad

Dátové rámce : Dátový rámec je tabuľka alebo dvojrozmerná štruktúra podobná poli, v ktorej každý stĺpec obsahuje hodnoty jednej premennej a každý riadok obsahuje jednu množinu hodnôt z každého stĺpca.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > známky = c (623,3 515,2 611,0 729,0 843,25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Výkon :

std_id std_name značky 1 1 Rick 623,30 2 2 A 515.20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843,25

Týmto prichádzame na koniec rôznych dátových typov v R. Ďalej sa posuňme v blogu R Tutorial a pochopme ďalší kľúčový koncept - príkazy riadenia toku.

Výukový program R: Vyhlásenia o riadení toku

Príkazy riadenia toku zohrávajú veľmi dôležitú úlohu, pretože vám umožňujú riadiť priebeh vykonávania skriptu vo vnútri funkcie. Najčastejšie používané príkazy riadenia toku sú zobrazené na nasledujúcom obrázku:

Teraz si poďme rozobrať každú z nich na príkladoch.

Výukový program R: Príkazy selektora

  • Ak je kontrolné vyhlásenie : Tento kontrolný príkaz vyhodnocuje jednu podmienku. Je to celkom jednoduché, pretože má iba jediné kľúčové slovo „ak“, za ktorým nasleduje podmienka a potom určitá množina príkazov, ktoré je potrebné vykonať, ak je to pravda. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

V tomto vývojovom diagrame bude kód reagovať nasledujúcim spôsobom:

  1. Najskôr vstúpi do slučky, kde skontroluje stav.
  2. Ak je podmienka pravdivá, vykoná sa podmienený kód alebo zapísané príkazy.
  3. Ak je podmienka nepravdivá, príkazy sa ignorujú.

Nižšie je uvedený príklad ak riadiaci príkaz v R. Skúste tento príklad spustiť v R Studio.

x = 2 opakovať {x = x ^ 2 tlačiť (x), ak (x> 100) {break}

Výkon :

[1] 4 [1] 16 [1] 256
  • Keby iné kontrolné vyhlásenie :Skúškas typ kontrolného vyhláseniavyhodnotí skupinu podmienok a vyberie výkazy. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

V tomto vývojovom diagrame bude kód reagovať nasledujúcim spôsobom:

  1. Najskôr vstúpi do slučky, kde skontroluje stav.
  2. Ak je podmienka pravdivá, vykonajú sa prvé príkazy typu „if“.
  3. Ak je podmienka nepravdivá, dôjde k podmienke „else if“ a ak je pravdivá, vykoná sa kód „else if“.
  4. Nakoniec, ak je kód „else if“ tiež nepravdivý, prejde na kód „else“ a vykoná sa. To znamená, že ak nie je splnená žiadna z týchto podmienok, vykoná sa príkaz ‘else’.

Nižšie je uvedený príklad ako inak riadiaci príkaz v R. Skúste tento príklad spustiť v R Studio.

x5) {print ('x je väčšie ako 5')} elseif (x == 5) {print ('x sa rovná 5')} else {print ('x nie je väčšie ako 5')}

Výkon:

[1] „x sa rovná 5“
  • Prepnúť výpisy : Tieto riadiace príkazy sa v zásade používajú na porovnanie určitého výrazu so známou hodnotou. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

V tomto vývojovom diagrame prípadu Switch bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr vstúpi do prepínača, ktorý má výraz.
  2. Ďalej pôjde do podmienky Prípad 1, skontroluje hodnotu odovzdanú do podmienky. Ak je to pravda, vykoná sa blok výpisov. Potom sa to zlomí z tej spínacej skrinky.
  3. V prípade, že je nepravdivý, prepne sa na ďalší prípad. Ak je podmienka prípadu 2 pravdivá, vykoná príkaz a oddeľuje sa od tohto prípadu, inak znova skočí na ďalší prípad.
  4. Povedzme, že ste nezadali žiadny prípad alebo že došlo k nesprávnemu vstupu používateľa, potom sa použije predvolený prípad, v ktorom sa vytlačí vaše predvolené vyhlásenie.

Nižšie je uvedený príklad príkazu switch v R. Skúste tento príklad spustiť v R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Výkon :

[1] 275

Výukový program R: Smyčkové výpisy

Smyčky vám pomôžu opakovať určitú skupinu akcií, aby ste ich nemuseli vykonávať opakovane. Predstavte si, že musíte operáciu vykonať 10-krát. Ak zakaždým začnete písať kód, predĺži sa dĺžka programu a neskôr by ste mu ťažko rozumeli. Ale zároveň pomocou slučky, ak napíšem rovnaké vyhlásenie do slučky, šetrí to čas a uľahčuje čitateľnosť kódu. Tiež sa optimalizuje s ohľadom na efektívnosť kódu.

Na vyššie uvedenom obrázku „ opakovať ‘ a ‘ zatiaľ čo „Vyhlásenia vám pomôžu vykonať určitý súbor pravidiel, kým nie je splnená podmienka, ale“ pre ‘ je príkaz slučky, ktorý sa používa, keď viete, koľkokrát chcete opakovať blok príkazu. Teraz, ak viete, že to chcete opakovať 10-krát, pôjdete s výrokom 'pre', ale ak si nie ste istí, koľkokrát chcete, aby sa kód opakoval, pôjdete s 'opakovať' alebo slučka „while“.

Poďme si predstaviť každú z nich s príkladmi.

  • Opakujte : Opakovacia slučka pomáha vykonávať tú istú sadu kódu znova a znova, kým nie je splnená podmienka zastavenia. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

Vo vyššie uvedenom vývojovom diagrame bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr zadá a vykoná sadu kódov.
  2. Ďalej skontroluje podmienku, ak je pravdivá, vráti sa späť a znova vykoná tú istú sadu kódu, kým to nebude považované za nepravdivé.
  3. Ak sa zistí, že je nepravdivý, priamo opustí slučku.
  • Zatiaľ čo : Príkaz while tiež pomáha opakovane spúšťať tú istú sadu kódu, kým nie je splnená podmienka zastavenia. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

Vo vyššie uvedenom vývojovom diagrame bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr skontroluje stav.
  2. Ak sa zistí, že je to pravda, vykoná sadu kódu.
  3. Ďalej znova skontroluje stav, ak je jeho pravda, vykoná rovnaký kód znova. Len čo sa zistí, že stav je nepravdivý, okamžite opustí slučku.

Nižšie je uvedený príklad príkazu while v R. Skúste tento príklad spustiť v aplikácii R Studio.

x = 2 while (x<1000) { x=x^2 print(x) } 

Výkon:

má vs je java
4 16 256 65 536

Určite vás zaujíma, v čom sa tieto dve tvrdenia líšia? Dovoľte mi objasniť vaše pochybnosti!
Tu je hlavný rozdiel medzi výrokom opakovania a kým je, že sa mení s ohľadom na váš stav. Zatiaľ čo loop v podstate definuje, kedy sa chystáte vstúpiť do cyklu na vykonanie príkazov a opakovať slučka definuje, kedy opustíte slučku po vykonaní príkazov. Takže tieto dva príkazy sú známe ako vstupná riadiaca slučka a výstupná riadiaca slučka. Takto sa líšia výroky while a repeat.

  • Pre slučku: Pre slučky sa používajú, keď potrebujete niekoľkokrát vykonať blok kódu. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

Vo vyššie uvedenom vývojovom diagrame bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr je tu inicializácia, kde určíte, koľkokrát chcete, aby sa slučka opakovala.
  2. Ďalej skontroluje stav. Ak je podmienka pravdivá, vykoná sadu kódov po zadaný počet opakovaní.
  3. Len čo sa zistí, že stav je nepravdivý, okamžite opustí slučku.

Nižšie je uvedený príklad príkazu for statement v R. Skúste tento príklad spustiť v aplikácii R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Výkon :

7 19 25 65 45

Ďalej sa presunieme k našej poslednej množine príkazov v blogu R Tutorial, t. J. Skokové príkazy.

Výukový program R: Vyskočenie príkazov

Vyhlásenie o zlomení : Príkazy Break pomáhajú ukončiť program a obnovia riadenie v nasledujúcom príkaze nasledujúcom za slučkou. Tieto vyhlásenia sa používajú aj v prípade prepínačov. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

Vo vyššie uvedenom vývojovom diagrame bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr vstúpi do slučky, kde skontroluje stav.
  2. Ak je podmienka slučky nepravdivá, priamo ju opustí.
  3. Ak je podmienka pravdivá, skontroluje stav prerušenia.
  4. Ak je podmienka prerušenia pravdivá, existuje zo slučky.
  5. Ak je podmienka prerušenia nepravdivá, vykoná príkazy, ktoré zostanú v cykle, a potom zopakuje rovnaké kroky.

Nižšie je uvedený príklad príkazu jump v R. Skúste tento príklad spustiť v R Studio.

X<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Výkon:

[1] 1 [1] 2

Ďalšie vyhlásenie : Nasledujúci príkaz sa použije, ak chcete preskočiť aktuálnu iteráciu slučky bez jej ukončenia. Nasledujúci príkaz je dosť podobný výrazu „continue“ v inom programovacom jazyku. Pre lepšie pochopenie použite nasledujúci vývojový diagram.

Vo vyššie uvedenom vývojovom diagrame bude kód reagovať v nasledujúcich krokoch:

  1. Najskôr vstúpi do slučky, kde skontroluje stav.

  2. Ak je podmienka slučky nepravdivá, priamo ju opustí.

  3. Ak je podmienka slučky pravdivá, vykoná príkazy bloku 1.

  4. Potom skontroluje „ďalší“ výpis. Ak je prítomný, potom sa príkazy nebudú vykonávať v rovnakej iterácii cyklu.

  5. Ak príkaz „next“ nie je k dispozícii, vykonajú sa všetky nasledujúce príkazy.

Nižšie uvádzame príklad nasledujúceho príkazu v jazyku R. Skúste tento príklad spustiť v aplikácii R Studio.

pre (i v 1:15) {if ((i %% 2) == 0) {next} print (i)}

Výkon :

1 3 5 7 9 11 13 15

Týmto sa končí výučbový blog R. Dúfam, že máte jasno v každej koncepcii, o ktorej som hovoril vyššie. Zostaňte naladení, môj ďalší blog bude venovaný tréningu R, kde budem podrobnejšie vysvetľovať niektoré ďalšie koncepty R s exdostatok.

Teraz, keď ste pochopili základné informácie o R, sa pozrite na autor: Edureka, dôveryhodná online vzdelávacia spoločnosť so sieťou viac ako 250 000 spokojných študentov rozmiestnených po celom svete. Školenie Edureka Data Analytics with R vám pomôže získať odborné znalosti v oblasti programovania R, manipulácie s dátami, prieskumnej analýzy dát, vizualizácie dát, dolovania dát, regresie, analýzy sentimentu a používania R Studio pre prípadové štúdie z reálneho života v maloobchode, sociálnych médiách.

Máte na nás otázku? Uveďte to prosím v sekcii komentárov tohto blogu „R Tutorial“ a my sa vám ozveme čo najskôr.