Programovanie R - Sprievodca začiatočníkom programovacieho jazyka R.



Tento blog o programovaní R vás zoznámi s programom R a pomocou príkladov vám pomôže podrobne pochopiť rôzne základné pojmy programovania R.

R je jedným z najpopulárnejších analytických nástrojov. Ale okrem toho, že sa R ​​používa na analytiku, je to aj programovací jazyk.S jeho rastom v IT priemysle rastie dopyt po kvalifikovaných alebo s porozumením jazyka R ako nástroja na analýzu údajov a programovacieho jazyka.V tomto blogu vám pomôžem pochopiť rôzne základy programovania R. V našom p revious Blog ,diskutovali sme o tom, prečo potrebujeme Analytics, čo je Business Analytics, prečo a kto používa R.

V tomto blogu pochopíme nižšie uvedené základné koncepty programovania R v nasledujúcom poradí:





  1. Premenné
  2. Dátové typy
  3. Prevádzkovatelia údajov
  4. Podmienené vyhlásenie
  5. Slučky
  6. Funkcie

Môžete absolvovať webinárový záznam programovacieho jazyka R, kde náš inštruktor podrobne vysvetlil témy na príkladoch, ktoré vám pomôžu lepšie pochopiť programovanie R.

Programovanie R pre začiatočníkov Výučba programovacieho jazyka R Edureka



Poďme teda ďalej a pozrime sa na prvý koncept R programovania - premenné.

Programovanie v R: Premenné

Premenné nie sú nič iné ako názov pamäťového miesta obsahujúceho hodnotu. Premenná v R môže ukladať číselné hodnoty, komplexné hodnoty, slová, matice a dokonca aj tabuľku. Prekvapivé, že?

Premenná - programovanie R - Edureka

Obr. Tvorbapremenných



Vyššie uvedený obrázok nám ukazuje, ako sa vytvárajú premenné a ako sa ukladajú do rôznych pamäťových blokov. V jazyku R nemusíme deklarovať premennú skôr, ako ju použijeme, na rozdiel od iných programovacích jazykov, ako sú Java, C, C ++ atď.

Poďme ďalej a pokúsme sa pochopiť, čo je dátový typ a rôzne dátové typy podporované v R.

Programovanie v R: dátové typy

V R samotná premenná nie je deklarovaná v žiadnom dátovom type, skôr získava dátový typ R objektu, ktorý je jej priradený. Takže R sa nazýva jazyk s dynamickým typom, čo znamená, že pri jeho použití v programe môžeme znova a znova meniť dátový typ tej istej premennej.

Dátové typy špecifikujú, aký typ hodnoty má premenná a aký typ matematických, relačných alebo logických operácií na ňu možno použiť bez spôsobenia chyby. V R je veľa dátových typov, nižšie sú však najčastejšie používané:

Poďme teraz diskutovať o každom z týchto typov údajov individuálne, počnúc vektormi.

Vektory

Vektory sú najzákladnejšie dátové objekty typu R a existuje šesť typov atómových vektorov. Ďalej uvádzame šesť atómových vektorov:

Logické : Používa sa na ukladanie logických hodnôt ako PRAVDA alebo NEPRAVDA .

Číselné : Používa sa na ukladanie kladných aj záporných čísel vrátane reálneho.

fibonacci c ++ kód
Napr .: 25, 7.1145, 96547

Celé číslo : Obsahuje všetky celočíselné hodnoty, t. J. Všetky kladné a záporné celé čísla.

Napr .: 45,479, -856,479, 0

Zložité : Jedná sa o tvar x + yi, kde xay sú číselné a i predstavuje druhú odmocninu -1.

Napr .: 4 + 3i

Postava : Používa sa na ukladanie jedného znaku, skupiny znakov (slov) alebo skupiny slov dohromady. Znaky môžu byť definované v jednoduchých úvodzovkách alebo dvojitých úvodzovkách.

Napr .: „Edureka“, „R je zábava sa učiť“.

Všeobecne je vektor definovaný a inicializovaný nasledujúcim spôsobom:

Vtr = c (2, 5, 11, 24) Alebo Vtr<- c(2, 5, 11 , 24)

Poďme ďalej a pochopme ďalšie typy údajov v R.

Zoznam

Zoznamy sú dosť podobné vektorom, ale Zoznamy sú objekty R, ktoré môžu obsahovať prvky rôznych typov, ako napríklad & mínus čísla, reťazce, vektory a ďalší zoznam.

Napr .:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Výkon:

[[1]] [1] 'Dobrý deň' 'Ahoj' Ako robíš '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] PRAVDA

Matrix

Matica je objekt R, v ktorom sú prvky usporiadané v dvojrozmernom obdĺžnikovom usporiadaní.

Základná syntax pre vytvorenie matice v R je & mínus

 matica (data, nrow, ncol, byrow, dimnames) 

Kde:

  • údaje je vstupný vektor, ktorý sa stáva dátovým prvkom matice.
  • nrow je počet riadkov, ktoré sa majú vytvoriť.
  • ncol je počet stĺpcov, ktoré sa majú vytvoriť.
  • byrow je logická stopa. Ak je TRUE, potom sú vstupné vektorové prvky usporiadané podľa riadkov.
  • dimname sú názvy priradené riadkom a stĺpcom.

Príklad:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Výkon:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

POLE

Polia v R sú dátové objekty, ktoré možno použiť na ukladanie údajov vo viac ako dvoch dimenziách. Berie vektory ako vstup a používa hodnoty v č parameter na vytvorenie poľa.

Základná syntax pre vytvorenie poľa v R je & mínus

 pole (dáta, dim, dimnames) 

Kde:

  • údaje je vstupný vektor, ktorý sa stáva dátovými prvkami poľa.
  • č je dimenzia poľa, kde odovzdáte počet riadkov, stĺpcov a počet matíc, ktoré majú byť vytvorené uvedenými dimenziami.
  • dimname sú názvy priradené riadkom a stĺpcom.

Príklad:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Výkon:

,, jeden [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Dátový rámec

Dátový rámec je tabuľka alebo dvojrozmerná štruktúra typu poľa, v ktorej každý stĺpec obsahuje hodnoty jednej premennej a každý riadok obsahuje jednu sadu hodnôtprekaždý stĺpec. Ďalej uvádzame niektoré z charakteristík dátového rámca, ktoré je potrebné zohľadniť pri každej práci s nimi:

  • Názvy stĺpcov by nemali byť prázdne.
  • Každý stĺpec by mal obsahovať rovnaké množstvo dátových položiek.
  • Dáta uložené v dátovom rámci môžu byť číselného, ​​faktorového alebo znakového typu.
  • Názvy riadkov by mali byť jedinečné.

Príklad:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Predaj', 'Financie', 'Marketing', 'HR (Ďalej len „výskum a vývoj“) emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Výkon:

emp_id emp_name odd 1 100 predajov spoločnosti John 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D

Takže teraz, keď sme pochopili základné dátové typy R, je čas sa hlboko ponoriť do R pochopením konceptov dátových operátorov.

R Programovanie: Dátoví operátori

V R sú hlavne 4 dátové operátory, ktoré sú znázornené nižšie:

Aritmetické operátory : Tieto operátory nám pomáhajú vykonávať základné aritmetické operácie, ako sú sčítanie, odčítanie, násobenie atď.

Uvažujme o nasledujúcom príklade:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #umulus %%3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # podlahové rozdelenie num3 = num1% /% num2 num3

Výkon:

[1] 35 [pätnásť [1] 300 [1] 0,75 [1] 15 [1] 125 [jedenásť

Relační operátori : Tieto operátory nám pomáhajú vykonávať relačné operácie, ako je kontrola, či je premenná väčšia, menšia alebo rovná inej premennej. Výstupom relačnej operácie je vždy logická hodnota.

Zvážte nasledujúce príklady:

num1 = 15 num2 = 20 # sa rovná num3 = (num1 == num2) num3 # nerovná sa num3 = (num1! = num2) num3 # menej ako num3 = (num1 num2) num3 # menej ako sa rovná num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Výkon:

[1] NEPRAVDA [1] PRAVDA [1] PRAVDA [1] NEPRAVDA [1] PRAVDA [1] NEPRAVDA

Prevádzkovatelia úloh: Tieto operátory sa používajú na priraďovanie hodnôt k premenným v R. Priradenie je možné vykonať pomocou operátora priradenia(<-) alebo rovná sa operátor (=). Hodnotu premennej je možné priradiť dvoma spôsobmi, ľavým a pravým priradením.

LogickéPrevádzkovatelia: Títo operátori porovnávajú tieto dve entity a zvyčajne sa používajú s boolovskými (logickými) hodnotami, ako sú „a“, „alebo“a„Nie“.


R Programovanie: Podmienené príkazy

  1. Ak vyhlásenie: Príkaz If vám pomôže vyhodnotiť jeden výraz ako súčasť toku. Na vykonanie tohto vyhodnotenia stačí napísať kľúčové slovo If a za ním výraz, ktorý sa má vyhodnotiť. Nasledujúci vývojový diagram poskytne predstavu o tom, ako príkaz If riadi tok kódu: Zvážte nasledujúci príklad:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Výkon:

[1] „Číslo 1 je menšie alebo rovnaké ako číslo 2“
  • Inak vyhlásenie: Príkaz Else if vám pomôže rozšíriť vetvy na tok vytvorený príkazom If a dá vám príležitosť vyhodnotiť viac podmienok vytvorením nových vetiev toku. Nasledujúci tok vám poskytne predstavu o tom, ako príkaz else if vetví tok kódu:

    Uvažujme o nasledujúcom príklade:

    ako obsadiť v jave
    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else if ('Num1 == Num2) {print (' Num1 and Num2 are Equal ')}

    Výkon:

    [1] „Číslo 1 je menšie ako číslo 2“

  • Iné vyhlásenie: Príkaz else sa používa, keď sú všetky ostatné výrazy skontrolované a zistené, že sú neplatné. Bude to posledný príkaz, ktorý sa vykoná ako súčasť vetvy If - Else if. Nižšie uvedený tok vám poskytne lepšiu predstavu o tom, ako Else mení tok kódu:

Uvažujme o nasledujúcom príklade:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else print ('Num1 and Num2 are Equal')}

Výkon:

[1] „Čísla 1 a 2 sú si rovné“

R Programovanie: Smyčky

Príkaz slučky nám umožňuje vykonať príkaz alebo skupinu príkazov viackrát. V R sú hlavne 3 typy slučiek:

  1. opakujte Loop : Opakuje príkaz alebo skupinu príkazov, zatiaľ čo daná podmienka je PRAVDA. Opakovaná slučka je najlepším príkladom slučky s riadením ukončenia, kde sa najskôr vykoná kód a potom sa skontroluje podmienka, aby sa zistilo, či má byť ovládací prvok vo vnútri slučky alebo z nej ukončiť. Nižšie je uvedený tok riadenia v opakovanej slučke:
    Pozrime sa na príklad nižšie, aby sme pochopili, ako môžeme pomocou opakovacej slučky pridať n čísel, kým súčet nepresiahne 100:

    x = 2 opakovať {x = x ^ 2 print (x) if (x> 100) {break}

    Výkon:

    [1] 4 [1] 16 [1] 256
  2. zatiaľ čo Loop : Jat pomáha opakovať výrok alebo skupinu výrokov, kým je daná podmienka PRAVDA. Zatiaľ čo sa slučka v porovnaní s opakovacou slučkou mierne líši, je príkladom slučky riadenej vstupom, pri ktorej sa najskôr skontroluje podmienka a iba v prípade, že sa zistí, že je podmienka pravdivá, sa kontrolná časť dodá do slučky na vykonanie kódu . Nižšie je uvedený tok riadenia v slučke while:
    Pozrime sa na príklad nižšie, aby sme pridali súčet štvorcov pre prvých 10 čísel a pochopili, ako slučka while funguje lepšie:

    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Výkon:

    [jedenásť [pätnásť [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. pre slučku : Používa sa na opakovanie príkazu alebo skupiny výrazov po stanovený počet opakovaní. Na rozdiel od slučky repeat a while sa slučka for používa v situáciách, keď si uvedomujeme, koľkokrát je potrebné kód predtým vykonať. Je to podobné ako cyklus while, kde sa najskôr kontroluje podmienka a potom sa vykoná iba kód napísaný vo vnútri. Pozrime sa teraz na tok riadenia cyklu for:

Pozrime sa teraz na príklad, kde budeme pomocou slučky for tlačiť prvých 10 čísel:

pre (x v 1:10) {tlač (x)}

Výkon:

[jedenásť [1] 2 [1] 3 [1] 4 [pätnásť [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programovanie: Funkcie

Funkcia je blok organizovaného, ​​opakovane použiteľného kódu, ktorý sa používa na vykonanie jednej súvisiacej akcie. V R sú hlavne dva typy funkcií:

Preddefinované funkcie : Jedná sa o zabudované funkcie, ktoré môže používateľ použiť na svoju prácu ľahkosťr. Napr .: mean( X) , sum( X) , štvorcovýt ( X ), toupper( X ), atď.

Definované užívateľom Funkcie: Tieto funkcie vytvára užívateľ, aby vyhovel konkrétnym požiadavkám používateľa. Nižšie je uvedená syntax pre vytvorenie funkcie vR:

 func  názov_názvu  <– funkcia (arg_1, arg_2 a hellip){ // Telo funkcie }

Zvážte nasledujúci príklad jednoduchej funkcie na generovanie súčtu druhých mocnínz2 čísla:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Výstup: [1] 25

Dúfam, že sa vám páčilo čítanie tohto blogu o programovaní R. V tomto výučbe sme prebrali všetky základné informácie o R, takže teraz môžete začať cvičiť. Po tomto blogu o programovaní R prídem s ďalšími blogmi o R pre Analytics, takže zostaňte naladení.

Teraz, keď ste pochopili základné informácie o R, sa pozrite na autor: Edureka, dôveryhodná online vzdelávacia spoločnosť so sieťou viac ako 250 000 spokojných študentov rozmiestnených po celom svete. Školenie Edureka Data Analytics with R vám pomôže získať odborné znalosti v oblasti programovania R, manipulácie s dátami, prieskumnej analýzy dát, vizualizácie dát, dolovania dát, regresie, analýzy sentimentu a použitia RStudio na prípadové štúdie z reálneho života v maloobchode, sociálnych médiách.

Máte na nás otázku? Uveďte to prosím v sekcii komentárov v tomto blogu „Programovanie R“ a my sa vám ozveme čo najskôr.