R je jedným z najpopulárnejších analytických nástrojov. Ale okrem toho, že sa R používa na analytiku, je to aj programovací jazyk.S jeho rastom v IT priemysle rastie dopyt po kvalifikovaných alebo s porozumením jazyka R ako nástroja na analýzu údajov a programovacieho jazyka.V tomto blogu vám pomôžem pochopiť rôzne základy programovania R. V našom p revious Blog ,diskutovali sme o tom, prečo potrebujeme Analytics, čo je Business Analytics, prečo a kto používa R.
V tomto blogu pochopíme nižšie uvedené základné koncepty programovania R v nasledujúcom poradí:
Môžete absolvovať webinárový záznam programovacieho jazyka R, kde náš inštruktor podrobne vysvetlil témy na príkladoch, ktoré vám pomôžu lepšie pochopiť programovanie R.
Programovanie R pre začiatočníkov Výučba programovacieho jazyka R Edureka
Poďme teda ďalej a pozrime sa na prvý koncept R programovania - premenné.
Programovanie v R: Premenné
Premenné nie sú nič iné ako názov pamäťového miesta obsahujúceho hodnotu. Premenná v R môže ukladať číselné hodnoty, komplexné hodnoty, slová, matice a dokonca aj tabuľku. Prekvapivé, že?
Obr. Tvorbapremenných
Vyššie uvedený obrázok nám ukazuje, ako sa vytvárajú premenné a ako sa ukladajú do rôznych pamäťových blokov. V jazyku R nemusíme deklarovať premennú skôr, ako ju použijeme, na rozdiel od iných programovacích jazykov, ako sú Java, C, C ++ atď.
Poďme ďalej a pokúsme sa pochopiť, čo je dátový typ a rôzne dátové typy podporované v R.
Programovanie v R: dátové typy
V R samotná premenná nie je deklarovaná v žiadnom dátovom type, skôr získava dátový typ R objektu, ktorý je jej priradený. Takže R sa nazýva jazyk s dynamickým typom, čo znamená, že pri jeho použití v programe môžeme znova a znova meniť dátový typ tej istej premennej.
Dátové typy špecifikujú, aký typ hodnoty má premenná a aký typ matematických, relačných alebo logických operácií na ňu možno použiť bez spôsobenia chyby. V R je veľa dátových typov, nižšie sú však najčastejšie používané:
Poďme teraz diskutovať o každom z týchto typov údajov individuálne, počnúc vektormi.
Vektory
Vektory sú najzákladnejšie dátové objekty typu R a existuje šesť typov atómových vektorov. Ďalej uvádzame šesť atómových vektorov:
Logické : Používa sa na ukladanie logických hodnôt ako PRAVDA alebo NEPRAVDA .
Číselné : Používa sa na ukladanie kladných aj záporných čísel vrátane reálneho.
fibonacci c ++ kód
Napr .: 25, 7.1145, 96547
Celé číslo : Obsahuje všetky celočíselné hodnoty, t. J. Všetky kladné a záporné celé čísla.
Napr .: 45,479, -856,479, 0
Zložité : Jedná sa o tvar x + yi, kde xay sú číselné a i predstavuje druhú odmocninu -1.
Napr .: 4 + 3i
Postava : Používa sa na ukladanie jedného znaku, skupiny znakov (slov) alebo skupiny slov dohromady. Znaky môžu byť definované v jednoduchých úvodzovkách alebo dvojitých úvodzovkách.
Napr .: „Edureka“, „R je zábava sa učiť“.
Všeobecne je vektor definovaný a inicializovaný nasledujúcim spôsobom:
Vtr = c (2, 5, 11, 24) Alebo Vtr<- c(2, 5, 11 , 24)
Poďme ďalej a pochopme ďalšie typy údajov v R.
Zoznam
Zoznamy sú dosť podobné vektorom, ale Zoznamy sú objekty R, ktoré môžu obsahovať prvky rôznych typov, ako napríklad & mínus čísla, reťazce, vektory a ďalší zoznam.
Napr .:
Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist
Výkon:
[[1]] [1] 'Dobrý deň' 'Ahoj' Ako robíš '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] PRAVDA
Matrix
Matica je objekt R, v ktorom sú prvky usporiadané v dvojrozmernom obdĺžnikovom usporiadaní.
Základná syntax pre vytvorenie matice v R je & mínus
matica (data, nrow, ncol, byrow, dimnames)
Kde:
- údaje je vstupný vektor, ktorý sa stáva dátovým prvkom matice.
- nrow je počet riadkov, ktoré sa majú vytvoriť.
- ncol je počet stĺpcov, ktoré sa majú vytvoriť.
- byrow je logická stopa. Ak je TRUE, potom sú vstupné vektorové prvky usporiadané podľa riadkov.
- dimname sú názvy priradené riadkom a stĺpcom.
Príklad:
Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix
Výkon:
[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25
POLE
Polia v R sú dátové objekty, ktoré možno použiť na ukladanie údajov vo viac ako dvoch dimenziách. Berie vektory ako vstup a používa hodnoty v č parameter na vytvorenie poľa.
Základná syntax pre vytvorenie poľa v R je & mínus
pole (dáta, dim, dimnames)
Kde:
- údaje je vstupný vektor, ktorý sa stáva dátovými prvkami poľa.
- č je dimenzia poľa, kde odovzdáte počet riadkov, stĺpcov a počet matíc, ktoré majú byť vytvorené uvedenými dimenziami.
- dimname sú názvy priradené riadkom a stĺpcom.
Príklad:
Myarray<- array( c(1:16), dim=(4,4,2)) Myarray
Výkon:
,, jeden [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16
Dátový rámec
Dátový rámec je tabuľka alebo dvojrozmerná štruktúra typu poľa, v ktorej každý stĺpec obsahuje hodnoty jednej premennej a každý riadok obsahuje jednu sadu hodnôtprekaždý stĺpec. Ďalej uvádzame niektoré z charakteristík dátového rámca, ktoré je potrebné zohľadniť pri každej práci s nimi:
- Názvy stĺpcov by nemali byť prázdne.
- Každý stĺpec by mal obsahovať rovnaké množstvo dátových položiek.
- Dáta uložené v dátovom rámci môžu byť číselného, faktorového alebo znakového typu.
- Názvy riadkov by mali byť jedinečné.
Príklad:
emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Predaj', 'Financie', 'Marketing', 'HR (Ďalej len „výskum a vývoj“) emp.data<- data.frame(emp_id, emp_name, dept) emp.data
Výkon:
emp_id emp_name odd 1 100 predajov spoločnosti John 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D
Takže teraz, keď sme pochopili základné dátové typy R, je čas sa hlboko ponoriť do R pochopením konceptov dátových operátorov.
R Programovanie: Dátoví operátori
V R sú hlavne 4 dátové operátory, ktoré sú znázornené nižšie:
Aritmetické operátory : Tieto operátory nám pomáhajú vykonávať základné aritmetické operácie, ako sú sčítanie, odčítanie, násobenie atď.
Uvažujme o nasledujúcom príklade:
num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #umulus %%3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # podlahové rozdelenie num3 = num1% /% num2 num3
Výkon:
[1] 35 [pätnásť [1] 300 [1] 0,75 [1] 15 [1] 125 [jedenásť
Relační operátori : Tieto operátory nám pomáhajú vykonávať relačné operácie, ako je kontrola, či je premenná väčšia, menšia alebo rovná inej premennej. Výstupom relačnej operácie je vždy logická hodnota.
Zvážte nasledujúce príklady:
num1 = 15 num2 = 20 # sa rovná num3 = (num1 == num2) num3 # nerovná sa num3 = (num1! = num2) num3 # menej ako num3 = (num1 num2) num3 # menej ako sa rovná num1 = 5 num2 = 20 num3 = (num1 = num2) num3
Výkon:
[1] NEPRAVDA [1] PRAVDA [1] PRAVDA [1] NEPRAVDA [1] PRAVDA [1] NEPRAVDA
Prevádzkovatelia úloh: Tieto operátory sa používajú na priraďovanie hodnôt k premenným v R. Priradenie je možné vykonať pomocou operátora priradenia(<-) alebo rovná sa operátor (=). Hodnotu premennej je možné priradiť dvoma spôsobmi, ľavým a pravým priradením.
LogickéPrevádzkovatelia: Títo operátori porovnávajú tieto dve entity a zvyčajne sa používajú s boolovskými (logickými) hodnotami, ako sú „a“, „alebo“a„Nie“.
R Programovanie: Podmienené príkazy
- Ak vyhlásenie: Príkaz If vám pomôže vyhodnotiť jeden výraz ako súčasť toku. Na vykonanie tohto vyhodnotenia stačí napísať kľúčové slovo If a za ním výraz, ktorý sa má vyhodnotiť. Nasledujúci vývojový diagram poskytne predstavu o tom, ako príkaz If riadi tok kódu: Zvážte nasledujúci príklad:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2')
Výkon:
[1] „Číslo 1 je menšie alebo rovnaké ako číslo 2“
- Inak vyhlásenie: Príkaz Else if vám pomôže rozšíriť vetvy na tok vytvorený príkazom If a dá vám príležitosť vyhodnotiť viac podmienok vytvorením nových vetiev toku. Nasledujúci tok vám poskytne predstavu o tom, ako príkaz else if vetví tok kódu:
Uvažujme o nasledujúcom príklade:ako obsadiť v jave
Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else if ('Num1 == Num2) {print (' Num1 and Num2 are Equal ')}
Výkon:
[1] „Číslo 1 je menšie ako číslo 2“
- Iné vyhlásenie: Príkaz else sa používa, keď sú všetky ostatné výrazy skontrolované a zistené, že sú neplatné. Bude to posledný príkaz, ktorý sa vykoná ako súčasť vetvy If - Else if. Nižšie uvedený tok vám poskytne lepšiu predstavu o tom, ako Else mení tok kódu:
Uvažujme o nasledujúcom príklade:
Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is lesser than Num1')} else print ('Num1 and Num2 are Equal')}
Výkon:
[1] „Čísla 1 a 2 sú si rovné“
R Programovanie: Smyčky
Príkaz slučky nám umožňuje vykonať príkaz alebo skupinu príkazov viackrát. V R sú hlavne 3 typy slučiek:
- opakujte Loop : Opakuje príkaz alebo skupinu príkazov, zatiaľ čo daná podmienka je PRAVDA. Opakovaná slučka je najlepším príkladom slučky s riadením ukončenia, kde sa najskôr vykoná kód a potom sa skontroluje podmienka, aby sa zistilo, či má byť ovládací prvok vo vnútri slučky alebo z nej ukončiť. Nižšie je uvedený tok riadenia v opakovanej slučke:
Pozrime sa na príklad nižšie, aby sme pochopili, ako môžeme pomocou opakovacej slučky pridať n čísel, kým súčet nepresiahne 100:x = 2 opakovať {x = x ^ 2 print (x) if (x> 100) {break}
Výkon:
[1] 4 [1] 16 [1] 256
- zatiaľ čo Loop : Jat pomáha opakovať výrok alebo skupinu výrokov, kým je daná podmienka PRAVDA. Zatiaľ čo sa slučka v porovnaní s opakovacou slučkou mierne líši, je príkladom slučky riadenej vstupom, pri ktorej sa najskôr skontroluje podmienka a iba v prípade, že sa zistí, že je podmienka pravdivá, sa kontrolná časť dodá do slučky na vykonanie kódu . Nižšie je uvedený tok riadenia v slučke while:
Pozrime sa na príklad nižšie, aby sme pridali súčet štvorcov pre prvých 10 čísel a pochopili, ako slučka while funguje lepšie:num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) }
Výkon:[jedenásť [pätnásť [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
- pre slučku : Používa sa na opakovanie príkazu alebo skupiny výrazov po stanovený počet opakovaní. Na rozdiel od slučky repeat a while sa slučka for používa v situáciách, keď si uvedomujeme, koľkokrát je potrebné kód predtým vykonať. Je to podobné ako cyklus while, kde sa najskôr kontroluje podmienka a potom sa vykoná iba kód napísaný vo vnútri. Pozrime sa teraz na tok riadenia cyklu for:
Pozrime sa teraz na príklad, kde budeme pomocou slučky for tlačiť prvých 10 čísel:
pre (x v 1:10) {tlač (x)}
Výkon:
[jedenásť [1] 2 [1] 3 [1] 4 [pätnásť [1] 6 [1] 7 [1] 8 [1] 9 [1] 10
R Programovanie: Funkcie
Funkcia je blok organizovaného, opakovane použiteľného kódu, ktorý sa používa na vykonanie jednej súvisiacej akcie. V R sú hlavne dva typy funkcií:
Preddefinované funkcie : Jedná sa o zabudované funkcie, ktoré môže používateľ použiť na svoju prácu ľahkosťr. Napr .: mean( X) , sum( X) , štvorcovýt ( X ), toupper( X ), atď.
Definované užívateľom Funkcie: Tieto funkcie vytvára užívateľ, aby vyhovel konkrétnym požiadavkám používateľa. Nižšie je uvedená syntax pre vytvorenie funkcie vR:
func názov_názvu <– funkcia (arg_1, arg_2 a hellip){ // Telo funkcie }
Zvážte nasledujúci príklad jednoduchej funkcie na generovanie súčtu druhých mocnínz2 čísla:
sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4)
Výstup: [1] 25
Dúfam, že sa vám páčilo čítanie tohto blogu o programovaní R. V tomto výučbe sme prebrali všetky základné informácie o R, takže teraz môžete začať cvičiť. Po tomto blogu o programovaní R prídem s ďalšími blogmi o R pre Analytics, takže zostaňte naladení.
Teraz, keď ste pochopili základné informácie o R, sa pozrite na autor: Edureka, dôveryhodná online vzdelávacia spoločnosť so sieťou viac ako 250 000 spokojných študentov rozmiestnených po celom svete. Školenie Edureka Data Analytics with R vám pomôže získať odborné znalosti v oblasti programovania R, manipulácie s dátami, prieskumnej analýzy dát, vizualizácie dát, dolovania dát, regresie, analýzy sentimentu a použitia RStudio na prípadové štúdie z reálneho života v maloobchode, sociálnych médiách.
Máte na nás otázku? Uveďte to prosím v sekcii komentárov v tomto blogu „Programovanie R“ a my sa vám ozveme čo najskôr.