R Tutorial - Vodič za početnike za učenje R programiranja



Ovaj blog na R Tutorialu upoznaje vas s R alatom i pomaže vam detaljno razumjeti razne osnove programiranja R-a s primjerima.

R je najpopularniji alat za analitiku podataka jer je otvoren, fleksibilan, nudi više paketa i ima ogromnu zajednicu. Dizajniran je za softverske programere, statističare i rudače podataka, podjednako, a time i zbog popularnosti .U ovom blogu R Tutorial dat ću vam cjelovit uvid u R s primjerima.

Ispod su teme u ovom blogu R Tutorial o kojima ću raspravljati u sljedećem slijedu:





  1. Zašto nam treba Analytics ?
  2. Što je poslovna analitika ?
  3. Zašto R i Tko koristi R ?
  4. Instalacija R
  5. Operateri podataka
  6. Tipovi podataka
  7. Kontrola protoka

R Vodič: Zašto nam treba analitika?

Prije nego što odgovorim na pitanje, dopustite mi da vas upoznam s nekim problemima i njihovim rješenjima u R na više domena.



bankarstvo - R Vodič - Edureka

Bankarstvo :

U bankama se svakodnevno generira velika količina podataka o klijentima. WHile, koji redovito radi s milijunima kupaca, postaje teško pratiti njihove hipoteke.



Riješenje :

R izrađuje prilagođeni model koji održava zajmove dodijeljene svakom pojedinačnom kupcu koji nam pomaže da odlučimo o iznosu koji će kupac platiti s vremenom.

Osiguranje :

Osiguranje uvelike ovisi o predviđanju. Teško jeodlučiti koju politiku prihvatiti ili odbiti.

Riješenje:

Korištenjem kontinuiranog kreditnog izvješća kao ulaznog podatka, možemo stvoriti model u R koji ne samo da će procijeniti apetit za rizikom već i izraditi prediktivnu prognozu.

kako pretvoriti iz dvostrukog u int java -

Zdravstvo:

Svake godine milijuni ljudi su primljeni u bolnicu, a milijarde se potroše godišnje samo u procesu prijema.

Riješenje :

S obzirom na povijest pacijenta i povijest bolesti, može se izgraditi prediktivni model koji će identificirati tko je u riziku za hospitalizaciju i u kojoj mjeri treba prilagoditi medicinsku opremu.

Sada znamo kako analitika podataka pomaže organizacijama da iskoriste svoje podatke i koriste ih za prepoznavanje novih prilika. Ako govorimo o potrebi analitike u organizaciji, morate naići na ova 4 aspekta:

Dalje, krenimo naprijed na blogu R tutorial, gdje ćemo prvo razumjeti što je zapravo poslovna analitika.

R Vodič: Što je poslovna analitika?

Poslovna analitika postupak je ispitivanja velikih skupova podataka i postizanja skrivenih obrazaca, korelacija i drugih uvida. U osnovi vam pomaže razumjeti sve podatke koje ste prikupili, bilo da se radi o organizacijskim podacima, podacima o istraživanju tržišta ili proizvoda ili bilo kojoj drugoj vrsti podataka. Postaje vam lako donositi bolje odluke, bolje proizvode, bolje marketinške strategije itd. Pogledajte donju sliku za bolje razumijevanje:

Ako pogledate gornju sliku, vaši podaci na prvoj slici su raspršeni. Ako želite nešto specifično, poput određenog zapisa u bazi podataka, to postaje glomazno. Da biste to pojednostavili, potrebna vam je analiza. Analizom postaje lako uspostaviti korelaciju između podataka. Jednom kada utvrdite što učiniti, postaje vam vrlo lako donositi odluke poput, kojim putem želite ići ili u smislu poslovne analitike, koji put će dovesti do boljitka vaše organizacije.

No, ne možete očekivati ​​da ljudi iz lanca gore uvijek razumiju sirove podatke koje im pružate nakon analitike. Dakle, kako bismo prevladali ovaj jaz, imamo koncept vizualizacija podataka .

Vizualizacija podataka : Vizualizacija podataka vizualni je pristup ogromnim količinama podataka koje ste generirali nakon analitike. Ljudski um obrađuje vizualne slike, a vizualna grafika je bolja od usporedbe sa sirovim podacima. Uvijek nam je lako razumjeti tortni ili trakasti grafikon u usporedbi sa sirovim brojevima. Sad se možda pitate kako možete postići ovu vizualizaciju podataka iz podataka koje ste već analizirali?
Na tržištu su dostupni različiti alati za vizualizaciju podataka:

Sigurno se svi pitate da već postoji toliko mnogo alata koji vam pomažu u postizanju vizualizacije podataka i određene količine analitike, zašto ići s R?

Dakle, moja sljedeća tema u blogu s udžbenicima R bavi se pitanjem 'zašto R' i 'tko koristi R'.

R Vodič: Zašto R i tko koristi R?

Zašto R?

R je programski i statistički jezik.

R se koristi za analizu i vizualizaciju podataka.

R je jednostavan i lak za učenje, čitanje i pisanje.

R je primjer FLOSS-a (besplatnog softvera Libre i softvera otvorenog koda) gdje se mogu slobodno distribuirati kopije ovog softvera, čitati njegov izvorni kod, mijenjati itd.

Tko koristi R?

  • Zavod za financijsku zaštitu potrošača koristi R za analizu podataka
  • Statističari John Deere-a koriste R za modeliranje vremenskih serija i geoprostornu analizu na pouzdan i ponovljiv način.
  • Bank of America koristi R za izvještavanje.
  • R je dio tehnološkog niza iza Foursquareovog poznatog mehanizma za preporuke.
  • ANZ, četvrta najveća banka u Australiji, koja koristi R za analizu kreditnog rizika.
  • Google koristi R za predviđanje ekonomske aktivnosti.
  • Mozilla, zaklada odgovorna za web preglednik Firefox, koristi R za vizualizaciju mrežne aktivnosti.

Ispod su neke od domena na kojima se koristi R:

Sada, krenimo naprijed u R tutorial blogu i instalirajmo R.

R Vodič: Instalacija R

Dopustite mi da vas vodim kroz postupak instaliranja R-a na vaš sustav. Samo slijedite korake u nastavku:

Korak 1 : Idite na link- https://cran.r-project.org/

Korak 2 : Preuzmite i instalirajte R 3.3.3 na svoj sustav.

Pogledajte donji snimak zaslona da biste dobili bolje razumijevanje.

Slijedeći gornje korake, završili ste s instalacijskim dijelom R. Sada kodiranje u R možete izravno započeti preuzimanjem RStudio IDE-a. Da biste to preuzeli, slijedite korake u nastavku:

Korak 1 : Idite na vezu https://www.rstudio.com/

Korak 2 : Preuzmite i instalirajte Rstudio na svoj sustav.

Nakon što sve instalirate, svi ste spremni za kodiranje!

R Vodič za početnike | R Vodič za programiranje | Edureka

Dalje, krenimo dalje na blogu R Tutorial i shvatimo što su operateri podataka u R.

R Vodič: Operateri podataka u R

Uglavnom postoji 5 različitih vrsta operatora, koji su navedeni u nastavku:

  1. Aritmetički operatori : Izvodite aritmetičke operacije kao što su zbrajanje, oduzimanje, množenje, dijeljenje itd.
  2. Operatori dodjele :Operatori dodjele koriste se za dodjeljivanje vrijednosti. Na primjer:
  • Operator dodjele =
    Sintaksa:
    ime varijable = vrijednost
> x = 5 >x 
Izlaz: [1] 5
  • Operator dodjele<-
    Sintaksa:
    naziv varijable<- value

    > x<- 15 > x
    Izlaz: [1] 15
  • Operator dodjele<<-
    Sintaksa:
    naziv varijable<<- value
> x<<- 2 > x
Izlaz: [1] 2
  • Operator dodjele ->
    Sintaksa:
    vrijednost -> naziv varijable

    > 25 -> x > x 
    Izlaz: [1] 25

3. Relacijski operater : Definira vezu između dva entiteta. Na primjer: ,<=,!= etc.

> xx! = 2
Izlaz:[1] ISTINA

4. Logički operatori : Ovi operateri uspoređuju dva entiteta i obično se koriste s logičkim (logičkim) vrijednostima kao što su &, | i!.

> x2 i 3
Izlaz:[1] ISTINA

5. Posebni operateri : Ovi se operateri koriste za određenu svrhu, a ne za logičko računanje. Na primjer:

  • Stvara niz brojeva u nizu za vektor.

    > xx
    Izlaz: [1] 2 3 4 5 6 7 8
  • % u% Ovaj se operator koristi za utvrđivanje pripada li element vektoru.
    Primjer

    > xyy% u% x
    Izlaz: [1] ISTINA

R Vodič: Vrste podataka

Vrste podataka koriste se za pohranu podataka. U R, ne trebamo deklarirati varijablu kao neki tip podataka. Varijablama se dodjeljuju R-Objekti, a tip podataka R-objekta postaje tip podataka varijable.U R-u je prisutno uglavnom šest vrsta podataka:

Krenimo detaljnije o svakom od njih:

Vektor : Vector je slijed elemenata podataka istog osnovnog tipa. Primjer:

vtr = (1, 3, 5, 7 9)

ili

vtr<- (1, 3, 5 ,7 9)

kako napraviti snagu u javi -

Postoji 5 atomskih vektora, koji se nazivaju i pet klasa vektora.

Popis : Popisi su R objekti koji sadrže elemente različitih vrsta kao što su & minus brojevi, nizovi, vektori i drugi popis unutar njih.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = popis (n, s, TRUE) > x

Izlaz -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] ISTINA

Nizovi : Nizovi su R podatkovni objekti koji mogu pohraniti podatke u više od dvije dimenzije. Kao ulaz uzima vektore i koristi vrijednosti u parametru dim za stvaranje niza.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) proizlaziti<- array(c(vector1,vector2),dim = c(3,3,2))

Izlaz -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Nizovi : Matrice su R objekti u kojima su elementi raspoređeni u dvodimenzionalni pravokutni raspored. Matrica se kreira pomoću funkcije matrix (). Primjer: matrica (podaci, nrow, ncol, byrow, dimnames) gdje,

podaci je ulazni vektor koji postaje podatkovni elementi matrice.

nrow je broj redaka koji će se stvoriti.

ncol je broj stupaca koje treba stvoriti.

byrow je logičan trag. Ako je ISTINA, tada su ulazni vektorski elementi poredani po redovima.

dimname je imena dodijeljena retcima i stupcima.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Izlaz :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Čimbenici : Čimbenici su podatkovni objekti koji se koriste za kategorizaciju podataka i pohranu kao razine. Mogu pohraniti i nizove i cijele brojeve. Korisni su u analizi podataka za statističko modeliranje.

> podaci<- c('East','West','East','North','North','East','West','West“,'East“) > podaci_faktora<- factor(data) > podaci_faktora

Izlaz :

[1] Istok Zapad Istok Sjever Sjever Istok Zapad Zapad Istok Razine: Istok Sjeverozapad

Okviri podataka : Okvir podataka je tablica ili dvodimenzionalna struktura nalik nizu u kojoj svaki stupac sadrži vrijednosti jedne varijable, a svaki redak sadrži jedan skup vrijednosti iz svakog stupca.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > ocjene = c (623,3,515,2,611,0,729,0,843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Izlaz :

std_id oznake std_name 1 1 Rick 623,30 2 2 I 515.20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843.25

Ovime dolazimo do kraja različitih tipova podataka u R. Dalje, krenimo naprijed u blogu R Tutorial i shvatimo još jedan ključni koncept - izjave o kontroli protoka.

R Vodič: Izjave o kontroli protoka

Izjave o kontroli protoka igraju vrlo važnu ulogu jer vam omogućuju kontrolu tijeka izvršavanja skripte unutar funkcije. Najčešće korištene izjave o kontroli protoka predstavljene su na donjoj slici:

Sada, razgovarajmo o svakom od njih s primjerima.

R Vodič: Izjave o selektoru

  • Ako je Izjava o kontroli : Ova kontrolna izjava procjenjuje jedan uvjet. Prilično je jednostavno jer ima samo jednu ključnu riječ 'if', nakon koje slijedi uvjet, a zatim određeni skup izjava koje treba izvršiti u slučaju da je istina. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U ovom dijagramu toka kôd će odgovoriti na sljedeći način:

  1. Prije svega, ući će u petlju gdje provjerava stanje.
  2. Ako je uvjet istinit, izvršit će se uvjetni kod ili napisani izrazi.
  3. Ako je uvjet netačan, izjave se zanemaruju.

Ispod je primjer ako naredba control u R. Pokušajte pokrenuti ovaj primjer u R Studio.

x = 2 ponoviti {x = x ^ 2 print (x) if (x> 100) {break}

Izlaz:

[1] 4 [1] 16 [1] 256
  • Ako je druga izjava o kontroli :Ispits tip izjave o kontroliprocjenjuje skupinu uvjeta i odabire tvrdnje. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U ovom dijagramu toka kôd će odgovoriti na sljedeći način:

  1. Prije svega, ući će u petlju gdje provjerava stanje.
  2. Ako je uvjet istinit, izvršit će se prvi izrazi 'ako'.
  3. Ako je uvjet netačan, on prelazi na uvjet 'else if', a ako je istina, izvršit će se 'else if' kôd.
  4. Konačno, ako je i 'if if' kôd netačan, tada će preći na 'else' kôd i izvršit će se. To znači da ako nijedan od ovih uvjeta nije istinit, tada se izvršava naredba ‘else’.

Ispod je primjer ako drugo naredba control u R. Pokušajte pokrenuti ovaj primjer u R Studio.

x5) {print ('x je veći od 5')} elseif (x == 5) {print ('x je jednak 5')} else {print ('x nije veći od 5')}

Izlaz:

[1] 'x je jednako 5'
  • Izjave o prebacivanju : Ove se kontrolne izjave u osnovi koriste za usporedbu određenog izraza s poznatom vrijednošću. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U ovom dijagramu toka slučaja Switch, kôd će odgovoriti u sljedećim koracima:

  1. Prije svega ući će u sklopku koja ima izraz.
  2. Sljedeće će ići na slučaj 1, provjerava vrijednost proslijeđenu uvjetu. Ako je istina, izvršit će se blok Izjava. Nakon toga prekinut će se s tog kućišta prekidača.
  3. U slučaju da je netačno, tada će se prebaciti na sljedeći slučaj. Ako je uvjet slučaja 2 istinit, izvršit će naredbu i odvojiti se od tog slučaja, u suprotnom će opet prijeći na sljedeći slučaj.
  4. Recimo sada da niste naveli nijedan slučaj ili je došlo do pogrešnog unosa od korisnika, a zatim će otići na zadani slučaj gdje će ispisati vašu zadanu izjavu.

Ispod je primjer naredbe switch u R. Pokušajte pokrenuti ovaj primjer u R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Izlaz:

[1] 275

R Vodič: Izjave petlje

Petlje vam pomažu da ponovite određeni skup radnji tako da ih ne morate izvoditi više puta. Zamislite da trebate izvesti operaciju 10 puta, ako započnete s pisanjem koda za svaki put, duljina programa se povećava i bilo bi vam teško kasnije ga razumjeti. Ali istodobno korištenjem petlje, ako napišem istu izjavu unutar petlje, to štedi vrijeme i olakšava čitljivost koda. Također se više optimizira s obzirom na učinkovitost koda.

Na gornjoj slici, ' ponoviti' i ' dok 'Izjave vam pomažu u izvršavanju određenog skupa pravila dok uvjet nije istinit, ali' za' je izjava petlje koja se koristi kada znate koliko puta želite ponoviti blok izjave. Sada, ako znate da ga želite ponoviti 10 puta, tada ćete ići s izjavom 'za', ali ako niste sigurni koliko puta želite da se kôd ponovi, ići ćete s 'ponoviti' ili petlja 'dok'.

Razgovarajmo o svakom od njih s primjerima.

  • Ponoviti : Ponavljajuća petlja pomaže u izvršavanju istog skupa koda iznova i iznova dok se ne ispuni uvjet zaustavljanja. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U gornjem dijagramu toka kôd će odgovoriti u sljedećim koracima:

  1. Prije svega ući će i izvršiti skup koda.
  2. Dalje će provjeriti stanje, ako je istina, vratit će se i ponovno izvršiti isti skup koda dok ne bude zamišljen kao lažan.
  3. Ako se utvrdi da je lažno, izravno će izaći iz petlje.
  • Dok : Izraz while također pomaže u izvršavanju istog skupa koda iznova i iznova dok se ne ispuni uvjet zaustavljanja. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U gornjem dijagramu toka kôd će odgovoriti u sljedećim koracima:

  1. Prije svega provjerit će stanje.
  2. Ako se utvrdi da je istina, izvršit će set koda.
  3. Dalje, ponovno provjerava stanje, ako je istinito, ponovno će izvršiti isti kod. Čim se utvrdi da je uvjet netačan, on odmah izlazi iz petlje.

Ispod je primjer izjave while u R. Pokušajte pokrenuti ovaj primjer u R Studiju.

x = 2 dok (x<1000) { x=x^2 print(x) } 

Izlaz:

4 16 256 65 536

Dakle, sigurno se pitate kako se ove dvije izjave razlikuju? Da razjasnim vašu sumnju!
Ovdje je glavna razlika između ponavljanja i while izjave da se ona mijenja s obzirom na vaše stanje. Dok loop u osnovi definira kada ćete unijeti petlju za izvršavanje naredbi i ponoviti petlja definira kada izađete iz petlje nakon izvršavanja naredbi. Dakle, ove dvije izjave poznate su kao petlja kontrole ulaska i kontrole izlaska. Tako se razlikuju izjave while i repeat.

  • Za petlju: Jer se petlje koriste kada trebate izvršiti blok koda nekoliko puta. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U gornjem dijagramu toka kôd će odgovoriti u sljedećim koracima:

  1. Prije svega postoji inicijalizacija gdje odredite koliko puta želite da se petlja ponovi.
  2. Zatim provjerava stanje. Ako je uvjet istinit, izvršit će set koda određeni broj puta.
  3. Čim se utvrdi da je uvjet netačan, on odmah izlazi iz petlje.

Ispod je primjer izjave u R. Pokušajte pokrenuti ovaj primjer u R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Izlaz:

7 19 25 65 45

Dalje, prijeđimo na naš zadnji skup izjava na blogu R Tutorial, tj. Skočni iskazi.

R Vodič: Izjave o skokovima

Izjava o prekidu : Izvodi prekida pomažu u zaustavljanju programa i nastavljaju kontrolu na sljedeći izraz nakon petlje. Te se izjave također koriste u slučaju prekidača. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U gornjem dijagramu toka kôd će odgovoriti u sljedećim koracima:

  1. Prije svega, ući će u petlju gdje provjerava stanje.
  2. Ako je uvjet petlje netačan, on izravno izlazi iz petlje.
  3. Ako je uvjet istinit, provjerit će stanje prekida.
  4. Ako je uvjet prekida istinit, postoji iz petlje.
  5. Ako je uvjet prekida netačan, tada će izvršiti izraze koji su preostali u petlji, a zatim ponoviti iste korake.

Ispod je primjer izraza skok u R. Pokušajte pokrenuti ovaj primjer u R Studiju.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Izlaz:

[1] 1 [1] 2

Sljedeća izjava : Sljedeća se izjava koristi kada želite preskočiti trenutnu iteraciju petlje bez prekida. Sljedeća izjava prilično je slična 'nastavi' u drugom programskom jeziku. Pogledajte donji dijagram toka kako biste stekli bolje razumijevanje:

U gornjem dijagramu toka kôd će odgovoriti u sljedećim koracima:

java algoritmi i strukture podataka
  1. Prije svega, ući će u petlju gdje provjerava stanje.

  2. Ako je uvjet petlje netačan, on izravno izlazi iz petlje.

  3. Ako je uvjet petlje istinit, izvršit će naredbe bloka 1.

  4. Nakon toga provjerit će da li postoji sljedeća izjava. Ako je prisutan, tada se izrazi nakon toga neće izvršiti u istoj iteraciji petlje.

  5. Ako naredba ‘next’ nije prisutna, tada će se izvršiti sve izjave nakon toga.

Ispod je primjer sljedeće izjave u R. Pokušajte pokrenuti ovaj primjer u R Studio.

for (i u 1:15) {if ((i %% 2) == 0) {next} print (i)}

Izlaz:

1 3 5 7 9 11 13 15

Ovo je kraj R tutorial bloga. Nadam se da ste jasni za svaki koncept o kojem sam gore govorio. Pratite nas, moj sljedeći blog bit će na R treningu, gdje ću detaljno objasniti neke koncepte R s bivšimdovoljno.

Sad kad ste razumjeli osnove R, pogledajte Edureka, pouzdana tvrtka za internetsko učenje s mrežom od više od 250 000 zadovoljnih učenika raširenih širom svijeta. Edurekina analiza podataka s R obukom pomoći će vam da steknete stručnost u programiranju programa R, manipulacijom podacima, istraživačkom analizom podataka, vizualizacijom podataka, rudarstvom podataka, regresijom, analizom raspoloženja i korištenjem R Studija za stvarne studije slučajeva na malo, društvenim mrežama.

Imate pitanje za nas? Molimo vas da ga spominjete u odjeljku za komentare ovog bloga 'R Tutorial' i javit ćemo vam se što je prije moguće.