Vodič za SAS: Sve što trebate znati o SAS-u



Na ovom blogu s vodičima za SAS saznajte što je SAS? Što može učiniti i shvatiti zašto je SAS jedan od najpopularnijih analitičkih alata na tržištu.

Pitanja - Vodič za SAS - EdurekaŠto je SAS? Zašto bih trebao učiti SAS?Koje su prednosti ?Tražite li odgovore na gornja pitanja? Ako da, onda ovoVodič za SASodgovorit će na sva vaša pitanja.

Mi ljudi smo znatiželjna vrsta, zar ne? Uvijek želimo znati više. Ta nas želja za znanjem tjera da postavljamo više pitanja, a zauzvrat nas traži još odgovora.





Razmotrimo jednostavan problem. Što ako želite ići u kupovinu i imate dvije mogućnosti na odabir:

  • Kupon od 149 dolara
  • Kupon od 25%

Možda se pitate koja će vam opcija pomoći da uštedite više?Ovo je jedan scenarij. Imamo mnogo takvih pitanja i možemo naići na različite scenarije u kojima ne možemo donijeti ispravnu odluku. Da li vas ova pitanja zanimaju?o pronalaženju odgovora? Ako je odgovor da, tada će vam se svidjeti analitika, a također i alati koji će vam pomoći u analizi podataka. SAS je jedan od takvih alata.



Vodič za SAS

Na kraju članka trebali biste se upoznati sa sljedećim temama:

Vaše razumijevanje SAS-a je nepotpuno bez razumijevanja analitika podataka.Dakle, krenimo.

Što je Analitika podataka?

Riječ 'analitika' već je neko vrijeme u trendu, no ne postoji jedinstveni način da se definira. Pokušajmo razumjeti analitiku na jednostavnom primjeru. Zamislite, želite kupiti majicu. Koja bi moguća pitanja mogla pasti na pamet? Dopustite mi da vam pomognem s nekoliko uobičajenih:



  • Kada trebam kupiti majicu?
  • Koliko bih trebao potrošiti za majicu?
  • Trebam li majicu kupiti putem interneta ili posjetiti trgovinu?
  • Ako se majicu odlučim kupiti putem interneta, s koje web stranice bih je trebao kupiti?
  • Ako se odlučim posjetiti trgovinu, koju bih trgovinu trebao posjetiti?

Odluka može ovisiti o čimbenicima kao što su vrijeme, novac, sklonosti i prethodna iskustva. Nastavimo s gornjim problemom. Uzmite u obzir sljedeće:

  • U nedjelju ste slobodni
  • Vaš proračun iznosi 300 USD
  • Više volite posjetiti trgovinu jer vam omogućuje da sami odaberete majicu
  • Odlučili ste posjetiti određenu trgovinu jer vas prethodni posjet trgovini nije razočarao

Na temelju gornjih stavki, pretpostavimo da u nedjelju odlučite posjetiti trgovinu i kupiti majicu koja će vas koštati oko 265 američkih dolara. Razmotrili ste nekoliko mogućnosti, odabrali one koje odgovaraju zahtjevu i donijeli odluku.

Pa jednostavnim riječima upravo ste napravili neku vrstu analize koja će vam pomoći da kupite majicu. Dopustite mi da to dodatno pojednostavim. Tvoj mozak je ovdje učinio dvije jednostavne stvari:

  • Prikupljeni podaci prema vašem zahtjevu
  • Razumjeli ste podatke i na temelju tih podataka pomogli vam da se odlučite za kupnju majice.

To možete učiniti pomoću analitike. Možete prikupljati informacije, analizirati ih i donositi bolje odluke. Gornji je primjer biolako, tako da biste mogli donijeti odluku na temelju nekoliko pretpostavki. Što ako problem i donošenje odluka nisu bili tako laki?

Razmotrite ovaj problem s poslovnog stajališta.Pretpostavimo da tvrtka za e-trgovinu želi proučiti obrasce kupnje svojih kupaca na temelju prethodnih podataka. Tvrtka će morati uzeti u obzir tisuće zapisa, zar ne? Sada, zamislite podatke o kojima smo upravo razgovarali ili permutacije i kombinacije koje bi tvrtka mogla uzeti u obzir za različite preferencije koje ljudi mogu imati.

Također, tvrtka možda neće imati sve podatke. Na primjer, ako kupac nije kupio majicu, koji su čimbenici naveli kupca da odluči ne kupiti majicu? Podaci koji nedostaju mogu stvoriti probleme. Kako se nosimo s tim problemima? Kako postupamo s takvim podacima? Dobro,ti problemi postaju lakši kada koristimo analitiku. Korištenjem analitike možete ukloniti nepotrebne podatke i optimizirati relevantne informacije kako biste pronašli uzorke koji vam mogu pomoći u donošenju boljih odluka.

Na raspolaganju imamo mnogo alata za analizu i pojednostavljivanje takvih problema.Jedan od istaknutih alata je SAS. Ovaj Vodič za SAS pomoći će vam da razumijete SAS i kako se on može koristiti za rješavanje naših problema.

Pretplatite se na naš youtube kanal da biste dobivali nova ažuriranja ..!

Potreba za SAS-om

Tržište analitike izuzetno je poraslo u posljednjih nekoliko godina. To je rezultiralo povećanjem broja korištenih alata. Sve ovo je korisno na jedan ili drugi način. Krenimo dalje s našim SAS tutorijalom i pogledajte nekoliko najčešće korištenih alata na tržištu.

  • SAS: To je najčešće korišten alat na tržištu komercijalne analitike. Uz mnoštvo statističkih funkcija i dobar GUI (Enterprise Guide & Miner), zasigurno predvodi tržište.
  • R: To je softver otvorenog koda. Lako je naučiti R jer je dobro dokumentiran. Isplativ je i ima snažne statističke mogućnosti.
  • Piton je drugi skriptni jezik otvorenog koda koji se široko koristi. Upotreba Pythona s vremenom je rasla.Danas sportske knjižnice kao što su Numpy, Scipy i MatPlotLib. Pomoću ovih knjižnica možete izvršiti gotovo bilo koju statističku operaciju ili izgraditi bilo koji model.

SAS vs. R vs. Piton

Usporedimo ova tri alata u ovom vodiču za SAS, a za usporedbu ću upotrijebiti sljedeće parametre.

1) Poslovi

Budući da je vitalni alat za istraživanje i analitiku, zasigurno je stvorio puno zahtjeva za resursima osposobljenim za SAS. SAS drži 70% tržišnog udjela. R ima 15%, a python najmanje, što je manje od 10%.

2) Jednostavnost razumijevanja

SAS je jedan od najlakših alata za učenje. Čak i ljudi s ograničenim znanjem SQL-a mogu ga lako naučiti. Python nije tako zgodan kao SAS za analitiku. R zahtijeva od vas da napišete zamorne i dugotrajne kodove, što daje SAS-u prednost.

3) Jezik četvrte generacije

SAS je programska jezik četvrte generacije. Programski jezik četvrte generacije je 'programski jezik dizajniran s posebnom svrhom, kao što je razvoj komercijalnog poslovnog softvera.' Dizajniran je za smanjenje napora u programiranju i minimiziranje vremena i troškova potrebnih za razvoj softvera. R i Python nisu jezici četvrte generacije.

4) Fleksibilan

SAS ostaje u toku s potrebama tržišta. Jednostavnost integracije čini je fleksibilnijom i uporabnijom. To također znači da se dobro spaja s drugim tehnologijama. Čineći ga fleksibilnim u pravom smislu.

Navedeni razlozi snažno podupiru tvrdnju da SAS čvrsto drži svoju vodeću poziciju na tržištu.Sad kad smo vidjeli usporedbu ova tri analitička alata. Krećući se naprijed u ovom vodiču za SAS omogućimo nam razumijevanje SAS-a malo detaljnije.

Vodič za SAS: Što je SAS ?

Pokušajmo sada razumjeti što jest SAS i čime se bavi?

SAS je skraćenica od Sustav statističke analize. Riječ je o softverskom paketu koji je razvio SAS Institute.

SAS aplikacije

Slika ispod prikazuje nekoliko primjena SAS-a:

Jednostavnim riječima, SAS može obrađivati ​​složene podatke i stvoriti značajne uvide koji bi organizacijama pomogli u donošenju boljih odluka ili predviđanju mogućih ishoda u bliskoj budućnosti.

možete li proširiti i implementirati u javi

SAS vam omogućuje miniranje, izmjenu, upravljanje i preuzimanje podataka iz različitih izvora i njihovu analizu.Grafičko korisničko sučelje usmjeri i klikni SAS pomaže netehničkim korisnicima da koriste njegove značajke za grafičke operacije i napredne opcije.

Vodič za SAS | SAS Vodič za analizu podataka | Edureka

SAS komponente

Krenimo dalje s našim vodičem za SAS i pogledajmo nekoliko važnih komponenata za SAS:

  • SAS baza: To je najčešće korištena komponenta. Ima pogon za upravljanje podacima. Možete izvršiti analizu podataka pomoću Base SAS-a.
  • SAS / GRAF: Korištenjem SAS / Graph možete podatke prikazati kao grafikone. To olakšava vizualizaciju podataka.
  • SAS / STAT: Omogućuje vam provođenje statističke analize, poput analize varijance, regresije, multivarijacije, preživljavanja i psihometrijske analize.
  • SAS / ETS: Pogodan je za analizu vremenskih serija.

Budući da je ovo uvodni članak, usredotočit ćemo se na Base SAS i siguran sam da bi to svima trebalo biti lako razumjeti.

Zanima li vas učenje SAS-a od stručnjaka? Upišite se sada

SAS kao programski jezik

Većina programskih okruženja pokreće se izbornikom (pokažite i kliknite) ili upravljajte naredbama (unesite i izvršite naredbe). Međutim, SAS ne pokreće niti izbornik niti naredbe. To je zato što koristi niz uputa ili izjava poznatih kao SAS program. Ovaj je program prikaz onoga što želite raditi i napisan je na SAS jeziku.

Podaci

Podaci su središnji za svaki skup podataka. U SAS-u su podaci dostupni u tabličnom obliku gdje varijable zauzimaju prostor stupca, a promatranja zauzimaju prostor reda.

Tipovi podataka:

SAS brojeve tretira kao numeričke podatke, a sve ostalo spada u podatke o znakovima. Stoga SAS ima dvije vrste podataka, numeričku i znakovnu. Lako, zar ne?

DATA korak i PROC korak čine osnovne gradivne dijelove SAS programa. Što rade ovi blokovi je ono o čemu ćemo raspravljati u ovom SAS tutorialu.

Građevinski blokovi SAS-a

Pokrećemo program s korakom DATA za stvaranje SAS skupa podataka, a zatim ih prosljeđujemo u korak PROC. PROC korak obrađuje podatke. Da bismo razumjeli kako rade DATA i PROC koraci, razmotrimo donji primjer.

Pretpostavimo da sam želio broj koji je izražen u inčima pretvoriti u centimetre i rezultat pohraniti u varijablu koja se naziva ‘veličina’ i ispisati ga, a zatim bi korak DATA pretvorio broj u inčima u centimetre, a PROC korak ispisao rezultat.

Slika ispod prikazuje isječak koda za gore spomenuti problem:

Izjave predstavljaju DATA i PROC korake. Duljina koraka može varirati od jedne do više od stotinu izjava. Važno je imati na umu da se DATA koraci koriste za čitanje i izmjenu podataka, dok se PROC koraci koriste za analizu podataka, izvršavanje uslužnih funkcija ili ispis izvješća.

DATA koraci započinju s ključnom riječi DATA nakon koje slijedi ime koje ste odabrali za svoj SAS skup podataka. Očito je da gornji DATA korak stvara skup podataka imenovan veličina. DATA koraci čitaju podatke iz vanjskih podatkovnih datoteka, a mogu se koristiti i za uključivanje petlji i izjava slučaja. Može se koristiti za spajanje, sortiranje, kombiniranje i spajanje podataka.

Slično tome, postupci započinju PROC izrazom gdje ključna riječ PROC slijedi naziv korištenog postupka (na primjer naziv postupka može biti PRINT, SORT ili MEAN). SAS postupci uglavnom imaju pregršt mogućih izjava.

Svaki put kad SAS naiđe na novi korak (označen izrazom DATA ili PROC), on završava ili završava prethodni korak i započinje novim.

Iako tipični program započinje s DATA korakom za unos ili izmjenu podataka, a zatim ih prosljeđuje u PROC korak, to sigurno nije jedini obrazac za miješanje DATA i PROC koraka. Baš kao što možeteslagati građevinske blokoveu bilo kojem redoslijedu, možete organizirati DATA i PROC korake u bilo kojem redoslijedu. Program može sadržavati samo DATA korake ili samo PROC korake.

Bez obzira na to, puno će vam biti lakše pisati SAS programe ako razumijete ove osnovne funkcije. Gore spomenuto nekoliko je osnova koje bi svaki SAS početnik trebao znati. Prijelazeći na sljedeći dio našeg SAS tutorijala, doznajmo nam kako instalirati SAS sveučilišno izdanje.

Sada početnici mogu učiti i vježbati SAS, kao SAS Institut Inc je pustio SAS Sveučilišno izdanje koji je dostupan besplatno. Sve značajke potrebne za učenje Base SAS-a dostupne su ovdje. Learning Base SAS olakšat će vam učenje drugih komponenata.

Sljedeći koraci pomoći će vam da instalirate SAS University Edition.To je softver pomoću kojeg možete vježbati SAS programiranje.

Vodič za SAS: Instalacija

Instalacija SAS University Edition je jednostavna. Međutim, njegova dostupnost kao virtualnog stroja zahtijeva da ga pokrenete u virtualnom okruženju. Prije pokretanja softvera SAS na računalo morate instalirati softver za virtualizaciju. Sljedeći koraci će vam pomoći da preuzmete i postavite SAS okruženje.

1) Preuzmite SAS University Edition

SAS University Edition možete preuzeti s ove poveznice SAS Sveučilišno izdanje . Ako kliknete gornju vezu, pojavit će se sljedeći prozor. Molimo pročitajte detalje o zahtjevu prije početka preuzimanja.

2) Vodič za brzi početak instalacije

Ljudi koji su potpuno novi u procesu instalacije mogu proći kroz sljedeće vodiče i videozapise dostupne kao u koraku 1. To nije obavezno i ​​možete ga preskočiti ako su vam već poznati.

3) Postavljanje softvera za virtualizaciju

Veze u koraku 2 omogućit će vam preuzimanje odgovarajućeg softvera za virtualizaciju. Ovaj korak možete preskočiti ako ste već instalirali softver za virtualizaciju.

4) Preuzmite Zip datoteku

Odaberite odgovarajuću verziju kompatibilne sa SAS University Editions virtualizacijskim okruženjem koje imate. Preuzet će se kao zip datoteka. Imebi bilo slično: ‘Unvbasicvapp_9411005_vmx_en_sp0_1.zip’

5) Otpakirajte ZIP datoteku

Raspakirajte gornju arhiviranu datoteku i spremite je u odgovarajući direktorij.

6) Učitavanje virtualnog stroja

Otvorite i pokrenite svoj VMware player, potražite datoteku koja završava nastavkom .vmx i otvori ga. Bit će vidljiv sljedeći zaslon. Zabilježite osnovne postavke poput memorije i prostora na tvrdom disku dodijeljene za vašu referencu.

7) Uključivanje virtualnog stroja

Klikom na Uključite ovaj virtualni stroj uz zelenu oznaku strelice, omogućuje vam pokretanje virtualnog stroja. Trebao bi se pojaviti sljedeći zaslon.

Tijekom učitavanja pojavljuje se sljedeći zaslon. Nakon toga možete pokrenuti virtualni stroj. Dobit ćete upit za otvaranje URL-a koji će otvoriti SAS okruženje.

8) S tarting SAS Studio

Otvorite novu karticu u pregledniku i učitajte URL označen na gornjoj slici. Pojavit će se sljedeći zaslon koji pokazuje spremnost SAS okruženja. Možda ćete dobiti drugačiji URL jer URLmogu se razlikovati od računala do računala.

Možete pokrenuti studio i spremni ste za polazak.

Pokretanje SAS programa

Sad kad smo razumjeli kako instalirati SAS University Edition, uzmimo uzorak SAS programa.

Donji kod pokazuje kako ispisati Fibonaccijevu sekvencu. U slučaju, ako ne znate što je Fibonaccijev niz, dopustite mi da ga definiram za vas.

Fibonaccijev niz je skup brojeva koji započinje s jedinicom ili nulom, nakon čega slijedi jedan i nastavlja se na temelju pravila da je svaki broj (koji se naziva Fibonaccijev broj) jednak zbroju prethodna dva broja. Ako je Fibonaccijev niz označen kao F (n), gdje je n prvi pojam u slijedu, sljedeća jednadžba prikazuje Fibonaccijev niz za n = 0, gdje su prva dva pojma definirana kao 0 i 1 prema dogovoru:

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34…

U nekom je kontekstu uobičajeno koristiti n = 1. U tom su slučaju prva dva pojma prema zadanim postavkama definirana kao 1 i 1, i prema tome:

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34…

Pogledajmo ovaj SAS kod koji generira Fibonaccijev niz koji započinje s jednim.

PODACI Fibonacci Da li i = 1 do 10 Fib = Zbroj (Fib, lag (Fib)) ako je i = 1 onda je Fib = 1 izlazni kraj PROC PRINT Ispis Fibonacci

U gornjem kodu definirali smo funkciju koja se naziva 'Fib' za izračunavanje sljedećeg broja. Fib je jednak zbroju trenutnog broja Fib i prethodnogFibonaccibroj. Koristimo funkciju zaostajanja za dohvaćanje posljednje funkcije i za dohvaćanje vrijednosti prethodnog fib broja.

Sljedeća slika prikazuje izlaz gornjeg koda. Za prikaz rezultata u tiskanom obliku koristili smo postupak PROC PRINT.

Nadam se da vam se svidio ovaj SAS tutorial blog. Ovo je bio prvi blog iz bloga serije SAS Tutorial. Moj sljedeći blog bit će o SAS programiranju, pročitajte i to da biste naučili kako pisati programe na SAS-u.

Ako želite naučiti SAS i izgraditi karijeru u domeni analitike, pogledajte našu koja dolazi s treningom uživo pod vodstvom instruktora i iskustvom u stvarnom životu.Ovaj trening pomoći će vam da dublje razumijete SAS i pomoći vam da savladaterazni koncepti SAS jezika.

Zanima li vas učenje SAS-a od stručnjaka? Upišite se sada

Imate pitanje za nas? Molimo spomenite to u odjeljku za komentare i javit ćemo vam se.