Dvoje analitičara iz LinkedIna skovali su termin „znanstvenik podataka“ 2008. godine. Samo su pokušavali opisati što rade, tj. Poslovnu vrijednost dobivaju iz masivnih podataka generiranih na njihovoj web stranici. U tom procesu završili su s imenovanjem radnog mjesta koje će u sljedećim godinama vidjeti nevjerojatnu potražnju, pa čak i nazvano 'Najseksi posao od 21svstoljeća. ’
Sada organizacije koje smatraju 'podatke' vrijednom imovinom traže ove stručnjake za podatke ili 'znanstvenike' kako bi ih vodile u budućnost.
Pa, što je potrebno da bi bio izvrstan znanstvenik podataka? ... Razne vrste vještina!
Kratki pogled na temeljne vještine znanstvenika podataka.
Proces znanosti o podacima obuhvaća 3 faze.
- Snimanje podataka
- Analiza podataka
- Prezentacija
Pogledajmo bliže ulogu znanstvenika podataka u svakoj od ovih faza.
Snimanje podataka
- Vještine programiranja i baze podataka
Prvi korak rudarenja podataka je hvatanje pravih podataka. Dakle, da biste bili znanstvenik podataka, vrlo je bitno poznavati alate i tehnologije, posebno one otvorenog koda kao što su Hadoop, Java, Python, C ++ i tehnologije baza podataka kao što su SQL, NoSQL, HBase i tako dalje.
kako koristiti skenere u javi -
- Poslovna domena i stručnost
Podaci se razlikuju ovisno o poslu. Stoga je za razumijevanje poslovnih podataka potrebna stručnost koja dolazi samo radom u određenoj domeni podataka.
Na primjer: Podaci prikupljeni iz medicinskog područja potpuno će se razlikovati od podataka maloprodajne trgovine odjećom.
- Modeliranje podataka, skladište i nestrukturirane vještine podataka
Organizacije prikupljaju ogromnu količinu podataka putem različitih izvora. Podaci prikupljeni na ovaj način su nestrukturirani i moraju se organizirati prije analize. Stoga znanstvenik podataka mora biti vješt u modeliranju nestrukturiranih podataka.
Analiza podataka
- Vještine statističkih alata
Osnovna vještina podatkovnog znanstvenika je znati koristiti statističke alate poput R, Excel, SAS i tako dalje. Ovi su alati potrebni za mljevenje snimljenih podataka i njihovu analizu.
- Matematičke vještine
Samo znanje informatike nije dovoljno da biste bili znanstvenik podataka. Profil znanstvenika podataka zahtijeva nekoga tko može razumjeti opsežne algoritme strojnog učenja i programiranje, dok je vješt statističar. Za to je potrebna stručnost u drugim znanstvenim i matematičkim disciplinama, osim računalnih jezika.
Prezentacija
- Vještine alata za vizualizaciju
Možda ćete moći prikupiti i modelirati prikupljene podatke, ali možete li ih vizualizirati?
Ako želite biti uspješan znanstvenik podataka, trebali biste moći raditi s nekim alatima za vizualizaciju podataka koji vizualno predstavljaju analize podataka. Neki od njih uključuju R, Flare, HighCharts, AmCharts, D3.js, Processing i Google Visualization API itd.
što je isitence u pythonu
Ali ovo nije kraj! Ako zaista želite postati znanstvenik podataka, trebali biste imati i sljedeće vještine:
- Komunikacijske vještine: Statistike i Excel lukavi su za rješavanje. Znanstvenici podataka trebali bi biti u mogućnosti predstaviti podatke na način da rezultate prenose poslovnim korisnicima.
- Poslovne vještine : Znanstvenici podataka morat će igrati više uloga. Morali bi komunicirati s različitim ljudima u organizaciji. Stoga će posjedovanje jakih poslovnih vještina koje uključuju komunikaciju, planiranje, organiziranje i upravljanje biti od velike pomoći. To uključuje razumijevanje poslovnih i aplikacijskih zahtjeva te tumačenje informacija u skladu s tim. Također, trebao bi imati cjelovito razumijevanje ključnih izazova u industriji i trebao bi biti svjestan financijskih omjera za bolje donošenje odluka. Dno crta, znanstvenik za podatke koji misli i 'Posao'.
- Vještine rješavanja problema: To se čini očito jer se znanost o podacima bavi rješavanjem problema. Učinkovit znanstvenik podataka mora uzeti vremena i duboko istražiti problem i smisliti izvedivo rješenje koje odgovara korisniku.
- Vještine predviđanja: Znanstvenik podataka također bi trebao biti učinkovit prediktor. Morao bi imati široko znanje o algoritmima za odabir pravog koji pravilno odgovara podatkovnom modelu. To uključuje određenu količinu kreativnosti za korištenje i mudro predstavljanje podataka.
- Hakiranje: Znam da zvuči zastrašujuće, ali različite vještine hakiranja poput manipuliranja tekstualnim datotekama u naredbenom retku, razumijevanja vektoriziranih operacija i algoritamskog razmišljanja učinit će vas boljim znanstvenikom podataka.
Gledajući gornje skupove vještina jasno je da biti znanstvenik podataka nije samo znati sve o podacima. To je profil posla s spajanjem vještina podataka, matematičkih vještina, poslovnih vještina i komunikacijskih vještina. Uz sve ove vještine zajedno, Data Scientist-a s pravom možemo nazvati Rock zvijezdom IT područja.
Kontrolni popis da biste postali strašan i učinkovit znanstvenik podataka:
Obuhvatili smo vještine koje su potrebne da biste postali znanstvenik podataka. Velika je razlika samo postati znanstvenik podataka i postati strašan i učinkovit znanstvenik podataka. Sljedeće vještine, zajedno sa gore spomenutim vještinama, izdvajaju vas od toga da budete normalan ili čak osrednji znanstvenik podataka.
- Matematičke vještine - Kalkulacije, matrične operacije, numerička optimizacija, stohastičke metode itd.
- Statističke vještine - Regresijski modeli, tress, klasifikacije, dijagnostika, primijenjena statistika itd.
- Komunikacija - Vizualizacija, prezentacija i pisanje.
- Baza podataka - Uz CouchDB, znanje u netradicionalnim bazama podataka poput MongoDB-a i Vertice.
- Programski jezici - Svinja, košnica, Java, Python itd.
- Obrada prirodnog jezika i Data mining.
Edureka ima posebno kuriranog koji vam pomaže u stjecanju stručnosti u algoritmima strojnog učenja poput K-Means klastera, stabala odlučivanja, slučajnih šuma, naivnih Bayesa. Naučit ćete pojmove statistike, vremenskih serija, rudarenja teksta i uvoda u dubinsko učenje. Uskoro počinju nove serije za ovaj tečaj !!