SQL za znanost o podacima: Rješenje za početnike na jednom mjestu



Ovaj članak na blogu o SQL-u za znanost o podacima pomoći će vam da shvatite kako se SQL može koristiti za pohranu, pristup i preuzimanje podataka za obavljanje analize podataka.

Otkako je Data Science rangiran na 1. mjesto kao najperspektivniji posao tog doba, svi se pokušavamo pridružiti utrci . Ovaj članak na blogu o SQL-u za znanost o podacima pomoći će vam da shvatite kako se SQL može koristiti za pohranu, pristup i preuzimanje podataka za obavljanje analize podataka.

Evo popisa tema koje će biti pokriven na ovom blogu:





    1. Zašto je SQL potreban za znanost o podacima?
    2. Što je SQL?
    3. Osnove SQL-a
    4. Instaliranje MySQL-a
    5. Ruke na

Zašto je SQL potreban za znanost o podacima?

Jeste li znali da svakodnevno generiramo više od 2,5 kvintiljona bajtova podataka? Ovakav tempo generiranja podataka razlog je popularnosti vrhunskih tehnologija poput Znanost o podacima , , i tako dalje.

Dobivanje korisnih uvida iz podataka ono je što se naziva Data Science. Data Science uključuje izdvajanje, obradu i analizu tona podataka. Trenutno ono što trebamo jesu koji se mogu koristiti za pohranu i upravljanje ovom ogromnom količinom podataka.



Što je znanost o podacima - Edureka

Ovo je gdje Ulazi SQL.

SQL se može koristiti za pohranjivanje, pristup i izdvajanje ogromnih količina podataka kako bi se cjelokupniji postupak znanosti o znanosti odvijao glatko.



Što je SQL?

SQL što je skraćenica od Structured Query Language jezik je upitni jezik usmjeren na upravljanje relacijskim bazama podataka.

Ali što je zapravo relacijska baza podataka?

Relacijska baza podataka skupina je dobro definiranih tablica iz kojih se može pristupiti podacima, uređivati ​​ih, ažurirati i tako dalje, bez potrebe za mijenjanjem tablica baze podataka. SQL je standard (API) za relacijske baze podataka.

Vraćajući se na SQL, SQL programiranje može se koristiti za izvođenje višestrukih radnji na podacima, poput upita, umetanja, ažuriranja, brisanja zapisa baze podataka. Primjeri relacijskih baza podataka koje koriste SQL uključuju MySQL bazu podataka, Oracle itd.

kako primijeniti apstraktnu metodu u javi

Da biste saznali više o SQL-u, možete proći kroz sljedeći blogovi:

  1. Razumijevanje tipova podataka SQL - sve što trebaš znati o tipovima podataka SQL
  2. IZRADI TABLICU u SQL-u - sve što trebate znati o stvaranju tablica u SQL-u

Prije nego započnemo s demonstracijom SQL-a, upoznajmo se s osnovnim SQL naredbama.

Osnove SQL-a

SQL nudi skup jednostavnih naredbi za izmjenu tablica podataka, prođimo kroz neke od osnovnih SQL naredbi:

  • IZRADI BAZU BAZA - stvara novu bazu podataka
  • STVORI TABELU - stvara novu tablicu
  • UMETNUTI U - ubacuje nove podatke u bazu podataka
  • ODABERI - vadi podatke iz baze podataka
  • AŽURIRAJ - ažurira podatke u bazi podataka
  • IZBRIŠI - briše podatke iz baze podataka
  • ALTER BAZA PODATAKA - mijenja bazu podataka
  • ALTER TABELA - mijenja tablicu
  • KAPA STOL - briše tablicu
  • IZRADI INDEKS - stvara indeks za pretraživanje elementa
  • INDEKS KAPANJA - briše indeks

Da bismo bolje razumjeli SQL, instalirajmo MySQL i vidimo kako se možeš igrati s podacima.

Instaliranje MySQL-a

Instalacija MySQL-a jednostavan je zadatak. Evo korak po korak vodič to će vam pomoći da instalirate MySQL na vaš sustav.

Kada završite s instalacijom MySQL, slijedite odjeljak u nastavku kako biste pronašli jednostavan demo koji će vam pokazati kako možete umetnuti, manipulirati i izmijeniti podatke.

SQL za znanost o podacima - MySQL Demo

U ovoj demonstraciji vidjet ćemo kako stvoriti baze podataka i obraditi ih. Ovo je demonstracija na početnoj razini kako biste započeli s analizom podataka na SQL-u.

Pa krenimo!

Korak 1: Stvorite SQL bazu podataka

SQL baza podataka je skladište za pohranu u kojem se podaci mogu pohraniti u strukturiranom formatu. Ajmo sada stvoriti bazu podataka pomoću MySQL :

IZRADI BAZU PODATAKA edureka KORISTI edureka

U gornjem kodu postoje dvije SQL naredbe:

Bilješka : SQL naredbe definirane su velikim slovima, a dvotočka se koristi za završetak SQL naredbe.

  1. CREATE DATABASE: Ova naredba stvara bazu podataka koja se naziva ‘edureka’

  2. USE: Ova se naredba koristi za aktiviranje baze podataka. Ovdje aktiviramo bazu podataka 'edureka'.

Korak 2: Stvorite tablicu sa potrebnim značajkama podataka

Stvaranje tablice jednostavno je kao stvaranje baze podataka. Morate definirati varijable ili značajke tablice s njihovim odgovarajućim vrstama podataka. Pogledajmo kako se to može učiniti:

IZRADITE TABLIČKE igračke (TID INTEGER NULL OSNOVNI KLJUČ AUTO_INCREMENT, naziv predmeta TEKST, cijena INTEGER, količina INTEGER)

U gornjem isječku koda događaju se sljedeće stvari:

  1. Upotrijebite naredbu ‘CREATE TABLE’ za izradu tablice zvane igračke.
  2. Stol igračaka sadrži 4 značajke, naime, TID (ID transakcije), Naziv_naziva, Cijena i Količina.
  3. Svaka je varijabla definirana sa svojim odgovarajućim vrstama podataka.
  4. Varijabla TID deklarirana je kao primarni ključ. Primarni ključ u osnovi označava varijablu koja može pohraniti jedinstvenu vrijednost.

Pojedinosti definirane tablice možete dalje provjeriti pomoću sljedeće naredbe:

OPISI igračke

Korak 3: Umetanje podataka u tablicu

Sad kad smo stvorili tablicu, popunimo je nekim vrijednostima. Ranije u ovom blogu spomenuo sam kako podatke možete dodati u tablicu samo pomoću jedne naredbe, tj. INSERT INTO.

Pogledajmo kako se to radi:

UMETNI U VRIJEDNOSTI igračaka (NULL, 'Train', 550, 88) INSERT INTO VRIJEDNOSTI igračaka (NULL, 'Hotwheels_car', 350, 80) INSERT INTO VALUES VALUE (NULL, 'Magic_Pencil', 70, 100) INSERT INTO VALUES VALUE ( NULL, 'Kućica za pse', 120, 54) Umetnite u vrijednosti igračaka (NULL, 'Skateboard', 700, 42) Umetnite u vrijednosti za igračke (NULL, 'GI Joe', 300, 120)

U gornji isječak koda jednostavno smo umetnuli 6 zapažanja u tablicu ‘igračke’ pomoću naredbe INSERT INTO. Za svako promatranje, u zagradama, odredio sam vrijednost svake varijable ili značajke koja je definirana tijekom izrade tablice.

Varijabla TID postavljena je na NULL jer se automatski uvećava od 1.

Sada ćemo prikazati sve podatke prisutne u našoj tablici. To se može učiniti pomoću naredbe u nastavku:

ODABERITE * IZ igračaka


Korak 4: Izmijenite unose podataka

Recimo da ste odlučili povećati cijenu G.I. Joe, jer ti donosi mnogo kupaca. Kako biste ažurirali cijenu varijable u bazi podataka?

Jednostavno je, samo upotrijebite donju naredbu:

AŽURIRANJE POKLONA igračaka Cijena = 350 WHERE TID = 6

Naredba UPDATE omogućuje vam izmjenu svih vrijednosti / varijabli pohranjenih u tablici. Parametar SET omogućuje vam odabir određene značajke, a parametar WHERE koristi se za prepoznavanje varijable / vrijednosti koju želite promijeniti. U gornjoj naredbi ažurirao sam cijenu unosa podataka čiji je TID 6 (G.I. Joe).

Pogledajmo sada ažuriranu tablicu:

ODABERITE * IZ igračaka

Također možete izmijeniti ono što želite da se prikazuje samo pozivanjem na stupce koje želite pregledati. Na primjer, naredba u nastavku prikazat će samo naziv igračke i njenu cijenu:

ODABERITE Naziv_naziva, Cijena IZ igračke

Korak 5: Dohvaćanje podataka

Dakle, nakon umetanja podataka i njihove izmjene, napokon je vrijeme za izdvajanje i preuzimanje podataka u skladu s poslovnim zahtjevima. Ovdje se mogu dobiti podaci za daljnju analizu podataka i modeliranje podataka.

Imajte na umu da je to jednostavan primjer za početak rada s SQL-om, međutim, u stvarnim scenarijima podaci su puno složeniji i velike veličine. Unatoč tome, SQL naredbe i dalje ostaju iste i to je ono što SQL čini tako jednostavnim i razumljivim. Može obraditi složene skupove podataka skupom jednostavnih SQL naredbi.

Sada dohvatimo podatke s nekoliko izmjena. Pogledajte donji kod i pokušajte shvatiti što čini bez gledanja rezultata:

ODABERITE * IZ igračaka OGRANIČITE 2

Pogodio si! Prikazuje prva dva zapažanja prisutna u mojoj tablici.

Pokušajmo nešto zanimljivije.

ODABERITE * IZ igračaka NARUČITE PO CIJENI ASC

Kao što je prikazano na slici, vrijednosti su poredane prema rastućem redoslijedu varijable cijene. Što želite učiniti ako želite potražiti tri najčešće kupljena predmeta?

Stvarno je sasvim jednostavno!

ODABERITE * IZ igračaka NARUČITE PO KOLIČINI DESC LIMIT 3

Pokušajmo još jedan.

ODABERITE * IZ igračaka GDJE Cijena> 400 NARUČI PO CIJENI ASC


Ovaj upit izdvaja detalje o igračkama čija je cijena veća od 400 i raspoređuje izlaz u rastućem redoslijedu cijene.

razlika između chefa i ansiblea

Dakle, na taj način možete obrađivati ​​podatke pomoću SQL-a. Sad kad znate osnove SQL-a za Data Science, siguran sam da želite znati više. Evo nekoliko blogova za početak:

  1. Što je znanost o podacima? Vodič za početnike za znanost o podacima
  2. MySQL Tutorial - Vodič za početnike za učenje MySQL-a

Ako se želite upisati na cjeloviti tečaj o umjetnoj inteligenciji i strojnom učenju, Edureka ima posebno kuriranog koji će vas osposobiti za tehnike poput nadziranog učenja, nenadgledanog učenja i obrade prirodnog jezika. Uključuje obuku o najnovijim dostignućima i tehničkim pristupima u umjetnoj inteligenciji i strojnom učenju kao što su duboko učenje, grafički modeli i učenje ojačanja.