Što je neuronska mreža? Uvod u umjetne neuronske mreže



Ovaj blog o tome što je neuronska mreža predstavit će vam osnovne pojmove neuronskih mreža i kako mogu riješiti složene probleme vođene podacima.

Napredom u strojnom učenju, je krenuo visokim putem. Dubinsko učenje smatra se najnaprednijom tehnologijom koja je izgrađena za rješavanje složenih problema koji koriste masivne skupove podataka. Ovaj blog o tome što je neuronska mreža upoznat će vas s osnovnim konceptima neuronskih mreža i kako mogu riješiti složene probleme vođene podacima.

Da biste stekli detaljno znanje o umjetnoj inteligenciji i dubokom učenju, možete se prijaviti uživo Edureka s podrškom 24/7 i doživotnim pristupom.





Evo popisa tema koje će biti obrađene u ovome Blog:

  1. Što je neuronska mreža?
  2. Što je duboko učenje?
  3. Razlika između AI, ML i DL
  4. Potreba za dubokim učenjem
  5. Slučaj upotrebe dubokog učenja
  6. Kako funkcioniraju neuronske mreže?
  7. Neuronska mreža objašnjena na primjeru

Jednostavna definicija neuronske mreže

Modelirano u skladu s ljudskim mozgom, a Neuronska mreža izgrađena je kako bi oponašala funkcionalnost ljudskog mozga . Ljudski mozak je neuronska mreža koja se sastoji od više neurona, slično tome, Umjetna neuronska mreža (ANN) sastoji se od više perceptrona (objašnjeno kasnije).



Neuronska mreža - što je neuronska mreža - Edureka

Neuronska mreža sastoji se od tri važna sloja:

  • Ulazni sloj: Kao što i samo ime govori, ovaj sloj prihvaća sve ulaze koje pruža programer.
  • Skriveni sloj: Između ulaznog i izlaznog sloja nalazi se skup slojeva poznatih kao Skriveni slojevi. U ovom se sloju izvode proračuni koji rezultiraju rezultatom.
  • Izlazni sloj: Ulazi prolaze kroz niz transformacija preko skrivenog sloja što konačno rezultira izlazom koji se isporučuje putem njega sloj.

Prije nego što uđemo u dubinu funkcioniranja neuronske mreže, shvatimo što je duboko učenje.



Što je duboko učenje?

Dubinsko učenje je napredno područje strojnog učenja koje koristi koncepte neuronskih mreža za rješavanje visokoračunarskih slučajeva upotrebe koji uključuju analizu višedimenzionalnih podataka. Automatizira postupak izdvajanja značajki, osiguravajući da je potrebna vrlo minimalna ljudska intervencija.

Pa što je zapravo duboko učenje?

Duboko učenje je napredno potpolje Strojno učenje koje koristi algoritme nadahnute strukturom i funkcijom mozga nazvano Umjetne neuronske mreže.

Razlika između AI, ML i DL (umjetna inteligencija nasuprot strojnom učenju nasuprot dubokom učenju)

Ljudi to često misle , , i Duboko učenje su isti budući da imaju uobičajene primjene. Na primjer, Siri je aplikacija AI-ja, strojnog učenja i dubokog učenja.

Pa kako su ove tehnologije povezane?

  • Umjetna inteligencija je znanost dobivanja strojeva koji oponašaju ponašanje ljudi.
  • Strojno učenje je podskupina umjetne inteligencije (AI) koja se usredotočuje na navođenje strojeva da donose odluke dostavljajući im podatke.
  • Duboko učenje je podskup Strojnog učenja koji koristi koncept neuronskih mreža za rješavanje složenih problema.

Da rezimiramo AI, strojno učenje i duboko učenje međusobno su povezana polja. Strojno učenje i duboko učenje pomažu u umjetnoj inteligenciji pružanjem skupa algoritama i neuronskih mreža za rješavanje problemi vođeni podacima.

Sad kad ste upoznati s osnovama, shvatimo što je dovelo do potrebe za dubinskim učenjem.

Potreba za dubokim učenjem: Ograničenja tradicionalnih algoritama i tehnika strojnog učenja

Strojno učenje bilo je veliko otkriće u tehničkom svijetu, dovelo je do automatizacije jednoličnih i dugotrajnih zadataka, pomoglo je u rješavanju složenih problema i donošenju pametnijih odluka. Međutim, bilo je nekoliko nedostataka u strojnom učenju koji su doveli do pojave dubokog učenja.

Evo nekoliko ograničenja strojnog učenja:

  1. Nije moguće obraditi podatke visoke dimenzije: Strojno učenje može obrađivati ​​samo male dimenzije podataka koji sadrže mali skup varijabli. Ako želite analizirati podatke koji sadrže stotine varijabli, tada se ne može koristiti Strojno učenje.
  2. Inženjering značajki je ručni: Razmotrite slučaj upotrebe kada imate 100 prediktorskih varijabli i trebate suziti samo one značajne. Da biste to učinili, morate ručno proučiti odnos između svake varijable i shvatiti koje su važne u predviđanju rezultata. Ovaj je zadatak izuzetno naporan i dugotrajan za programera.
  3. Nije idealno za izvođenje otkrivanja objekata i obradu slika: Budući da otkrivanje objekata zahtijeva visokodimenzionalne podatke, Strojno učenje ne može se koristiti za obradu skupova podataka slike, idealno je samo za skupove podataka s ograničenim brojem značajki.

Prije nego što uđemo u dubine Neural Networks, razmotrimo stvarni slučaj upotrebe u kojem se implementira duboko učenje.

string konstantni bazen u javi

Slučaj / primjene za duboko učenje

Jeste li znali da PayPal obrađuje preko 235 milijardi dolara plaćanja iz četiri milijarde transakcija svojih više od 170 milijuna kupaca? Koristi ovu ogromnu količinu podataka za utvrđivanje mogućih prijevara, između ostalih razloga.

Uz pomoć algoritama za dubinsko učenje, PayPal je iskopao podatke iz povijesti kupovine svojih kupaca, uz pregled obrazaca vjerojatnih prijevara pohranjenih u svojim bazama podataka kako bi predvidio je li određena transakcija lažna ili ne.

Tvrtka se oslanja na tehnologiju dubokog učenja i strojnog učenja već oko 10 godina. U početku se tim za nadzor prijevara koristio jednostavnim, linearnim modelima. No, tijekom godina tvrtka se prebacila na napredniju tehnologiju strojnog učenja pod nazivom Deep Learning.

Upravitelj rizika od prijevare i znanstvenik podataka u PayPalu, Ke Wang, citirano:

„Ono u čemu uživamo u modernijem, naprednijem strojnom učenju je njegova sposobnost da troši puno više podataka, obrađuje slojeve i slojeve apstrakcije i da može„ vidjeti “stvari koje jednostavnija tehnologija ne bi mogla vidjeti, čak i ljudi ne mogu vidjeti. '

Jednostavni linearni model može potrošiti oko 20 varijabli. Međutim, s tehnologijom dubokog učenja može se pokretati tisuće podatkovnih točaka. Stoga, provedbom Tehnologija dubokog učenja, PayPal konačno može analizirati milijune transakcija kako bi identificirao bilo kakvu prijevaru aktivnost.

Ajmo sada u dubinu neuronske mreže i shvatimo kako oni rade.

Kako funkcionira neuronska mreža?

Da bismo razumjeli neuronske mreže, moramo ga razbiti i razumjeti najosnovniju jedinicu neuronske mreže, tj. Perceptron.

Što je Perceptron?

Perceptron je jednoslojna neuronska mreža koja se koristi za klasifikaciju linearnih podataka. Sadrži 4 važne komponente:

  1. Ulazi
  2. Utezi i pristranost
  3. Funkcija zbrajanja
  4. Funkcija aktivacije ili transformacije

Osnovna logika Perceptrona je sljedeća:

Ulazi (x) primljeni od ulaznog sloja množe se s dodijeljenim težinama w. Pomnožene vrijednosti se zatim dodaju kako bi se dobio Ponderirani zbroj. Ponderirani zbroj ulaza i njihove odgovarajuće težine tada se primjenjuju na relevantnu funkciju aktiviranja. Funkcija aktivacije preslikava ulaz na odgovarajući izlaz.

Utezi i pristranost u dubokom učenju

Zašto svakom unosu moramo dodijeliti težine?

Jednom kada se ulazna varijabla dovede u mrežu, nasumce odabrana vrijednost dodjeljuje se kao težina tog ulaza. Težina svake ulazne točke podataka pokazuje koliko je taj ulaz važan u predviđanju ishoda.

Parametar pristranosti, s druge strane, omogućuje vam podešavanje krivulje funkcije aktiviranja na takav način da se postigne precizan izlaz.

Funkcija zbrajanja

Nakon što se ulazima dodijeli neka težina, uzima se umnožak odgovarajućeg ulaza i težine. Dodavanjem svih ovih proizvoda dobivamo ponderirani zbroj. To se vrši pomoću funkcije zbrajanja.

Funkcija aktiviranja

Glavni cilj funkcija aktiviranja je mapiranje ponderiranog zbroja na izlaz. Aktivacijske funkcije kao što su tanh, ReLU, sigmoid i tako dalje primjeri su funkcija transformacije.

Da biste saznali više o funkcijama Perceptrona, možete to proći Blog.

Prije nego što smo završite ovaj blog, uzmimo jednostavan primjer kako bismo razumjeli kako funkcionira neuronska mreža.

Neuronske mreže objašnjene na primjeru

Razmotrite scenarij u kojem trebate izgraditi umjetnu neuronsku mrežu (ANN) koja klasificira slike u dvije klase:

  • Klasa A: Sadrži slike ne-bolesnih listova
  • Klasa B: Sadrže slike bolesnih listova

Pa kako stvoriti neuronsku mrežu koja klasificira lišće u bolesne i ne-bolesne usjeve?

Proces uvijek započinje s obradom i pretvaranjem ulaznih podataka na takav način da se mogu lako obraditi. U našem slučaju svaka će se slika lista raščlaniti na piksele, ovisno o dimenziji slike.

Na primjer, ako je slika sastavljena od 30 puta 30 piksela, tada će ukupan broj piksela biti 900. Ti su pikseli predstavljeni kao matrice, koje se zatim unose u ulazni sloj neuronske mreže.

Baš kao što naš mozak ima neurone koji pomažu u izgradnji i povezivanju misli, ANN ima perceptone koji prihvaćaju ulaze i obrađuju ih prenoseći ih s ulaznog sloja na skriveni i na kraju izlazni sloj.

Kako se ulaz prenosi s ulaznog sloja na skriveni sloj, svakom se ulazu dodjeljuje početna slučajna težina. Ulazi se zatim pomnože s pripadajućim težinama i njihov se zbroj pošalje kao ulaz na sljedeći skriveni sloj.

Ovdje se svakom perceptronu dodjeljuje numerička vrijednost koja se naziva pristranost, a koja je povezana s težinom svakog ulaza. Nadalje, svaki perceptron prolazi kroz aktivaciju ili funkciju transformacije koja određuje hoće li se određeni perceptron aktivirati ili ne.

Aktivirani perceptron koristi se za prijenos podataka na sljedeći sloj. Na taj se način podaci šire (prosljeđivanje naprijed) kroz neuronsku mrežu dok perceptroni ne dosegnu izlazni sloj.

Na izlaznom sloju izvedena je vjerojatnost koja odlučuje pripadaju li podaci klasi A ili klasi B.

Zvuči jednostavno, zar ne? Pa, koncept Neural Networks-a temelji se isključivo na funkcioniranju ljudskog mozga. Potrebno vam je detaljno znanje o raznim matematičkim konceptima i algoritmima. Evo popisa blogova za početak:

  1. Što je duboko učenje? Početak rada s dubokim učenjem
  2. Dubinsko učenje s Pythonom: Vodič za dubinsko učenje za početnike

Ako vam je ovaj blog relevantan, pogledajte Edureka, pouzdane tvrtke za internetsko učenje s mrežom od više od 250 000 zadovoljnih učenika raširenih širom svijeta. Tečaj Edureka za dubinsko učenje s certifikatom TensorFlow pomaže učenicima da postanu stručnjaci u obuci i optimizaciji osnovnih i konvolucijskih neuronskih mreža koristeći projekte i zadatke u stvarnom vremenu zajedno s konceptima kao što su SoftMax funkcija, Neuronske mreže s automatskim kodiranjem, Ograničeni Boltzmannov stroj (RBM).