Modeliranje tehnika u poslovnoj analitici s R



Blog daje kratki uvod u Tehnike modeliranja u poslovnoj analitici s R.

Različite tehnike modeliranja:

Bilo koji problem možemo podijeliti na manje procese:





Klasifikacija - je, gdje klasificiramo podatke. Npr. bolesti sve bolesti pokazuju određeno ponašanje, a mi ih možemo dalje klasificirati.

Na primjer: bolesti koje smanjuju imunitet, bolesti od kojih boli glava itd.



Regresija - uključuje otkrivanje odnosa između više varijabli.

Na primjer: kako je težina ljudskog bića povezana s njegovom visinom.

AnomolijaOtkrivanje - u osnovi je fluktuacija.



primjer pozivanja java udaljene metode

Na primjer: U slučaju visokog ili niskog napona.

Drugi primjer može uključivati ​​regulirano ponašanje koje uključuje vožnju desnom ili lijevom stranom na temelju zemlje. Ovdje je anomalija netko tko vozi suprotno.

Drugi primjer može biti upad u mrežu. Ovdje se autentificirani korisnik prijavljuje na web mjesto vaše tvrtke, a ako se netko neautentificiran prijavi, to jeAn0moly.

Značaj atributa - U osnovi daje više atributa, poput visine, težine, temperature, otkucaja srca. Treba napomenuti da su svi ti atributi važni za zadatak.

Na primjer: Netko pokušava predvidjeti, u koje vrijeme će osoba doći do ureda. Svaki atribut igra važnu ulogu, ali nisu svi atributi važni.

Pravila udruživanja - Jednostavnije rečeno, to je analiziranje ili predviđanje sljedećeg ponašanja, gdje se ono vrti oko mehanizma preporuka.

Na primjer: Osoba koja kupuje kruh može kupiti i mlijeko. Ako analiziramo prošla ponašanja prilikom kupovine, svi predmeti u košarici imaju odnos. U ovom slučaju može postojati vjerojatnost da će osoba koja kupuje kruh kupiti i mlijeko.

Skupljanje - To je jedna od najstarijih tehnika u statistici. Zapravo se uvijek može modelirati bilo koji problem, bilo klasifikacija ili klasterizacija, što znači grupiranje sličnih entiteta.

Na primjer:

1) Uzmite košaru s jabukama i narančama, u kojoj možemo odvojiti jabuke od naranče.

2) Važan slučaj upotrebe klastera je zdravstvena zaštita. Gotovo sve statistike i analize započele su sa slučajevima upotrebe zdravstvene zaštite. Da bismo ušli dublje, postoji pojam klasteriranja koji se naziva kohorte (ljudi sa sličnim bolestima), tako da se mogu proučavati odvojeno od postojećih kupaca. Primjerice, ako 10 ljudi pati od vrućice, a 10 ljudi od glavobolje, pronaći ćemo ono što je zajedničko među njima i generirati lijek.

Izdvajanje značajke - U pogledu preciznosti izdvajanja značajki, valjanost i otkazi vrlo su relevantni. Drugim riječima, izdvajanje značajki može se nazvati prepoznavanjem uzoraka.

Na primjer:

U Google pretraživanju, kada korisnik unese pojam, dolazi do rezultata. Važno pitanje koje treba postaviti je kako je to znalo, koja je stranica relevantna, a koja nije relevantna za taj pojam? Na to se može odgovoriti izdvajanjem značajki i prepoznavanjem uzoraka, gdje dodaje istaknute značajke. Recimo da je dana fotografija, određeni fotoaparati otkrivaju lica, ističu lice kako bi dobili lijepe slike, što također koristi prepoznavanje značajki.

kako provjeriti ima li palindroma u javi -

Nadzirano učenje vs Nenadzirano učenje

do) Kategorija predviđanja - Tehnike uključuju regresiju, logistiku, neuronske mreže i stabla odlučivanja. Neki primjeri uključuju otkrivanje prijevare (gdje računalo uči i predviđa sljedeću prijevaru iz prethodne povijesti prijevare). U učenju bez nadzora ne može se predvidjeti na primjerima jer nema povijesnih podataka.

b) Kategorija klasifikacije - Uzimajući primjer, bez obzira je li transakcija lažna ili ne, ona ulazi u kategoriju klasifikacije. Ovdje uzimamo povijesne podatke i klasificiramo ih prema stablima odluka ili u slučaju da uopće ne uzmemo nikakve povijesne podatke, tada izravno započinjemo s podacima i pokušavamo samostalno iskoristiti značajke. Na primjer, ako moramo znati zaposlenike, koji će vjerojatno napustiti organizaciju ili će vjerojatno ostati. U slučaju da je to nova organizacija, u kojoj ne možemo koristiti povijesne podatke, uvijek možemo koristiti klasterizaciju za izdvajanje podataka.

c) Kategorija istraživanja - Ovo je izravna metoda, koja dolazi do toga što znače veliki podaci. U nenadgledanom učenju naziva se osnovnim komponentama i grupiranjem.

d) Kategorija afiniteta - ovdje je uključeno više elemenata kao što su unakrsna prodaja / prodaja, analiza tržišne košarice. U analizi košara nema učenja pod nadzorom jer nema povijesnih podataka. Dakle, podatke uzimamo izravno i pronalazimo asocijacije, sekvenciranje i analizu faktora.

Imate pitanje za nas? Spomenite ih u odjeljku za komentare i javit ćemo vam se.

Vezane objave: