Proces predviđanja analitike u poslovnoj analitici s R

Blog daje kratku ideju o prediktivnom analitičkom procesu u Business Analyticsu s R-om

Tipični postupak modeliranja:

U tipičnom procesu modeliranja važno je započeti s izvlačenjem hipoteze. Primljen je RFP (zahtjev za prijedlog), a zatim je izvučena hipoteza.





  1. Utvrdite pravi izvor podataka - Ovdje kupac može dati izvor podataka, ako ne, moramo potražiti izvor podataka. S obzirom na scenarij u kojem pokušavamo procijeniti tko bi pobijedio na izborima, javna analiza podataka vrši se s izvorima koji uključuju društvene medije, vijesti ili javno mnijenje. Također moramo razumjeti količinu podataka potrebnih za analizu problema. U ovom slučaju obično tražimo velike uzorke, jer se radi o izbornom slučaju. S druge strane, ako se analiza radi na zdravstvu, teško je izaći za veliku populaciju jer postoji mogućnost da se ne dobije dovoljno ljudi koji bi potvrdili hipotezu. Također, kvaliteta podataka je vrlo važna.
  2. Izdvajanje podataka - Na primjer, ako uzmemo uzorak populacije, možemo promatrati atribute, kao što su visoki dohodak, nizak dohodak, dob, radno sposobno stanovništvo (izvan mjesta / lokacije), stanovnici, NRI, pokrivenost bolnica itd., Kako bismo pokrenuli studiju. . Ovdje nam možda neće trebati toliko atributa za hipotezu. Shvaćamo da atributi, poput visokog i niskog dohotka, možda nisu glavni čimbenici koji određuju tko će pobijediti na izborima. No dob može promijeniti jer će izravno izračunati koliko će ljudi glasati. Često možemo izuzeti manje korištene atribute ili uključiti korisne. U oba slučaja može poći po zlu. To je razlog zašto je analitika izazov.
  3. Masirajte podatke kako bi odgovarali alatu - To je zato što ne mogu svi alati prihvatiti sve podatke. Određeni alati prihvaćaju samo CSV podatke ili excel podatke. Nedostatak alata je izazov.
  4. Pokrenite Analizu - Ova se operacija može izvesti pomoću mnogih analitičkih tehnika.
  5. Izvući zaključke - Analiza daje brojeve kako bismo bili precizni. Ali na korisniku je da iz tih brojeva izvede zaključke. Na primjer, ako kaže 10% ili 20%, moramo razumjeti što to znači? Izvodi li korelaciju između svojstva A i svojstva B?
  6. Primijeniti rezultate - Važno je primijeniti zaključke kako bi se vidjeli rezultati u poslu. Na primjer, može se zaključiti da 'Ljudi kupuju kišobran u kišnoj sezoni' što može rezultirati većim brojem posla. Ovdje trebamo primijeniti zaključak u kojem činimo kišobran dostupan u trgovinama, ali tada to može imati problema s upravljanjem. U trenutku kada statistika da rezultat, provedba može poći po zlu.
  7. Praćenje napretka - Posljednji korak ovdje je nadzor koji igra važnu ulogu. Nadgledanje može poći po zlu jer malo organizacija želi pratiti napredak, a to se smatra zanemarivim korakom. No nadzor je važan jer možemo razumjeti idu li naša istraživanja i zaključci u dobrom smjeru.

Također pogledajte ovaj članak' Korelacija ne znači uzročnost 'što daje uvid u to kako analitičari mogu pogriješiti. Važna stvar koju treba napomenuti u ovom grafikonu je da je analiza pokretanja jedini korak u kojem je stroj odgovoran, a izvan toga ovisi o čovjeku koji će u konačnici odrediti kako će se raditi istraživanje.

Imate pitanje za nas? Spomenite ih u odjeljku za komentare i javit ćemo vam se.



Vezane objave: