Zašto biste se trebali miješati kad se već možete pridružiti u Tableauu?

Spajanje podataka u Tableauu - metoda koja se koristi kada postoje povezani podaci u više izvora podataka, koje želite zajedno analizirati u jednom prikazu.

U svijetu koji dnevno generira i troši 2,5 kvintiliona bajtova podataka, organizacije su dužne tražiti nove metode za transformiranje i kombiniranje podataka kako bi postigle optimalnu učinkovitost. Jedna od takvih metoda kombiniranja podataka je Spajanje podataka u Tableauu .

Budući da ovo služi tako važnoj svrsi u podatkovnom ciklusu bilo koje organizacije, u većini predstavlja vrlo bitan modul . Na ovom blogu razgovarat ćemo o sljedećim konceptima:





Zašto vam je potrebno miješanje podataka u Tableauu?

Pretpostavimo da ste a Tabela programera koji ima podatke o transakcijama pohranjene u Salesforceu i podatke o kvotama pohranjene u Accessu. Podaci koje želite kombinirati pohranjeni su u različitim bazama podataka, a granularnost podataka zabilježenih u svakoj tablici razlikuje se u dva izvora podataka, pa je kombiniranje podataka najbolji način kombiniranja tih podataka.

Spajanje podataka korisno je u sljedećim uvjetima:



  1. Želite kombinirati podatke iz različitih baza podataka koje nisu podržane spajanjem više baza podataka.

    Spajanja više baza podataka ne podržavaju veze s kockama (na primjer, Oracle Essbase) ili s nekim vezama samo za izdvajanje (na primjer, Google Analytics). U tom slučaju postavite pojedinačne izvore podataka za podatke koje želite analizirati, a zatim upotrijebite kombiniranje podataka za kombiniranje izvora podataka na jednom listu.

  2. Podaci su na različitim razinama detalja.

    Ponekad jedan skup podataka bilježi podatke pomoću različitih razine detalja tj. veća ili manja granularnost od ostalih skupova podataka.

    Na primjer, pretpostavimo da analizirate podatke o transakcijama i podatke o kvotama. Transakcijski podaci mogu obuhvatiti sve transakcije. Međutim, podaci o kvotama mogu agregirati transakcije na kvartalnoj razini. Budući da se transakcijske vrijednosti bilježe na različitim razinama detalja u svakom skupu podataka, trebali biste koristiti kombiniranje podataka za kombiniranje podataka.



Što je miješanje podataka u Tableauu?

Spajanje podataka vrlo je moćna značajka u sustavu Windows Odbor . Koristi se kada postoje povezani podaci u više izvora podataka, koje želite zajedno analizirati u jednom prikazu. To je metoda za kombiniranje podataka koja nadopunjuje tablicu podataka iz jednog izvora podataka stupcima podataka iz drugog izvora podataka.

Obično koristite spajanja za izvođenje ove vrste kombiniranja podataka, no ponekad je bolje koristiti kombiniranje podataka, ovisno o čimbenicima poput vrste podataka i njihove granularnosti.

Po čemu se razlikuje od spajanja podataka?

Miješanje podataka simulira tradicionalno lijevo spajanje. Glavna razlika između njih je kada spajanje se izvodi s obzirom na agregiranje.

def __init __ (samo)

Lijevo pridruživanje

Kada koristite lijevo spajanje za kombiniranje podataka, upit se šalje u bazu podataka u kojoj se izvodi spajanje. Korištenje lijevog spajanja vraća sve retke iz lijeve tablice i sve retke iz desne tablice koji imaju odgovarajuće podudaranje redaka u lijevoj tablici. Rezultati spajanja zatim se vraćaju natrag i prikupljaju ih Tableau.

Na primjer, pretpostavimo da imate sljedeće tablice. Ako su uobičajeni stupci ID korisnika , lijevo spajanje uzima sve podatke iz lijeve tablice, kao i sve podatke iz desne tablice, jer svaki redak ima odgovarajuće podudaranje reda u lijevoj tablici.

Spajanje podataka - Spajanje podataka u Tableau - EdurekaSpajanje podataka

Kada kombinirate podatke za kombiniranje podataka, upit se šalje u bazu podataka za svaki izvor podataka koji se koristi na listu. Rezultati upita, uključujući agregirane podatke, Tableau vraća i kombinira. Pogled koristi sve retke iz primarnog izvora podataka, lijeve tablice i agregirane retke iz sekundarnog izvora podataka, desne tablice, na temelju dimenzije polja povezivanja.

Možete promijeniti polje povezivanja ili dodati više polja povezivanja kako biste u spoj uključili različite ili dodatne redove podataka iz sekundarnog izvora podataka, mijenjajući agregirane vrijednosti.

Na primjer, pretpostavimo da imate sljedeće tablice. Ako su polja povezivanja ID korisnika u obje tablice miješanjem vaših podataka uzimaju se svi podaci iz lijeve tablice, a lijevu tablicu dopunjuje podacima iz desne tablice. U ovom slučaju, sve vrijednosti ne mogu biti dio rezultirajuće tablice zbog sljedećeg:

  • Redak u lijevoj tablici nema odgovarajuće podudaranje retka u desnoj tablici, kao što je naznačeno null vrijednošću.
  • U retcima u desnoj tablici nalazi se više odgovarajućih vrijednosti, kao što je označeno zvjezdicom (*).

Pretpostavimo da imate iste tablice kao gore, ali sekundarni izvor podataka sadrži novo polje pod nazivom Svrha . Opet, ako je polje povezivanja ID korisnika , kombiniranje vaših podataka uzima sve podatke iz lijeve tablice i nadopunjuje ih podacima iz desne tablice. U ovom slučaju vidite istu null vrijednost i zvjezdice u prethodnom primjeru uz sljedeće:

  • Jer Svrha polje je mjera, vidite vrijednosti reda zaSvrhapolje agregirano prije nego što se podaci u desnoj tablici kombiniraju s podacima u lijevoj tablici.
  • Kao i u prethodnom primjeru, redak u lijevoj tablici nema odgovarajući redak za Svrha polje, kako je naznačeno drugom null vrijednošću.

Kada zamijeniti članstvo za Spajanje

1. Podaci trebaju čišćenje.

Ako se vaše tablice međusobno ne podudaraju pravilno nakon spajanja, postavite izvore podataka za svaku tablicu, napravite sve potrebne prilagodbe (to jest, preimenujte stupce, promijenite vrste podataka stupaca, izradite grupe, koristite izračune itd.) I zatim upotrijebite miješanje podataka za kombiniranje podataka.

2. Pridruživanja uzrokuju dvostruke podatke.

Duplicirani podaci nakon spajanja simptom su podataka na različitim razinama detalja. Ako primijetite duplicirane podatke, umjesto stvaranja spajanja, upotrijebite miješanje podataka za miješanje u zajedničkoj dimenziji.

3. Imate puno podataka.

Obično se pridruživanja preporučuju za kombiniranje podataka iz iste baze podataka. Pridruživanjima se bavi baza podataka, što omogućuje pridruživanjima da iskoriste neke od izvornih mogućnosti baze podataka. Međutim, ako radite s velikim skupom podataka, spajanja mogu opteretiti bazu podataka i značajno utjecati na izvedbu. U ovom bi slučaju miješanje podataka moglo pomoći. Budući da Tableau obrađuje kombiniranje podataka nakon agregiranja podataka, manje je podataka za kombiniranje. Kada je manje podataka za kombiniranje, općenito se performanse poboljšavaju.

salts vs lutka protiv chefa

Spajanje vaših podataka u Tableau

Mešanje podataka možete koristiti kada podatke imate u zasebnim izvorima podataka koje želite zajedno analizirati na jednom listu. Tableau ima dva ugrađena izvora podataka Uzorak-supermarketa i Uzorak lanca kave.mdb koji će se koristiti za ilustraciju miješanja podataka.

1. korak: povežite se s podacima i postavite izvore podataka

  • Spojite se na skup podataka i postavite izvor podataka na stranici izvora podataka. An inbuilt izvor podataka Uzorak lanca kave.mdb ,koja je datoteka baze podataka MS Access, koristit će se za ilustraciju miješanja podataka.
  • Ići Podaci > Novi izvor podataka, spojite se na drugi skup podataka.Ovaj primjer koristi Uzorak - Superstore izvor podataka. Tkokoš postavila izvor podataka.
  • Kliknite karticu lista da biste započeli izgradnju vašeg pogleda.

Korak 2: Odredite primarni izvor podataka

  • Povucite barem jedno polje iz svog primarnog izvora podataka u prikaz da biste ga odredili kao primarni izvor podataka. U Podaci u oknu kliknite izvor podataka koji želite odrediti kao primarni izvor podataka. U ovom primjeru, Uzorak lanca kave je odabran.
  • Sljedeća snimka zaslona prikazuje različite tablice i spojeve dostupne u datoteci.

Korak 3: Odredite sekundarni izvor podataka

  • Polja korištena u prikazu iz izvora podataka koji nisu primarni izvor podataka ili aktivne poveznice automatski određuju sljedeće izvore podataka kao sekundarni izvor podataka. U ovom slučaju, Sample Superstore.

Korak 4: Spajanje podataka

  • Sada možete integrirati podatke iz oba izvora na temelju zajedničke dimenzije ( država , u ovom slučaju). Imajte na umu da se slika male veze pojavljuje pored dimenzije - State. To ukazuje na zajedničku dimenziju između dva izvora podataka.
  • Pretpostavimo da stvorite trakasti grafikon pomoću Omjer dobiti u Polici stupa i država na Redu polica grafikon pokazuje kako se omjer dobiti razlikuje za svaku državu i u supermarketama i u lancima kave.

Ograničenja miješanja podataka u Tableauu

  1. Postoje neka ograničenja u pogledu miješanja podataka oko neaditivnih agregata, poput MEDIJAN , i RAWSQLAGG .
  2. Spajanje podataka kompromitira brzinu upita u velikoj granulaciji.
  3. Kada pokušate sortirati prema izračunatom polju koje koristi kombinirane podatke, izračunato polje nije navedeno na padajućem popisu Polje dijaloškog okvira Sortiranje.
  4. Izvori podataka kocke mogu se koristiti samo kao primarni izvor podataka za miješanje podataka u Tableauu. Ne mogu se koristiti kao sekundarni izvori podataka.

Nadam se da svi sada imate pojma o tome Spajanje podataka u Tableauu s ovog bloga. Gladni ste za više znanja? Ne brinite, ovaj će vam videozapis bolje razumjeti koncept.