Dok upotrebljavate Google tablice za rad s dva skupa podataka, možda biste trebali usporediti ta dva određujući stupanj do kojeg jedan utječe na drugi.
Korelacije mogu ponuditi uvid u to postoji li prediktivni odnos između ravnina x i y, ali ne ukazuju nužno na uzročnost. Evo kako možete koristiti Google tablice za prepoznavanje korelacija u svojim podacima.
Što je korelacija i za što je možete koristiti?
Kada su dvije varijable u korelaciji, jedna može odrediti kako jedna varijabla utječe na drugu. No, ključno je upamtiti da korelacija ne podrazumijeva oslanjanje u ovom slučaju; samo pokazuje koliko se dvije varijable blisko i brzo uspoređuju ili povezuju.
Statistička metrika pomaže u razumijevanju temeljnih trendova u analizi podataka. Korelacija je jedna od najčešće korištenih statističkih metrika i ona određuje koliko su blisko povezane ili ovisne dvije varijable.
Razumijevanje koeficijenta korelacije u Google tablicama
U Google tablicama koeficijent korelacije izračunava se pomoću funkcije CORREL. Koeficijent korelacije služi kao mjera koliko su usko povezani skupovi podataka. Može se koristiti za dobivanje Pearsonovog koeficijenta korelacije proizvod-moment (r) ako imate dva varijabilna skupa podataka. Ako želite saznati više o ovom koeficijentu, možete pročitati više u ovom vodiču od
Statistika u Leardu.Može se naići na jednu od tri korelacijske metrike. Svako mjerenje drugačije definira odnose između varijabli. Njegova vrijednost je između -1 i +1:
- -1 označava savršenu negativnu korelaciju: Kada korelacija ima koeficijent korelacije jednak ili manji od -0,9, kaže se da je jako negativna. To je pokazatelj da su podaci u korelaciji. Međutim, varijabla x nastavlja rasti, dok varijabla y nastavlja opadati.
- 0 označava da nema veze: Smatra se da varijable ne koreliraju ako je koeficijent korelacije veći od 0,01, ali manji od 0,1 jer ne postoji vidljiv odnos između svake varijable. One su neovisne jedna o drugoj.
- +1 označava savršenu pozitivnu korelaciju: Kada koeficijent korelacije padne između 0,9 i 1, smatra se vrlo pozitivnim. To pokazuje da je došlo do povećanja u dva skupa varijabli.
Najveća vrijednost koeficijenta može biti korelacijski koeficijent 1. Kada je vrijednost korelacije 1, to implicira da bi podaci bili potpuno poravnati da bi stvorili ravnu liniju, ako biste trebali prikazati grafikon.
Ako ste još uvijek malo izgubljeni, ne brinite. Objasnit ćemo sintaksu funkcije CORREL, a zatim ćemo zaroniti u neke primjere iz stvarnog svijeta kako bismo vam pomogli da je bolje razumijete. Razumijevanje linija najboljeg pristajanja i kako napraviti linije trendova u Google tablicama će vam pomoći s ovim.
Sintaksa funkcije CORREL u Google tablicama
=CORREL(podatak_y, podatak_x)
Rastavimo ovo na dijelove i bolje razumijemo što svaki izraz znači:
- = KOREL: Ovo je funkcija Google tablice koja određuje r (koeficijent korelacije Pearsonov proizvod-moment skupa podataka).
- podaci_y: Ovo se odnosi na grupu ćelija koje sadrže ovisne podatke ili raspon vrijednosti za te ćelije.
- podaci x: Ovo je ili referenca prema nizu ćelija s neovisnim podacima ili raspon vrijednosti za te ćelije.
Ako biste grafički prikazivali podatkovne točke, data_y bi bila Y os, a data_x X os. Primijetit ćete da postoje dva različita načina za unos raspona podataka. Mogućnosti su referentni raspon ćelija ili izravni unos podataka u funkciju.
U većini slučajeva poželjna je uporaba raspona referentnih ćelija. To je zato što proračunska tablica najvjerojatnije već sadrži vaše podatke. Upotrebom raspona referentnih ćelija može se izbjeći prekomjeran unos koji može dovesti do pogreške korisnika.
Primjeri funkcija CORREL u Google tablicama
Pogledajmo nekoliko primjera da bismo razumjeli kako koristiti funkciju CORREL u Google tablicama.
Primjer 1: Jaka pozitivna korelacija
Za ovaj prvi primjer, pretpostavimo da radimo u industriji nekretnina. U proračunskoj tablici u nastavku imamo podjele hektara zemlje koju prodajete i broj prodanih jedinica podataka o tim različitim zemljištima u vašoj Google tablici.
- Ako slijedite na tablici, počet ćete unosom podataka varijabli u proračunsku tablicu, kao što je prikazano u nastavku:
- Pritisnite ćeliju C2
- Tip =CORREL(
- Zatim ćete nastaviti s tipom data_y, što je u našem slučaju referentni raspon ćelija A2:A6, zatim unesite zarez.
- Prijeđite na tip data_x, koji se u našem slučaju navodi kao B2:B6.
- Završite zatvorenom zagradom, kao što je prikazano u nastavku:
- Na kraju pritisnite Unesi da vrati koeficijent korelacije dvaju podataka u ćeliji C2.
Koristeći primjer koji je upravo prikazan gore, dobili ste koeficijent korelacije od 0,90, što je jaka pozitivna korelacija budući da je njegova vrijednost između 0,9 i 1. Stoga, ovo ukazuje da se kako se y mijenja, x se također mijenja na bitno usporediv način.
Ispod je prikaz našeg primjera uzorka podataka na XY raspršenom grafikonu. Kao što vidite, linija najboljeg pristajanja blizu je podatkovnih točaka na grafikonu, što podržava ideju da su brojke u velikoj korelaciji.
Možete saznati više o stvaranje XY raspršenih grafikona u Google tablicama u našem drugom članku.
Primjer 2: Slaba negativna korelacija
Ovaj put koristit ćemo generički primjer "varijable x i y" u našoj proračunskoj tablici. Namjerno smo uključili brojke kako bismo pokazali negativnu korelaciju, koju funkcija CORREL prikazuje u nastavku:
Ne postoji jaka povezanost između varijabli y i x, pa je rezultat koji dobivamo manje značajan koeficijent korelacije nego u prethodnom primjeru. Rezultat koji smo postigli je -0,47. To, međutim, ne znači da ne postoji nikakva korelacija. Pogledajmo ponovo liniju koja najbolje odgovara da bismo shvatili njen smisao.
Kao što možete vidjeti na dijagramu raspršenosti, podatkovne točke su dalje od linije najboljeg pristajanja. Postoji, dakle, manja korelacija nego u prvom primjeru, ali ne nikakva. Također ćete primijetiti da se linija najboljeg pristajanja smanjuje. Ovo pokazuje negativnu korelaciju, jedna vrijednost se smanjuje dok druga raste.
Primjer 3: Nema veze
Ovdje imamo skup potpuno nasumičnih brojeva. Dotaknimo se na brzinu ponovno kako koristiti funkciju CORREL:
- Upišite ćeliju C2 formula CORREL
- Naši argumenti su A2:A10 i B2:B10
- Pritisnite Enter
Vrijednost vraćena na C2 je 0,02. Ako korelacijski koeficijent padne između 0,01 i 0,1, utvrđuje se da dotične varijable ne koreliraju budući da među njima nema vidljive veze. Odnosi između varijabli su potpuno neovisni.
Ispod je prikaz istog na raspršenom grafu. Linija najboljeg podudaranja je gotovo ravna, što ukazuje na malu korelaciju između dva skupa podataka.
Jednostavno povežite svoje podatke u Google tablicama
Korelacija bi mogla biti izazovna tema ako s njom niste puno radili u srednjoj školi. Ovaj vodič pokrio je sve osnove, ali morat ćete nastaviti koristiti funkciju CORREL u Google tablicama kako biste je zadržali u svježini.
Ovo je moćna funkcija jer pomaže u izbjegavanju izgradnje raspršenih grafikona i može brzo pronaći trendove u vašim podacima. Ipak, nemojte se bojati dodati grafikone kako biste pomogli drugim korisnicima da bolje razumiju podatke u vašim proračunskim tablicama.