Evo kako koristiti ugrađene alate programa Excel za lakšu statističku analizu.

Dijagrami reziduala igraju bitnu ulogu u regresijskoj analizi. One vam govore koliko točno vaša regresijska linija predstavlja odnos između dviju varijabli. Sljedeći vodič objašnjava kako izračunati i iscrtati Excel reziduale pomoću dvije metode.

Ali prije nego što prijeđemo na dobre stvari, ukratko shvatimo reziduale i njihovu važnost u regresijskoj analizi.

Što su reziduali i zašto su važni?

Rezidual je razlika između promatrane (stvarne) vrijednosti i predviđene vrijednosti. Jednostavnije rečeno, rezidual je pogreška. Na primjer, ako je promatrana vrijednost 10, a vaš model je dao vrijednost 8, tada bi rezidualna vrijednost bila 2.

S druge strane, dijagram reziduala je dijagram raspršenosti u kojem se nezavisna varijabla (dob) iscrtava na vodoravnoj osi, a reziduali (pogreške) na okomitoj osi.

Dobro, znate što su reziduali, ali zašto su važni? Da biste to razumjeli, razmotrite sljedeći slučaj:

Želimo razumjeti odnos između starosti i stopa štednje. Za to ćemo iscrtati regresijsku liniju. Međutim, nismo sigurni predstavlja li regresijska linija točan odnos između dviju varijabli. Tu dolaze ostaci. Za provjeru točnosti regresijske linije koristimo dijagram reziduala.

instagram viewer

Sada kada znate što su reziduali, naučimo kako stvoriti dijagram reziduala u Excelu:

Kako stvoriti dijagram reziduala pomoću jednadžbe linije trenda

Prva metoda iscrtavanja reziduala u Excelu koristi jednadžbu crte trenda za izračun predviđenih vrijednosti za naše podatke. Kad to dobijemo, možemo izračunati ostatke oduzimanjem predviđenih vrijednosti od promatranih vrijednosti. Na kraju, stvaramo dijagram raspršenosti s prediktorima na vodoravnoj osi i rezidualama na okomitoj osi.

Iako ova metoda zahtijeva više koraka od druge metode, to je izvrstan način za razumijevanje koncepta. Kada steknete pristojno razumijevanje, možete koristiti drugu metodu, koja zahtijeva manje vremena i truda.

Provest ćemo vas kroz postupak, korak po korak:

Korak 1: Unesite podatke

Počinjemo unosom vrijednosti za prediktor (pod x stupac) i promatrane vrijednosti (ispod Y stupac):

Korak 2: Napravite dijagram raspršenosti podataka

Sada stvaramo dijagram raspršenosti podataka slijedeći korake u nastavku:

Ako niste upoznati s raspršenim dijagramima, evo opsežnog članka o tome stvaranje raspršenog dijagrama u Excelu i predstavljanje vaših podataka. Također možete naučiti koristite dijagram raspršenja u Excelu za predviđanje ponašanja podataka.

  1. Odaberite podatke (pod x i Y stupci).
  2. Idi na Vrpca programa Excel i kliknite Umetnuti.
  3. u Karte kliknite strelicu ispod Dijagram raspršenosti opcija.
  4. Odaberite prvi Scatterplot (Raspršite samo s markerima).
  5. Dobit ćete dijagram raspršenosti sličan sljedećem grafikonu:

Korak 3: Dodajte liniju trenda i prikažite jednadžbu linije trenda na dijagramu raspršenja

Slijedite korake u nastavku da biste dodali liniju trenda na dijagram raspršenosti:

  1. Kliknite na dijagram raspršenosti.
  2. Idi na Vrpca programa Excel i kliknite Izgled.
  3. u Pozadina kliknite strelicu ispod Linija trenda ikona.
  4. Odaberite Linearna linija trenda opcija.

Sada ćete vidjeti liniju (crtu trenda) koja siječe točke na vašem dijagramu raspršenosti. Za prikaz jednadžbe linije trenda na dijagramu raspršenosti slijedite korake u nastavku:

  1. Idi ponovno na Linija trenda ikonu i kliknite na strelicu ispod nje.
  2. Klik Više opcija linije trenda.
  3. A Format Trendline pojavit će se dijaloški okvir.
  4. Provjeri Prikaz jednadžbe na grafikonu opcija na dnu Format Trendline dijaloški okvir. Jednadžba linije trenda prikazat će se na grafikonu.

Korak 4: Izračunajte predviđene vrijednosti

Da biste izračunali predviđene vrijednosti, stvorite još jedan stupac (Z) pored svojih podataka i slijedite korake u nastavku:

  1. Unesite formulu linije trenda prikazanu na grafikonu i zalijepite je ispod stupca Z (ćelija C2). Promijeni x u formuli s vrijednostima ispod stupca X.
  2. Dakle, za prvu predviđenu vrijednost, formula bi bila dana kako slijedi:
    =1,5115*A2+23,133
  3. Zamijeniti A2 s A3 u formuli linije trenda za drugu predviđenu vrijednost.
  4. Za treću predviđenu vrijednost zamijenite A3 s A4, i tako dalje, dok ne dobijete sve predviđene vrijednosti za njihove odgovarajuće prediktore.

Korak 5: Pronađite preostale vrijednosti

Sada kada imamo predviđene vrijednosti, možemo pronaći rezidualne vrijednosti oduzimanjem predviđenih vrijednosti od promatranih (stvarnih) vrijednosti ispod Y stupca. Formula za prvu rezidualnu vrijednost bila bi =B2-C2. Za drugo bi formula bila = B3-C3, i tako dalje.

Korak 6: Napravite rezidualni dijagram

Da bismo stvorili dijagram reziduala, potrebni su nam prediktor i rezidualne vrijednosti. Sada kada imamo oboje, slijedite korake u nastavku:

  1. Odaberite stupce Y i Z.
  2. Kliknite desnom tipkom miša i odaberite Sakriti.
  3. Sada odaberite x i Ostaci stupci.
  4. Idi na Umetnuti karticu na vrpci programa Excel.
  5. Pritisnite strelicu ispod Raspršiti ikona.
  6. Odaberite Raspršivanje samo s markerima opcija.
  7. Dobit ćete rezidualni prikaz, kao što je prikazano u nastavku.

Za drugu metodu, sve što morate učiniti je dati Excelu podatke i on će obaviti sav posao. Možete izraditi rezidualni dijagram u samo nekoliko klikova. Ali za to ćete morati učitati Excelov Analysis Toolpak. Započnimo:

  1. Idi na Datoteka karticu i kliknite Mogućnosti.
  2. The Excel opcije pojavit će se dijaloški okvir.
  3. Idi na Upravljati okviru (na dnu), odaberite Excel dodaci, i kliknite Ići.
  4. An Dodaci pojavit će se dijaloški okvir.
  5. Provjeri Paket alata za analizu okvir i kliknite u redu.
  6. Sada idite na Vrpca programa Excel i kliknite Podaci.
  7. Naći ćete Analiza podataka ikona u Analiza odjeljak.

Korak 2: Unesite podatke

  1. Odaberite stupce A i D, i kliknite desnom tipkom miša. Klik Otkrij.
  2. Sada kopirajte x i Y stupci.

    Primijetit ćete da se grafikon promijenio nakon otkrivanja stupaca. Da bismo ga vratili na izvorni rezidualni prikaz, morat ćemo sakriti Y i Z stupaca (odabirom Y i Z stupaca, desnim klikom miša i odabirom Sakriti).

  3. Otvorite novi Excel list i zalijepite x i Y stupci.
  4. Pritisnite novopojavljeni Analiza podataka opcija u Analiza odjeljak od Podaci tab.
  5. A Analiza podataka pojavit će se dijaloški okvir.
  6. Pronađite i odaberite Regresija pod, ispod Alati za analizu.
  7. Klik U REDU. The Regresija pojavit će se dijaloški okvir.
  8. Unesite vrijednosti u Y stupac (prediktori, B2:B11) u Raspon unosa Y polje.
  9. Unesite raspon ćelija u x stupac (neovisne varijable, A2:A11) u Raspon unosa X polje.

Korak 3: Napravite dijagram reziduala

u Regresija dijaloški okvir, ispod Izlazne opcije, ček Novi radni list Ply, i kliknite u redu.

Excel će automatski stvoriti dijagram reziduala zajedno sa sljedećim rezultatima koje možete koristiti za provjeru pouzdanosti svog regresijskog modela:

  • Regresijska statistika
  • ANOVA tablica
  • Tablica koeficijenata
  • Preostali izlaz

Excelov Analysis ToolPak nudi niz vrijednih statističkih funkcija koje možete koristiti za analizu skupova podataka. Nakon što izradite rezidualni dijagram pomoću Excelovog Analysis ToolPak-a, mogli biste se početi češkati po glavi dok gledate sve te komplicirane tablice. Ali kad jednom naučite kako raditi temeljnu analizu podataka u Excelu, brojke više neće izgledati tako zastrašujuće.