Python je, kao jezik, vrijedan izvan svake mjere, posebno kada želite raditi sa strukturiranim podacima. Budući da ljudi pohranjuju puno podataka u Excelove datoteke, neophodno je objediniti više datoteka kako biste uštedjeli vrijeme i trud.

Python vam omogućuje upravo to; bez obzira koliko Excel datoteka želite kombinirati, to možete učiniti s relativnom lakoćom. S obzirom na njegov raspon knjižnica i resursa trećih strana, možete uvesti i koristiti Pythonove višestruke alate za obavljanje svojih ponuda.

U ovom vodiču morat ćete instalirati i koristiti Pandas biblioteke za uvoz podataka u Python prije nego što ih konsolidirate.

Instalirajte Pandas knjižnice u Python

Pandas je biblioteka treće strane koju možete instalirati u Python. Neki IDE-ovi već imaju instalirane Pande.

Ako koristite an IDE verzija koji ne dolazi s unaprijed instaliranim Pandama, budite sigurni, možete ga instalirati izravno u Python.

Evo kako instalirati Pande:

pip install pande

Ako koristite Jupyter Notebook, Pandas možete instalirati izravno s

instagram viewer
PIP naredba. Uglavnom, kada ste instalirali Jupyter s Anacondom, velike su šanse da već imate Pande dostupne za izravnu upotrebu.

Ako ne možete nazvati Pande, možete koristiti gornju naredbu da ih izravno instalirate.

Kombiniranje Excel datoteka s Pythonom

Prvo morate stvoriti mapu na željenom mjestu sa svim datotekama programa Excel. Kada je mapa spremna, možete početi pisati kod za uvoz knjižnica.

U ovom kodu ćete koristiti dvije varijable:

  1. pande: Pandas knjižnica pruža okvire podataka za pohranu Excel datoteka.
  2. OS: Knjižnica je korisna za čitanje podataka iz mape vašeg računala

Za uvoz ovih biblioteka koristite ove naredbe:

Uvezite Pande kao pd
Uvoz OS
  • Uvoz: Python sintaksa koja se koristi za uvoz knjižnica u Python
  • pande: Naziv knjižnice
  • pd: Alias ​​dat knjižnici
  • OS: Knjižnica za pristup sistemskoj mapi

Nakon što uvezete knjižnice, stvorite dvije varijable za pohranu putanje ulazne i izlazne datoteke. Put ulazne datoteke potreban je za pristup mapi datoteka. Put izlazne datoteke je neophodan jer će se kombinirana datoteka tamo izvesti.

Ako koristite Python, provjerite jeste li promijenili obrnutu kosu crtu u naprijed-kosu crtu (\ do /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Dodati / na kraju i za dovršenje staza.

Datoteke mape dostupne su na popisu. Izradite popis za pohranu svih referenci datoteka ulazne mape pomoću listdir funkcija iz OS knjižnica.

Ako niste sigurni koje su funkcije dostupne unutar knjižnice, možete koristiti red funkcija s nazivom knjižnice. Na primjer, da biste provjerili točnu verziju funkcije listdir, možete koristiti naredbu na sljedeći način:

direktorij (OS)

Izlaz će se sastojati od svih povezanih funkcija dostupnih unutar OS knjižnice. Funkcija listdir jedna je od mnogih funkcija dostupnih unutar ove biblioteke.

Napravite novu varijablu za pohranu ulaznih datoteka iz mape.

excel_file_list = os.listdir (put_ulazne_datoteke)

Ispišite ovu varijablu da biste vidjeli nazive datoteka pohranjenih u mapi. Sve datoteke pohranjene u mapi prikazuju se nakon što upotrijebite funkciju ispisa.

ispis (excel_file_list)

Zatim morate dodati novi okvir podataka za pohranu svake Excel datoteke. Zamislite okvir podataka kao spremnik za pohranu podataka. Ovdje je naredba za stvaranje okvira podataka.

df = pd. okvir podataka()
  • df: Varijabla za pohranu vrijednosti DataFramea
  • pd: Alias ​​za Pandas knjižnica
  • Okvir podataka: Zadana sintaksa za dodavanje okvira podataka

Ulazna mapa ima tri .xlsx datoteke u ovom primjeru. Nazivi datoteka su:

Datoteka1_excel.xlsx
Datoteka2_excel.xlsx
File3_excel.xlsx

Da biste otvorili svaku datoteku iz ove mape, morate pokrenuti petlju. Petlja će se pokrenuti za svaku od datoteka na popisu stvorenom iznad.

Evo kako to možete učiniti:

za excel_files u excel_file_list:

Zatim je potrebno provjeriti ekstenzije datoteka jer će kod otvoriti samo XLSX datoteke. Da biste provjerili ove datoteke, možete koristiti Ako izjava.

Koristiti završava s funkcionirati u tu svrhu, kako slijedi:

za excel_files u excel_file_list:

ako excel_files.endswith(".xlsx"):

  • excel_datoteke: Popis sa svim vrijednostima datoteke
  • završava sa: Funkcija za provjeru proširenja datoteka
  • (".xlsx"): Ova vrijednost niza može se promijeniti, ovisno o tome što želite tražiti

Sada kada ste identificirali Excel datoteke, možete stvoriti novi okvir podataka za čitanje i pohranjivanje datoteka pojedinačno.

za excel_files u excel_file_list:

ako excel_files.endswith(".xlsx"):

df1 = pd.read_excel (put_ulazne_datoteke+excel_datoteke)

  • df1: Novi okvir podataka
  • pd: Pandas knjižnica
  • read_excel: Funkcija za čitanje Excel datoteka unutar Pandas biblioteke
  • put_ulazne_datoteke: Put do mape u kojoj su datoteke pohranjene
  • excel_datoteke: Bilo koja varijabla koja se koristi u for petlji

Da biste počeli dodavati datoteke, trebate upotrijebiti dodati funkcija.

za excel_files u excel_file_list:

ako excel_files.endswith(".xlsx"):

df1 = pd.read_excel (put_ulazne_datoteke+excel_datoteke)
df = df.dodati (df1)

Konačno, sada kada je okvir konsolidiranih podataka spreman, možete ga izvesti na izlaznu lokaciju. U tom slučaju izvozite okvir podataka u XLSX datoteku.

df.to_excel (put_izlazne_datoteke+"Konsolidirana_datoteka.xlsx")
  • df: Okvir podataka za izvoz
  • to_excel: Naredba koja se koristi za izvoz podataka
  • put_izlazne_datoteke: Definiran put za pohranjivanje izlaza
  • Consolidated_file.xlsx: Naziv konsolidirane datoteke

Sada, pogledajmo konačni kod:

#Pandas se koristi kao okvir podataka za rukovanje Excel datotekama
uvoz pande kao pd
uvoz os

# promijenite kosu crtu iz “\” u “/”, ako koristite Windows uređaje

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel datoteke/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#kreirajte popis za pohranu svih referenci datoteka ulazne mape pomoću funkcije listdir iz biblioteke os.
#Da biste vidjeli sadržaj biblioteke (poput funkcije listdir, možete koristiti funkciju dir na nazivu knjižnice).
#Upotrijebite dir (ime_knjižnice) za popis sadržaja

excel_file_list = os.listdir (put_ulazne_datoteke)

#ispišite sve datoteke pohranjene u mapi, nakon definiranja popisa
excel_file_list

#Kada se svaka datoteka otvori, upotrijebite funkciju dodavanja za početak konsolidacije podataka pohranjenih u više datoteka

#kreirajte novi, prazan okvir podataka za rukovanje uvozima excel datoteke
df = pd. okvir podataka()

#Pokrenite petlju for za petlju kroz svaku datoteku na popisu
za excel_files u excel_file_list:
#provjeri samo datoteke sufiksa .xlsx
ako excel_files.endswith(".xlsx"):
#kreirajte novi okvir podataka za čitanje/otvaranje svake Excel datoteke s popisa datoteka stvorenih iznad
df1 = pd.read_excel (put_ulazne_datoteke+excel_datoteke)
#dodajte svaku datoteku u izvorni prazan okvir podataka
df = df.dodati (df1)

#transfer konačni izlaz u Excel (xlsx) datoteku na izlaznoj stazi
df.to_excel (put_izlazne_datoteke+"Konsolidirana_datoteka.xlsx")

Korištenje Pythona za kombiniranje više Excel radnih knjiga

Python's Pandas izvrstan je alat za početnike i napredne korisnike. Knjižnicu intenzivno koriste programeri koji žele savladati Python.

Čak i ako ste početnik, možete imati ogromnu korist učenjem nijansi Panda i načina na koji se knjižnica koristi unutar Pythona.

6 Panda operacija za početnike

Naviknite se na Pande s ovim početničkim operacijama.

Pročitajte dalje

UdioCvrkutE-mail
Povezane teme
  • Programiranje
  • Piton
  • Microsoft Excel
  • Proračunska tablica
O autoru
Gaurav Siyal (Objavljeno 59 članaka)

Gaurav Siyal ima dvije godine iskustva pisanja, pisanja za niz tvrtki za digitalni marketing i dokumenata o životnom ciklusu softvera.

Više od Gaurava Siyala

Pretplatite se na naše obavijesti

Pridružite se našem biltenu za tehničke savjete, recenzije, besplatne e-knjige i ekskluzivne ponude!

Kliknite ovdje za pretplatu