Sjećate li se dana kada ste koristili fizički globus ili skenirali veliku tešku knjigu kako biste pronašli nazive različitih regija i zemalja? S napretkom tehnologije, posebice interneta, sve ove informacije sada su dostupne jednim pritiskom na gumb.
Ali što ako želite otići korak dalje i pronaći bitne podatke o zemlji kao što su njezin glavni grad, geografske koordinate ili valuta? Ne tražite dalje od Pythonovog nevjerojatnog Country Info modula, koji može obaviti posao za nekoliko sekundi.
Što je CountryInfo modul?
Porimol Chandro razvio je Informacije o zemlji modul. Ima funkcije za dohvaćanje glavnog grada zemlje, geografskih koordinata, vremenske zone, područja, stanovništva i više.
Da biste instalirali ovaj modul, otvorite svoj terminal i izvršite:
pip instalirati informacije o zemlji
Također možete dohvatite vremenske podatke uživo za bilo koju zemlju ili regiju i koristite ga zajedno s informacijama i poboljšajte svoj skup podataka.
Kako koristiti funkcije modula
Možete dohvatiti informacije pomoću različitih funkcija CountryInfo modul kako slijedi.
1. Dobivanje alternativnih imena ili načina pisanja zemlje
Možete dohvatiti alternativna imena ili način pisanja zemlje ovako:
iz informacije o zemlji uvoz CountryInfo
ime = 'Indija'
zemlja = Podaci o zemlji (ime)
podaci1 = zemlja.alt_spellings()
ispisati(podatak1)
Počnite s uvozom CountryInfo razreda iz informacije o zemlji modul. Zatim možete stvoriti instancu CountryInfo prosljeđivanjem niza koji sadrži naziv zemlje.
Možete pozvati različite API metode na objektu CountryInfo koji ste izradili. Na primjer, alt_spellings() vraća popis alternativnih naziva zemlje.
Python isječak za dobivanje alternativnih imena zemlje daje sljedeći rezultat:
2. Dobivanje glavnog grada i njegovih geografskih koordinata
Možeš koristiti glavni() dobiti glavni grad bilo koje zemlje. Vraća niz koji predstavlja naziv glavnog grada:
podaci2 = zemlja.kapital()
ispisati(podatak2)
Ovaj Python isječak proizvodi sljedeći izlaz:
Koristite API metodu velika_latlng() dohvatiti geografske koordinate glavnog grada zemlje. Ova metoda vraća popis koji sadrži dva elementa, svaki broj s pomičnim zarezom:
podaci3 = zemlja.capital_latlng()
ispisati(podaci3)
Python isječak za dobivanje zemljopisne širine i širine zemlje daje sljedeći rezultat:
3. Dohvaćanje površine zemlje, njezinih pokrajina i okolnih pograničnih zemalja
Možete koristiti API metodu, područje() da biste dobili površinu bilo koje zemlje u četvornim kilometrima. Implementirajte kod kao:
podaci4 = država.područje()
ispisati(podaci4)
Python isječak za dobivanje područja zemlje daje sljedeći rezultat:
Možete dobiti popis pokrajina u zemlji koristeći provincija(). Svaki element na popisu je niz koji predstavlja pokrajinu. Implementirajte kod kao:
podaci5 = država.provincije()
ispisati(podaci 5)
Python isječak za dobivanje pokrajina zemlje daje sljedeći rezultat:
Imena graničnih zemalja možete dohvatiti pomoću API metode, granice(). Svaki element na popisu je kod zemlje u ISO-3 formatu, niz od tri velika slova. Implementirajte kod kao:
data6 = country.borders()
ispisati(podaci6)
Python isječak za dobivanje imena graničnih zemalja proizvodi sljedeći izlaz:
4. Dobivanje pozivnih brojeva zemlje
Možete dohvatiti međunarodne pozivne brojeve zemlje koristeći pozivni_kodovi(). Ovo vraća popis nizova, od kojih svaki sadrži numerički telefonski prefiks koji vam je potreban za poziv zemlje iz druge:
podaci7 = country.calling_codes()
ispisati(podaci 7)
Python isječak za dobivanje pozivnih brojeva zemlje daje sljedeći izlaz:
5. Dobivanje valute, stanovništva i vremenskih zona
Dohvaćanje službenog formata valute zemlje pomoću API metode, valute(). Ova metoda vraća drugu listu nizova:
podaci8 = zemlja.valute()
ispisati(podaci8)
Python isječak za dobivanje valute zemlje daje sljedeći rezultat:
Dohvatite približan broj ljudi koji žive u zemlji pomoću populacija(). Ova metoda vraća int. Koristite ga ovako:
podaci9 = zemlja.populacija()
ispisati(podaci 9)
Python isječak za dobivanje broja stanovnika zemlje daje sljedeći rezultat:
Država može imati jednu ili više od jedne vremenske zone, ovisno o svojoj veličini. Možete dohvatiti različite vremenske zone zemlje pomoću vremenske zone() API metoda kao:
podaci10 = zemlja.vremenske zone()
ispisati(podaci10)
Python isječak za dobivanje različitih vremenskih zona zemlje daje sljedeći rezultat:
6. Dobivanje regije i podregije zemlje
Dohvaćanje općenite regije ili kontinenta kojem država pripada pomoću regija() API metoda. Implementirajte kod kao:
podaci11 = država.regija()
ispisati(podaci11)
Python isječak za dobivanje regije zemlje daje sljedeći rezultat:
Slično tome, možete koristiti određeniju regiju kojoj zemlja pripada podregija() kao:
podaci12 = država.podregija()
ispisati(podaci 12)
Python isječak za dobivanje podregije zemlje proizvodi sljedeći izlaz:
7. Dobivanje URL-a Wikipedije zemlje
Wikipedia je jedan od najboljih izvora informacija za bilo što na internetu. Možete dohvatiti stranicu Wikipedije zemlje koristeći API metodu, wiki(). Implementirajte kod kao:
podaci13 = zemlja.wiki()
ispisati(podaci 13)
Python isječak za dobivanje Wikipedijine stranice zemlje daje sljedeći rezultat:
8. Dobivanje domene najviše razine za državu
ccTLD je naziv domene najviše razine s kodom zemlje koji označava državu ili geografsko područje web stranice. Obično je dugačak dva slova, npr .u za Indiju i .ca za Kanadu. Možete dohvatiti vršnu domenu za zemlju koristeći tld() kao:
podaci14 = država.tld()
ispisati(podaci 14)
Python isječak za dobivanje vršne domene zemlje daje sljedeći rezultat:
9. Dobivanje svih dostupnih informacija o zemlji
Možete dohvatiti sve dostupne informacije o zemlji koristeći API metodu, info(). Vraća rječnik vrijednosti ključa/imena, koje možete ponavljati koristeći for petlju:
podaci15 = država.info()
zaključ, vrijednostupodaci15.predmeti():
ispis (ključ, ":", vrijednost)
Python isječak za dobivanje svih dostupnih informacija o zemlji daje sljedeći rezultat:
10. Dobivanje informacija o svim zemljama i stvaranje skupa podataka
CountryInfo modul pruža API metodu tzv svi() koji vraća rječnik koji sadrži sve informacije za sve zemlje svijeta:
iz informacije o zemlji uvoz CountryInfo
uvoz pande kao pd
zemlja = CountryInfo()
podaci = država.sve()
Za manipuliranje ovim podacima možete koristiti modul pandas. The pandas modul pruža mnoge naredbe za rad s DataFrames, uključujući onaj za spremanje podataka u CSV formatu:
df = pd. DataFrame (podaci)
df.to_csv("Country_Data_Fetcher.csv")
Dohvaćanje podataka s web stranica
Iako ovaj praktični Python modul pruža sve bitne informacije o bilo kojoj zemlji, dohvaćanje čistih podataka nije lak zadatak. Poznavanje web skrapinga pomoći će vam da dohvatite podatke s bilo kojeg web mjesta na internetu. Zatim možete analizirati i koristiti te podatke u svojim aplikacijama.
Python ima moćan modul koji se zove BeautifulSoup koji možete instalirati za izvođenje web skrapinga i uštedjeti sate vašeg rada.