Internet Movie Database (IMDb) najveća je internetska baza podataka koja sadrži informacije povezane s filmovima, televizijskim serijama, kućnim video zapisima, video igrama i sadržajima za strujanje. Mrežna baza podataka sadrži milijune točnih zapisa koje možete koristiti za analizu podataka.

Cinemagoer (prije poznat kao IMDbPY) je Python biblioteka za upravljanje i dohvaćanje podataka IMDb baze podataka filmova. Možete pristupiti podacima o filmovima, ljudima i tvrtkama, koji se mogu dalje koristiti za analizu.

Instaliranje potrebnih biblioteka

Morate instalirati kinoposjetilac Python biblioteka za pristup IMDb baza podataka. Pokrenite sljedeću naredbu u naredbenom retku da biste instalirali biblioteku:

pip instalirati kinoposjetilac

Moraš imati pip instaliran na vašem sustavu za instaliranje vanjskih Python biblioteka.

Kod korišten u ovom projektu dostupan je u a GitHub spremište i besplatan je za korištenje pod MIT licencom.

Izdvajanje IMDb podataka pomoću Pythona

Morate uvesti biblioteku cinemagoer prije nego što je upotrijebite u svom kodu.

instagram viewer
iz imdb uvoz Kinoposjetilac
ia = Cinemagoer()

Gornji kod uvozi biblioteku cinemagoer i stvara instancu klase cinemagoer.

Pretraživanje filmova

Možete tražiti filmove s određenim (ili sličnim) naslovom pomoću search_movie() metoda. Na primjer, ako želite pretraživati ​​filmove s naslovom "rock", trebate pokrenuti sljedeći kod:

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Pretraživanje filmova koji u nazivu imaju rock
filmovi = ia.search_movie('stijena')
ispisati(filmovi[0])

Ovo bi trebalo ispisati prvi pronađeni film, na primjer:

Film možete nabaviti po njegovom IMDb ID-u. Zatim možete izdvojiti dodatne informacije poput imena redatelja i žanrova. Trebaš proći kroz popis dobiti individualne informacije.

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Dobivanje filma pomoću IMDb ID-a
film = ia.get_movie('0468569')
ispisati(film)

# Ispisivanje imena redatelja filma
ispis('Redatelji:')

za redatelja u filmu['redateljima']:
print (redatelj['Ime'])

# ispisivanje žanrova filma
ispis('Žanrovi:')

za žanr u filmu['žanrovi']:
ispisati(žanr)

U ispisu biste trebali vidjeti naziv zadanog filma, redatelja(e) i žanr(ove):

Traženje osobe

Možete pretraživati ​​ljude pomoću search_person() metoda. Na primjer, ako želite pretraživati ​​"Heath", trebate pokrenuti sljedeći kod:

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Traženje ljudi koji u svom imenu imaju Heath
osobe = ia.search_person('Heath')
ispisati(osobe[0])

Vidjet ćete ime prve odgovarajuće osobe koju pretraživanje pronađe:

Pretraživanje tvrtki

Možete pretraživati ​​tvrtke pomoću search_company() metoda. Na primjer, ako želite pretraživati ​​"Univerzalno", trebate pokrenuti sljedeći kod:

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Traženje tvrtki koje u nazivu imaju Universal
tvrtke = ia.search_company('Univerzalni')
ispisati(tvrtke)

Dobit ćete popis svih tvrtki koje u svom nazivu imaju Universal.

Također možete dohvatiti podatke o osobi i tvrtki koristeći njen ID.

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Dobivanje podataka o osobi prema ID-u
osoba = ia.get_person('0005132')
ispis (osoba['Ime'])
ispis (osoba['Datum rođenja'])

# Dobivanje podataka o tvrtki po ID-u
tvrtka = ia.get_company('0005073')
print (tvrtka['Ime'])

Ispis će prikazati pojedinosti o osobi i nazivu tvrtke:

Pronalaženje najboljih i najnižih filmova

Možete dohvatiti podatke za 250 najboljih i 100 najnižih filmova pomoću get_top250_movies() i get_bottom100_movies() metode, odnosno:

iz imdb uvoz Kinoposjetilac

# Stvaranje instance klase Cinemagoer
ia = Cinemagoer()

# Pronalaženje 250 najboljih filmova
vrh = ia.get_top250_movies()
ispisati(vrh[0])

# Pronalaženje najnižih 100 filmova
bottom = ia.get_bottom100_movies()
ispisati(dno[0])

Kao odgovor, vidjet ćete ime najboljeg filma i ime najgoreg:

Biblioteka cinemagoer nudi i neke druge metode poput get_top250_tv(), get_popular100_movies(), i get_top250_indian_movies().

Analiza podataka je procjena podataka pomoću analitičkih ili statističkih alata za izvlačenje informacija. Popularnost analize podataka raste svakim danom. Sada ga koriste tvrtke, marketinške tvrtke i sportski timovi. Kompletan proces analitike podataka uključuje definiranje ciljeva, postavljanje pitanja, prikupljanje podataka, čišćenje podataka, analizu podataka i zaključivanje rezultata.

Skupove podataka za svoje projekte možete dobiti koristeći Python biblioteke kao što je Cinemagoer ili putem online platformi kao što je Kaggle. Uz pune jezike kao što su Python i R, možete koristiti druge alate kao što su Microsoft Excel, Tableau i Stata za analizu podataka.