Audioknjige dobivaju sve veću popularnost u odnosu na tradicionalne e-knjige. Praktičniji su jer ih možete slušati bilo kada i bilo gdje.
PDF e-knjigu možete pretvoriti u audioknjigu jednostavnom Python skriptom. Koristeći neke jednostavne knjižnice, možete razviti projekt koji će pročitati PDF i pohraniti audioknjigu kao novu datoteku.
Instaliranje potrebnih paketa
Morate instalirati PyPDF3, pyttsx3, i pdfvodoinstalater pakete za početak. Ove pakete možete instalirati pomoću pip upravitelja paketa. Provjerite jeste li već instaliran pip na vašem sustavu. Izvedite sljedeću naredbu u naredbenom retku da biste instalirali pakete:
pip instalirati PyPDF3 pyttsx3 pdfvodoinstalater
- Možete koristiti PyPDF3 biblioteka za čitanje i uređivanje PDF datoteka u Pythonu.
- The pyttsx3 knjižnica omogućuje pretvorbu teksta u govor.
- pdfvodoinstalater je biblioteka koja vam omogućuje izdvajanje teksta i tablica iz PDF datoteka.
Kod korišten u ovom projektu dostupan je u a GitHub spremište i besplatan je za korištenje pod MIT licencom.
Pretvaranje PDF-a u audioknjigu pomoću Pythona
Nakon što ste instalirali gore navedene pakete, spremni ste ih uvesti u svoju python datoteku:
uvoz PyPDF3
uvoz pyttsx3
uvoz pdfvodoinstalater
Morate navesti naziv i mjesto PDF datoteke koju želite pretvoriti. Radi jednostavnosti, možete koristiti bilo koju oglednu PDF datoteku. Kopirajte ga u isti direktorij kao i vaša skripta i pohranite njegovo ime u varijablu; ako se zove Lorem.pdf, na primjer:
datoteka = 'Lorem.pdf'
Zatim stvorite objekt datoteke za PDF datoteku i objekt PDF čitača:
knjiga = otvori (datoteka, 'rb')
pdfReader = PyPDF3.PdfFileReader (knjiga)
Kasnije ćete se kretati kroz sve stranice PDF datoteke. Da biste pronašli ukupan broj stranica, koristite numPages svojstvo:
stranice = pdfReader.numPages
Sada ste spremni izdvojiti tekst iz PDF datoteke:
finalText = ""
s pdfvodoinstalater.open(datoteka) kao pdf:
za i u rasponu (0, stranice):
stranica = pdf.stranice[i]
text = page.extract_text()
finalText += tekst
Koristite for petlju za ponavljanje kroz sve stranice i izdvajanje teksta iz PDF-a. Možete koristiti pdfplumber paket za otvaranje pdf datoteke i ekstrakt_teksta metoda za dohvaćanje teksta sa stranice.
S punim tekstom pohranjenim u varijabli, možete ga dalje obrađivati, ovisno o vašim zahtjevima. Ako želite pretvoriti tekst u audio i spremiti ga u novu datoteku, koristite sljedeći kod:
motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.trčiIČekaj()
Kada ti pokrenite ovaj Python kod, stvorit će datoteku audio knjige u svom direktoriju.
Ako ne želite spremiti audioknjigu i, na primjer, želite recitirati PDF datoteku, umjesto toga možete upotrijebiti sljedeći kod:
motor = pyttsx3.init()
motor.reći(finalText)
motor.trčiIČekaj()
Kada pokrenete ovu skriptu, ona će recitirati PDF datoteku.
Razvijajte projekte koristeći Python
Python je poznat po svojoj svestranosti. Pomoću Pythona možete jednostavno izraditi projekte s praktičnim aplikacijama.
Ako želite zaprljati ruke Python kodom, možete početi s razvojem mini-projekata. Neke dobre početne ideje su aplikacija za kviz, chatbot, igrica zmija, skraćivač URL-ova, web scraper ili pretvarač jedinica.