Audioknjige dobivaju sve veću popularnost u odnosu na tradicionalne e-knjige. Praktičniji su jer ih možete slušati bilo kada i bilo gdje.

PDF e-knjigu možete pretvoriti u audioknjigu jednostavnom Python skriptom. Koristeći neke jednostavne knjižnice, možete razviti projekt koji će pročitati PDF i pohraniti audioknjigu kao novu datoteku.

Instaliranje potrebnih paketa

Morate instalirati PyPDF3, pyttsx3, i pdfvodoinstalater pakete za početak. Ove pakete možete instalirati pomoću pip upravitelja paketa. Provjerite jeste li već instaliran pip na vašem sustavu. Izvedite sljedeću naredbu u naredbenom retku da biste instalirali pakete:

pip instalirati PyPDF3 pyttsx3 pdfvodoinstalater
  • Možete koristiti PyPDF3 biblioteka za čitanje i uređivanje PDF datoteka u Pythonu.
  • The pyttsx3 knjižnica omogućuje pretvorbu teksta u govor.
  • pdfvodoinstalater je biblioteka koja vam omogućuje izdvajanje teksta i tablica iz PDF datoteka.

Kod korišten u ovom projektu dostupan je u a GitHub spremište i besplatan je za korištenje pod MIT licencom.

instagram viewer

Pretvaranje PDF-a u audioknjigu pomoću Pythona

Nakon što ste instalirali gore navedene pakete, spremni ste ih uvesti u svoju python datoteku:

uvoz PyPDF3
uvoz pyttsx3
uvoz pdfvodoinstalater

Morate navesti naziv i mjesto PDF datoteke koju želite pretvoriti. Radi jednostavnosti, možete koristiti bilo koju oglednu PDF datoteku. Kopirajte ga u isti direktorij kao i vaša skripta i pohranite njegovo ime u varijablu; ako se zove Lorem.pdf, na primjer:

datoteka = 'Lorem.pdf'

Zatim stvorite objekt datoteke za PDF datoteku i objekt PDF čitača:

knjiga = otvori (datoteka, 'rb')
pdfReader = PyPDF3.PdfFileReader (knjiga)

Kasnije ćete se kretati kroz sve stranice PDF datoteke. Da biste pronašli ukupan broj stranica, koristite numPages svojstvo:

stranice = pdfReader.numPages

Sada ste spremni izdvojiti tekst iz PDF datoteke:

finalText = ""

s pdfvodoinstalater.open(datoteka) kao pdf:
za i u rasponu (0, stranice):
stranica = pdf.stranice[i]
text = page.extract_text()
finalText += tekst

Koristite for petlju za ponavljanje kroz sve stranice i izdvajanje teksta iz PDF-a. Možete koristiti pdfplumber paket za otvaranje pdf datoteke i ekstrakt_teksta metoda za dohvaćanje teksta sa stranice.

S punim tekstom pohranjenim u varijabli, možete ga dalje obrađivati, ovisno o vašim zahtjevima. Ako želite pretvoriti tekst u audio i spremiti ga u novu datoteku, koristite sljedeći kod:

motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.trčiIČekaj()

Kada ti pokrenite ovaj Python kod, stvorit će datoteku audio knjige u svom direktoriju.

Ako ne želite spremiti audioknjigu i, na primjer, želite recitirati PDF datoteku, umjesto toga možete upotrijebiti sljedeći kod:

motor = pyttsx3.init()
motor.reći(finalText)
motor.trčiIČekaj()

Kada pokrenete ovu skriptu, ona će recitirati PDF datoteku.

Razvijajte projekte koristeći Python

Python je poznat po svojoj svestranosti. Pomoću Pythona možete jednostavno izraditi projekte s praktičnim aplikacijama.

Ako želite zaprljati ruke Python kodom, možete početi s razvojem mini-projekata. Neke dobre početne ideje su aplikacija za kviz, chatbot, igrica zmija, skraćivač URL-ova, web scraper ili pretvarač jedinica.