In tegenstelling tot een tekstbestand kunt u een PDF niet rechtstreeks bewerken. Er zijn meerdere manieren om PDF-bestanden met tekst te genereren. Maar wat als u de andere kant op wilt en PDF's naar tekstbestanden wilt converteren?
Gelukkig kun je met Linux deze bestanden eenvoudig vanaf de terminal wijzigen. Dit artikel laat zien hoe je een PDF-bestand converteert naar een tekstdocument op Linux.
Converteer PDF naar tekst vanaf de terminal
Poppler is een softwarebibliotheek die wordt gebruikt om PDF-bestanden weer te geven en te wijzigen. Het bevat een hulpprogramma, bekend als pdftotext, waarmee gebruikers tekstbestanden van PDF's kunnen genereren. Sinds poppler-utils maakt geen deel uit van de standaard Linux-pakketten, je zult het handmatig moeten installeren met behulp van een pakketbeheerder.
Op Ubuntu en Debian:
sudo apt install poppler-utils
Om Poppler op Arch Linux te installeren:
sudo pacman -S poppler
Installeren van de poppler-utils pakket op CentOS, Fedora en andere op RHEL gebaseerde distributies is eenvoudig.
sudo dnf poppler-utils installeren
sudo yum installeer poppler-utils
Een hele PDF converteren naar tekst
De basissyntaxis van de opdracht pdftotext is:
pdftotext [opties] pdfbestand tekstbestand
...waar PDF bestand is het absolute of relatieve pad naar het PDF-bestand, en tekstbestand is de naam van het uitvoerbestand.
Om bijvoorbeeld te converteren lorem-ipsum.pdf naar een tekstbestand:
pdftotext lorem-ipsum.pdf text.txt
Als het bestand dat u converteert watermerken of niet-uitgelijnde tekst bevat, kunt u deze in de uitvoer weggooien met de -nodiag vlag.
pdftotext -nodiag lorem-ipsum.pdf random.text
Verwerk pagina's binnen een specifiek bereik
Gebruik de -f en -l markeren als u pagina's wilt converteren die binnen een bepaald bereik vallen. Om bijvoorbeeld pagina's van één naar vijf in lorem-ipsum.pdf sms'en:
pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt
Om alleen de eerste pagina van het PDF-bestand te converteren:
pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt
Met wachtwoord beveiligde PDF-bestanden converteren naar tekst
Pdftotext kan zelfs met een wachtwoord beveiligde PDF's converteren naar tekstbestanden. De -upw en -opw vlaggen, die staan voor gebruikerswachtwoord en eigenaar wachtwoord respectievelijk zorg voor het authenticatieproces tijdens het converteren van de PDF-bestanden.
pdftotext -upw wachtwoord lorem-ipsum.pdf output.txt
pdftotext -opw wachtwoord lorem-ipsum.pdf output.txt
Zorg ervoor dat u vervangt wachtwoord met het wachtwoord van het PDF-bestand.
U kunt ook meerdere vlaggen combineren om de gewenste uitvoer te krijgen. Om bijvoorbeeld pagina's één tot drie van een met een wachtwoord beveiligde PDF naar tekst te converteren:
pdftotext -f 1 -l 3 -upw wachtwoord lorem-ipsum.pdf output.txt
Verwant: Een PDF-bestand converteren naar afbeeldingen in Linux
Grafisch PDF converteren naar een tekstbestand
Als werken met de opdrachtregel niet jouw ding is, kun je PDF's converteren naar tekstbestanden met grafische software zoals Calibre. Het is een e-boekbeheertoepassing die u kunt gebruiken om te bekijken, ordenen en PDF-bestanden wijzigen op uw systeem.
Calibre is beschikbaar in de officiële Linux-distro-repositories en iedereen kan het downloaden met behulp van een pakketbeheerder.
Calibre installeren op Ubuntu en Debian:
sudo apt install caliber
Op Arch Linux:
sudo pacman -S caliber
Op RHEL-gebaseerde distributies zoals CentOS en Fedora kun je Calibre downloaden met DNF of Yum.
sudo dnf caliber installeren
sudo yum install caliber
Hoe Calibre te gebruiken om PDF-bestanden te converteren
Eenmaal geïnstalleerd, start u Calibre op uw systeem met behulp van de Applicatiemenu. U kunt Calibre ook starten vanaf de terminal door te typen:
kaliber
Om tekstbestanden te genereren met behulp van PDF met Calibre:
- Klik op de Boeken toevoegen optie uit het menu.
- Zoek en selecteer het PDF-bestand dat u wilt converteren.
- Markeer het PDF-bestand in het middenpaneel en selecteer Boeken converteren uit de menukaart.
- Van de Uitvoerformaat vervolgkeuzelijst, selecteer tekst.
- Klik ten slotte op OK doorgaan.
Calibre begint nu met het converteren van het opgegeven PDF-bestand naar een tekstdocument. U kunt de status van het proces controleren door te klikken op de Banen optie, die zich rechtsonder in het venster bevindt.
Werken met PDF-bestanden in Linux
Als u een document met iemand wilt delen, is het de meest efficiënte manier om het te converteren naar een PDF voordat u het deelt. Voorheen moesten gebruikers een speciale PDF-viewer op hun systeem installeren om PDF-bestanden weer te geven, maar nu wordt bijna elke browser geleverd met een ingebouwde PDF-viewer.
U kunt verschillende toepassingen vinden waarmee een gebruiker eenvoudig PDF-bestanden kan bekijken en bewerken. Veel Linux-installaties worden geleverd met LibreOffice, een kantoorsoftwaresuite, die als PDF-editor kan worden gebruikt.
Wilt u een PDF-bestand bewerken in Linux? Deze Linux PDF-editors zijn gratis te installeren en gemakkelijk te gebruiken.
Lees volgende
- Linux
- PDF-editor
- Linux
Deepesh is de Junior Editor voor Linux bij MUO. Hij schrijft al meer dan 3 jaar informatieve content op internet. In zijn vrije tijd houdt hij van schrijven, naar muziek luisteren en gitaar spelen.
Abonneer op onze nieuwsbrief
Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!
Nog een stap…!
Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.