In tegenstelling tot een tekstbestand kunt u een PDF niet rechtstreeks bewerken. Er zijn meerdere manieren om PDF-bestanden met tekst te genereren. Maar wat als u de andere kant op wilt en PDF's naar tekstbestanden wilt converteren?

Gelukkig kun je met Linux deze bestanden eenvoudig vanaf de terminal wijzigen. Dit artikel laat zien hoe je een PDF-bestand converteert naar een tekstdocument op Linux.

Converteer PDF naar tekst vanaf de terminal

Poppler is een softwarebibliotheek die wordt gebruikt om PDF-bestanden weer te geven en te wijzigen. Het bevat een hulpprogramma, bekend als pdftotext, waarmee gebruikers tekstbestanden van PDF's kunnen genereren. Sinds poppler-utils maakt geen deel uit van de standaard Linux-pakketten, je zult het handmatig moeten installeren met behulp van een pakketbeheerder.

Op Ubuntu en Debian:

sudo apt install poppler-utils

Om Poppler op Arch Linux te installeren:

sudo pacman -S poppler

Installeren van de poppler-utils pakket op CentOS, Fedora en andere op RHEL gebaseerde distributies is eenvoudig.

instagram viewer
sudo dnf poppler-utils installeren
sudo yum installeer poppler-utils

Een hele PDF converteren naar tekst

De basissyntaxis van de opdracht pdftotext is:

pdftotext [opties] pdfbestand tekstbestand

...waar PDF bestand is het absolute of relatieve pad naar het PDF-bestand, en tekstbestand is de naam van het uitvoerbestand.

Om bijvoorbeeld te converteren lorem-ipsum.pdf naar een tekstbestand:

pdftotext lorem-ipsum.pdf text.txt

Als het bestand dat u converteert watermerken of niet-uitgelijnde tekst bevat, kunt u deze in de uitvoer weggooien met de -nodiag vlag.

pdftotext -nodiag lorem-ipsum.pdf random.text

Verwerk pagina's binnen een specifiek bereik

Gebruik de -f en -l markeren als u pagina's wilt converteren die binnen een bepaald bereik vallen. Om bijvoorbeeld pagina's van één naar vijf in lorem-ipsum.pdf sms'en:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

Om alleen de eerste pagina van het PDF-bestand te converteren:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

Met wachtwoord beveiligde PDF-bestanden converteren naar tekst

Pdftotext kan zelfs met een wachtwoord beveiligde PDF's converteren naar tekstbestanden. De -upw en -opw vlaggen, die staan ​​voor gebruikerswachtwoord en eigenaar wachtwoord respectievelijk zorg voor het authenticatieproces tijdens het converteren van de PDF-bestanden.

pdftotext -upw wachtwoord lorem-ipsum.pdf output.txt
pdftotext -opw wachtwoord lorem-ipsum.pdf output.txt

Zorg ervoor dat u vervangt wachtwoord met het wachtwoord van het PDF-bestand.

U kunt ook meerdere vlaggen combineren om de gewenste uitvoer te krijgen. Om bijvoorbeeld pagina's één tot drie van een met een wachtwoord beveiligde PDF naar tekst te converteren:

pdftotext -f 1 -l 3 -upw wachtwoord lorem-ipsum.pdf output.txt

Verwant: Een PDF-bestand converteren naar afbeeldingen in Linux

Grafisch PDF converteren naar een tekstbestand

Als werken met de opdrachtregel niet jouw ding is, kun je PDF's converteren naar tekstbestanden met grafische software zoals Calibre. Het is een e-boekbeheertoepassing die u kunt gebruiken om te bekijken, ordenen en PDF-bestanden wijzigen op uw systeem.

Calibre is beschikbaar in de officiële Linux-distro-repositories en iedereen kan het downloaden met behulp van een pakketbeheerder.

Calibre installeren op Ubuntu en Debian:

sudo apt install caliber

Op Arch Linux:

sudo pacman -S caliber

Op RHEL-gebaseerde distributies zoals CentOS en Fedora kun je Calibre downloaden met DNF of Yum.

sudo dnf caliber installeren
sudo yum install caliber

Hoe Calibre te gebruiken om PDF-bestanden te converteren

Eenmaal geïnstalleerd, start u Calibre op uw systeem met behulp van de Applicatiemenu. U kunt Calibre ook starten vanaf de terminal door te typen:

kaliber

Om tekstbestanden te genereren met behulp van PDF met Calibre:

  1. Klik op de Boeken toevoegen optie uit het menu.
  2. Zoek en selecteer het PDF-bestand dat u wilt converteren.
  3. Markeer het PDF-bestand in het middenpaneel en selecteer Boeken converteren uit de menukaart.
  4. Van de Uitvoerformaat vervolgkeuzelijst, selecteer tekst.
  5. Klik ten slotte op OK doorgaan.

Calibre begint nu met het converteren van het opgegeven PDF-bestand naar een tekstdocument. U kunt de status van het proces controleren door te klikken op de Banen optie, die zich rechtsonder in het venster bevindt.

Werken met PDF-bestanden in Linux

Als u een document met iemand wilt delen, is het de meest efficiënte manier om het te converteren naar een PDF voordat u het deelt. Voorheen moesten gebruikers een speciale PDF-viewer op hun systeem installeren om PDF-bestanden weer te geven, maar nu wordt bijna elke browser geleverd met een ingebouwde PDF-viewer.

U kunt verschillende toepassingen vinden waarmee een gebruiker eenvoudig PDF-bestanden kan bekijken en bewerken. Veel Linux-installaties worden geleverd met LibreOffice, een kantoorsoftwaresuite, die als PDF-editor kan worden gebruikt.

E-mail
De 5 beste Linux PDF-editors die u zou moeten proberen

Wilt u een PDF-bestand bewerken in Linux? Deze Linux PDF-editors zijn gratis te installeren en gemakkelijk te gebruiken.

Lees volgende

Gerelateerde onderwerpen
  • Linux
  • PDF
  • PDF-editor
  • Linux
Over de auteur
Deepesh Sharma (63 artikelen gepubliceerd)

Deepesh is de Junior Editor voor Linux bij MUO. Hij schrijft al meer dan 3 jaar informatieve content op internet. In zijn vrije tijd houdt hij van schrijven, naar muziek luisteren en gitaar spelen.

Meer van Deepesh Sharma

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Nog een stap…!

Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.

.