de.phhsnews.com


de.phhsnews.com / Konvertieren einer PDF-Datei in bearbeitbaren Text über die Befehlszeile unter Linux

Konvertieren einer PDF-Datei in bearbeitbaren Text über die Befehlszeile unter Linux


Es gibt verschiedene Gründe, warum Sie eine PDF-Datei in bearbeitbaren Text konvertieren möchten. Vielleicht müssen Sie ein altes Dokument überarbeiten, und alles, was Sie haben, ist die PDF-Version davon. Konvertieren von PDF-Dateien in Windows ist einfach, aber was ist, wenn Sie Linux verwenden?

RELATED: PDF-Dateien in Word-Dokumente und andere Formate konvertieren

Keine Sorge. Wir zeigen Ihnen, wie Sie PDF-Dateien mithilfe eines Befehlszeilenprogramms namens pdftotext, das Teil des Pakets "poppler-utils" ist, problemlos in bearbeitbaren Text konvertieren können. Dieses Tool ist möglicherweise bereits installiert. Um zu prüfen, ob pdftotext auf Ihrem System installiert ist, drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen. Geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie die Eingabetaste.

dpkg -s poppler-utils

HINWEIS: Wenn wir in diesem Artikel etwas eingeben und der Text in Anführungszeichen gesetzt wird, geben Sie die Anführungszeichen NICHT ein. wenn nicht anders angegeben.

Wenn pdftotext nicht installiert ist, geben Sie den folgenden Befehl an der Eingabeaufforderung ein und drücken Sie "Enter".

sudo apt-get install poppler-utils

Geben Sie Ihr Passwort ein, wenn Sie dazu aufgefordert werden ".

Im Paket" poppler-utils "stehen mehrere Werkzeuge zur Verfügung, um PDF in verschiedene Formate zu konvertieren, PDF-Dateien zu bearbeiten und Informationen aus Dateien zu extrahieren.

Nachfolgend finden Sie die grundlegenden Anweisungen zum Konvertieren einer PDF-Datei in eine bearbeitbare Datei Textdatei. Drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen, geben Sie den Befehl an der Eingabeaufforderung ein und drücken Sie "Enter".

pdftotext /home/lori/Documents/Sample.pdf / home / lori / Documents / Sample. txt

Ändern Sie den Pfad zu jeder Datei so, dass sie dem Speicherort und dem Namen Ihrer ursprünglichen PDF-Datei entspricht und wo Sie die resultierende Textdatei speichern möchten. Ändern Sie außerdem die Dateinamen so, dass sie den Namen Ihrer Dateien entsprechen.

Die Textdatei wird erstellt und kann so geöffnet werden, wie Sie eine andere Textdatei unter Linux öffnen würden.

Der konvertierte Text kann an einigen Stellen Zeilenumbrüche enthalten du willst nicht. Zeilenumbrüche werden nach jeder Textzeile in der PDF-Datei eingefügt.

Sie können das Layout Ihres Dokuments (Kopf- und Fußzeilen, Paging usw.) aus der ursprünglichen PDF-Datei in der konvertierten Textdatei mit dem "-layout" beibehalten "Flag.

pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Wenn Sie nur einen Bereich von Seiten in einer PDF-Datei konvertieren möchten, verwenden Sie den" -f "und" -l "(ein Kleinbuchstabe" L ") Flags, um die erste und die letzte Seite des Bereichs anzugeben, den Sie konvertieren möchten.

pdftotext -f 5 -l 9 / home / lori / Dokumente / Beispiel. pdf /home/lori/Documents/Sample.txt

Um eine PDF-Datei zu konvertieren, die geschützt und mit einem Besitzer-Passwort verschlüsselt ist, verwenden Sie die "-opw" -Flag (das erste Zeichen in der Flagge ist ein Kleinbuchstabe "O", nicht eine Null).

pdftotext -opw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

Ändern Sie "password" zu dem, das zum Schützen der Original-PDF verwendet wurde Datei wird konvertiert. Stellen Sie sicher, dass es um "password" doppelte Anführungszeichen gibt.

Wenn die PDF-Datei mit einem Benutzerpasswort geschützt und verschlüsselt ist, verwenden Sie das Flag "-upw" anstelle des Flags "-opw". Der Rest des Befehls ist identisch.

Sie können auch den Typ des Zeilenendes angeben, der auf den konvertierten Text angewendet wird. Dies ist besonders nützlich, wenn Sie auf die Datei auf einem anderen Betriebssystem wie Windows oder Mac zugreifen möchten. Verwenden Sie dazu das Flag "-eol" (das mittlere Zeichen in der Flagge ist ein Kleinbuchstabe "O", keine Null), gefolgt von einem Leerzeichen und dem Typ des Zeilenendes, das Sie verwenden möchten (" unix "," dos "oder" mac ").

HINWEIS: Wenn Sie keinen Dateinamen für die Textdatei angeben, verwendet pdftotext automatisch die Basis des PDF-Dateinamens und fügt die Erweiterung" .txt "hinzu. Zum Beispiel wird "file.pdf" in "file.txt" konvertiert. Wenn die Textdatei als "-" angegeben ist, wird der konvertierte Text an stdout gesendet, dh der Text wird im Terminal-Fenster angezeigt und nicht in einer Datei gespeichert.

Um das Terminal-Fenster zu schließen, klicken Sie auf die Schaltfläche "X" in der linken oberen Ecke.

Geben Sie für weitere Informationen über den Befehl "Pdftotext" an der Eingabeaufforderung in einem Terminalfenster "man page pdftotext" ein.


So verwalten Sie die Benachrichtigungs- und Anrufschutzeinstellungen von Slack

So verwalten Sie die Benachrichtigungs- und Anrufschutzeinstellungen von Slack

Slack ist für viele Unternehmen, insbesondere für solche mit vielen Remote-Mitarbeitern, zu einem wichtigen Kommunikationswerkzeug geworden. Aber niemand will zu jeder vollen Stunde Pings bekommen. Hier bei How-To Geek lieben wir Slack, und wir haben darüber schon einmal geschrieben und geben euch ein paar exzellente Tipps, wie man ein Slack Power User werden kann und die besten Möglichkeiten, nach Dingen zu suchen, die du unbedingt finden musst.

(how-to)

So beschleunigen Sie einen Windows-Ordner, der sehr langsam geladen wird

So beschleunigen Sie einen Windows-Ordner, der sehr langsam geladen wird

Es gibt ein merkwürdiges Phänomen, auf das viele von Ihnen wahrscheinlich gestoßen sind: Selbst mit einem schnellen Computer gibt es einige Ordner, die Windows quälend lädt Langsamkeit. Glücklicherweise ist die Behebung einfach und die Ergebnisse sind unmittelbar. Warum Ihre Ordner so langsam laden Es gibt eine lange Windows Explorer-Funktion, die bis nach Windows Vista zurückreicht, wo Sie dem Windows Explorer mitteilen können, welche Art von Inhalt ist in bestimmten Ordnern, um zu optimieren, wie dieser Inhalt angezeigt wird.

(how-to)