de.phhsnews.com


de.phhsnews.com / So extrahieren und speichern Sie Bilder aus einer PDF-Datei in Linux

So extrahieren und speichern Sie Bilder aus einer PDF-Datei in Linux


Sie können PDF-Dateien unter Verwendung des Befehlszeilenprogramms "pdftotext" problemlos in editierbaren Text unter Linux konvertieren. Wenn jedoch Bilder in der ursprünglichen PDF-Datei vorhanden sind, werden sie nicht extrahiert. Um Bilder aus einer PDF-Datei zu extrahieren, können Sie ein anderes Befehlszeilentool mit dem Namen "pdfimages" verwenden.

HINWEIS: Wenn wir in diesem Artikel etwas eingeben und den Text in Anführungszeichen setzen, geben Sie die Anführungszeichen NICHT ein, es sei denn wir

Das Werkzeug "pdfimages" ist Teil des Pakets poppler-utils. Sie können prüfen, ob es auf Ihrem System installiert ist und es bei Bedarf mit den in diesem Artikel beschriebenen Schritten installieren.

Um Bilder aus einer PDF-Datei mit pdfimages zu extrahieren, drücken Sie "Strg + Alt + T", um ein Terminalfenster zu öffnen . Geben Sie an der Eingabeaufforderung den folgenden Befehl ein:

pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumente / ExtractedImages / image

VERWANDT: Konvertieren einer PDF-Datei in bearbeitbaren Text mit die Befehlszeile in Linux

Hinweis: ersetzen Sie für alle Befehle, die in diesem Artikel angezeigt werden, den ersten Pfad in dem Befehl und dem PDF-Dateiname zu dem Pfad und dem Dateinamen für Ihre ursprüngliche PDF-Datei. Der zweite Pfad sollte der Pfad zum Stammordner sein, in dem die extrahierten Bilder gespeichert werden sollen. Das Wort "image" am Ende des zweiten Pfads steht für alles, was Sie Ihrem Dateinamen vorsetzen möchten. Die Dateinamen der Bilder werden automatisch nummeriert (000, 001, 002, 003 usw.). Wenn Sie am Anfang jedes Bildes Text hinzufügen möchten, geben Sie diesen Text am Ende des zweiten Pfads ein. In unserem Beispiel beginnt jeder Bilddateiname mit "image", z. B. image-001.ppm, image-002.ppm usw. Zwischen dem angegebenen Text und der Nummer wird ein Bindestrich eingefügt.

Das Standardbildformat ist PPM (Portable Pixmap) für nicht monochrome Bilder oder PBM (Portable Bitmap) für monochrome Bilder. Diese Formate sind so konzipiert, dass sie einfach zwischen Plattformen ausgetauscht werden können.

HINWEIS: Sie können für jedes Bild in Ihrer PDF-Datei zwei Bilddateien erhalten. Das zweite Bild für jedes Bild ist leer, so dass Sie erkennen können, welche Bilder die Bilder aus der Datei enthalten, anhand der Miniaturansicht der Datei im Datei-Manager.

Um .jpg Bilddateien zu erstellen, fügen Sie " -j "Option für den Befehl, wie unten gezeigt.

pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumente / ExtractedImages / image

HINWEIS: Sie können auch die Standardausgabe ändern PNG mit der Option "-png" oder TIFF mit der Option "-tiff".

Die Hauptbilddatei für jedes Bild wird als JPG-Datei gespeichert. Das zweite leere Bild ist immer noch eine .ppm- oder .pbm-Datei.

Wenn Sie nur Bilder auf und nach einer bestimmten Seite konvertieren möchten, verwenden Sie die Option "-f" mit einer Zahl, um die erste zu konvertierende Seite anzugeben Im folgenden Beispiel wird der Befehl angezeigt.

pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumente / ExtractedImages / image

HINWEIS: Wir haben die Option "-j" mit kombiniert die Option "-f", so dass wir .jpg Bilder erhalten und dasselbe mit der unten genannten Option "-l" gemacht haben.

Um alle Bilder vor und auf einer bestimmten Seite zu konvertieren, verwenden Sie "-l" ( eine Kleinbuchstabe "L", nicht die Zahl "1") Option mit einer Zahl, um die letzte Seite anzuzeigen, um zu konvertieren, wie unten gezeigt.

pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

HINWEIS: Sie können die Optionen "-f" und "-l" zusammen verwenden, um Bilder in einem bestimmten Seitenbereich in der Mitte des Dokuments zu konvertieren.

Wenn es ein Besitzer Passwort auf der PDF-Datei, uns e die Option "-opw" und das Passwort in Anführungszeichen, wie unten gezeigt. Wenn das Kennwort für die PDF-Datei ein Benutzerkennwort ist, verwenden Sie die Option "-upw" anstelle des Kennworts.

HINWEIS: Stellen Sie sicher, dass in Ihrem Befehl einfache Anführungszeichen stehen.

pdfimages -opw 'Kennwort '-j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumente / ExtractedImages / image

Um weitere Informationen über den Befehl pdfimages zu erhalten, geben Sie "pdfimages" an der Eingabeaufforderung in einem Terminal-Fenster ein und drücken Sie "Enter" ". Die Befehlsverwendung wird mit einer Liste von Optionen angezeigt, die für den Befehl verfügbar sind.


5 Photo Recovery Tools getestet und überprüft

5 Photo Recovery Tools getestet und überprüft

Hoppla! Sie haben gerade Ihre Digitalkamera-Speicherkarte aus Versehen formatiert und jetzt sind alle Ihre Bilder verschwunden! Oder wurde Ihre Karte beschädigt und keines der Bilder kann mehr gelesen werden? Leider ist das Verlieren oder Löschen von Bildern von einer Speicherkarte ein sehr häufiges Problem, einfach weil die Leute einfach die falschen Tasten an der Kamera drücken!Zum

(How-to)

So zeigen Sie Zeilen- und Spaltenüberschriften in Excel an und blenden

So zeigen Sie Zeilen- und Spaltenüberschriften in Excel an und blenden

Die Überschriften (nummerierte Zeilen und beschriftete Spalten) in Excel-Arbeitsblättern erleichtern das Anzeigen und Referenzieren Ihrer Daten. Es kann jedoch vorkommen, dass die Header ablenken und nicht angezeigt werden sollen. Sie sind einfach zu verstecken und wir zeigen Ihnen, wie das geht. Öffnen Sie die Excel-Arbeitsmappe, die das Arbeitsblatt enthält, auf dem Sie die Kopfzeilen ausblenden möchten.

(how-to)