Kategorien
(Free-) Software Batch (DOS) Portable Software Windows

Unter Windows einen Text aus geschütztem PDF oder Bild extrahieren

Die Aufgabe ist schnell gestellt: Aus einem vorliegendem, geschützten PDF einen Text übernehmen, obwohl das gemäß Schutz nicht erlaubt ist.

Vorweg: Der Schutz hat sicher seinen Sinn und Hintergrund, es ist also vorab zu klären, ob es auch wirklich ok ist, einen entsprechenden Text zu übernehmen.

Die üblichen Versuche, wie z.B. ein PDF ohne Schutz per Ausdruck zu erzeugen, oder die PDF über LibreOffice zu öffnen (was bei Kennwortschutz oft gut funktioniert) sind im vorliegenden Fall leider fehlgeschlagen.

Hier einige Tipps, wie es doch gelingen kann:

  1. Abtippen ⁠Zwinkern
  2. PDF mit alternativem SumatraPDF PDF-Reader öffnen.
    Diesen PDF-Reader nutze ich sehr gerne, weil er Freeware und portable nutzbar ist. Er beschränkt sich auf das Wesentliche und in diesem Fall hilfreich: Er ignoriert den Schutz zum Kopieren von PDF-Inhalten.
    Ebenfalls sehr hilfreich sind die Optionen, die man beim Start als Parameter mitgeben kann, weshalb er z.B. auch sehr gut geeignet ist, um aus Scripten etc. heraus PDFs im Hintergrund zu drucken usw.
  3. Text Extractor aus den MS ⁠Powertoys, welche ich generell empfehlenswert finde!
  4. OCR im Windows „Snipping Tool“ oder  „Bildanzeige“ (⁠Info)
  5. OCR in Windows OneNote
  6. Greenshot als (im Grunde) portables Screenshot-Tool, welches die unter Windows enthaltene OCR-Funktion via API nutzt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert