OCR mit Spectacle

KDE Screenshooter Spectacle lernt OCR

Text aus Bildern zu extrahieren, ist die Aufgabe von OCR (Optical Character Recognition). Unter Linux kommt hier vorwiegend das von HP entwickelte und von Google gepflegte, über 100 Sprachen unterstützende Open-Source-Tool Tesseract zum Einsatz.

Text aus Screenshots extrahieren

Um Text aus Screenshots der KDE-Anwendung Spectacle zu extrahieren, gibt es seit dem Frühjahr das externe Tool spectacle-ocr-screenshot, das den Screenshooter Spectacle mit dem OCR-Tool Tesseract und der Grafikanwendung ImageMagick verbindet. Über den neuen Menüpunkt Text extrahieren kann Spectacle demnächst markierten Text extrahieren und in die Zwischenablage kopieren. Das funktioniert unter X11 und Wayland.

Mit Plasma 6.6 ausgeliefert

Nate Graham kündigte letzte Woche in seiner Kolumne This Week in Plasma an, dass die Funktion direkt in Spectacle übernommen wurde. Die mit Plasma 6.6 im Februar 2026 auszuliefernde Version Spectacle 25.12.0 reagiert auf einen Bugreport aus dem Jahr 2022 und implementiert die OCR-Funktion direkt in der Anwendung.

Überdies können Screenshots mit Tools wie pdfgrep durchsucht werden. Mittlerweile arbeiten die Entwickler daran, die OCR-Funktionalität in eine Bibliothek zu überführen, um sie auch in anderen Anwendungen verfügbar zu machen.

Bild: This Week in Plasma

Teilt den Beitrag, falls ihr mögt

6 Kommentare

  1. OCR für Screenshots (im Gegensatz zu Scans etc.) ist ein bisschen traurig, weil die korrekten Informationen ja eigentlich im Computer vorhanden sind. Tatsächlich gibt es ja erstmal nur den Text, dann wird dieser gerendert, nur um dann wieder mühsam und fehleranfällig aus einer Rastergrafik extrahiert zu werden.
    Es wäre schön, wenn gleichzeitig zu dem Foto Machen über dem ausgewählten Bildschirmbereich “Text Markieren mit der Maus” ausgeführt würde oder so.

    0
    1. Ich mache öfters Screenshots von Webseiten oder auch Fotos von Texten auf meinem Smartphone. Meist möchte ich dann Textinformationen bewahren, die dann aber nur als Bilder vorliegen. Eine schnelle Transformation in Text wäre für mich Gold wert.

      0

Kommentar hinterlassen