digiKam 7.0.0 verbessert Gesichtserkennung

Quelle: digikam.org

Die Entwickler der Qt-basierten Fotoverwaltung digiKam haben sich Zeit gelassen mit der Veröffentlichung der stabilen Version von digiKam 7.0.0. Vor rund einem Jahr begann die Entwicklung, erste Beta erschien bereits kurz vor Weihnachten.

Ein Jahr Entwicklung

Jetzt wurde die stabile Version digiKam 7.0.0 freigegeben, die einige wichtige neue Funktionen mitbringt. Zudem wurden über 750 Fehler beseitigt. Bereits seit einigen Jahren bietet digiKam eine Funktion, die sich als Opt-in der Erkennung von Gesichtern auf Fotos widmet.

Veraltete Algorithmen

Die im Hintergrund verwendeten Algorithmen waren veraltet und seit digiKam 2.0.0 unverändert. Sie waren für die aktuelle Version nicht leistungsfähig genug, um den Arbeitsablauf der Verwaltung der Gesichtserkennung zu automatisieren.

Zum GSoC 2019 neu geschrieben

Beim Google Summer of Code 2017 arbeitete der Student Yingjie Liu an der Integration Neuraler Netzwerke in die Gesichtserkennung. Die Ergebnisse, basierend auf der Dlib-Bibliothek, waren eher experimenteller Natur und erreichte nicht die nötige Geschwindigkeit. Beim GSoC 2019 wurde der Code von Thanh Trung Dinh komplett neugeschrieben.

Deep Learning

Ziel des Projekts war es, all die alten Ideen hinter sich zu lassen und die Erkennungs-Engines auf modernere Ansätze des [wiki title=”Deep_Learning”]Deep Learning[/wiki] umzustellen. Der neue Code in digiKam 7.0.0, der auf neueren Deep-NeuralNetwork-Funktionen aus der [wiki title=”OpenCV”]OpenCV-Bibliothek[/wiki] basiert, verwendet neuronale Netzwerke mit zuvor erlernten Datenmodellen. Die Erkennungsrate konnte auf 97 Prozent angehoben werden und schließt nun auch die Erkennung von Tieren ein.

Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

Speicherlecks geschlossen

Zudem gelang es, schwerwiegende Speicherlecks in der Gesichtserkennungs-Pipeline zu stopfen. Das nahm laut der Ankündigung einige Monate in Anspruch, da die Fehler schwer zu reproduzieren waren. wie dieser Bugreport belegt. Die Lösung des Problems ermöglichte es, eine lange Liste älterer Bugs im Zusammenhang mit der Gesichtserkennung zu schließen.

Daten von über 1.100 RAW-Formaten

Weitere Änderungen betreffen die Unterstützung für noch mehr RAW-Dateien von zusätzlichen 40 Digitalkameras, unter anderem Canon CR3 und Sony A7R4, sowie verbesserte Unterstützung des [wiki title=”High_Efficiency_Image_File_Format”]HEIF-Bilddateiformats[/wiki], Verbesserungen am Flatpak-Build, ein neues Photomosaik-Tool und viele andere Änderungen. Mit letzterem soll sich ein Bild als Mosaik aus vielen anderen Bildern nachbilden lassen.

digiKam 7.0.0 kann von der KDE-Webseite für Linux, macOS und Windows heruntergeladen werden. Zudem steht auf Flathub ein Flatpak bereit, dass allerdings noch RC-Status hat. Völlig ohne Installation kommt das AppImage aus.

Teilt den Beitrag, falls ihr mögt

10 Kommentare

  1. Hallo, ich möchte, dass das erkannte Gesicht (max, Müller) automatisch in die Dateiinfo geschrieben wird und das Bild anschließend in Max Müller umbenannt wird. Hat hier jemand eine Idee, wie das gehen könnte?

    0
    1. Das ginge z.B. indem du die Erkennung laufen lässt, alle Bilder mit Max Müller in einem Ordner exportierst und dann anschließend umbenennst (zur Not per Skript, falls dein Dateibrowser das nicht vernünftig für viele Dateien auf einmal kann).

      0
  2. Ich muss ehrlich sagen, dass ich noch nicht so überzeugt bin. Ich habe einen ganzen Haufen Bilder von den gleichen Personen und ich habe diese schon X-Fach bestätigt bzw. Unbekannten Gesichtern zugewiesen und sie werden immer noch falsch erkannt oder anderen Personen zugewiesen.

    1
      1. Nein, das halbe KDE muss man nicht installieren, es reicht durchaus das (gefühlt) ganze 😉

        423M   /var/lib/flatpak/app
        104K   /var/lib/flatpak/exports
        1,4G   /var/lib/flatpak/repo
        46M    /var/lib/flatpak/runtime
        
        0
          1. Gut, da ist es mit knapp 300 MB dann wirklich nur halb 😉
            Aber heutzutage sind 300 MB für eine App ja nix mehr, dank Elektron und so – wobei digikam hier vielleicht etwas Sinnvolleres als Elektron einpackt … nur erfahre ich das nicht mit dem „.meta4“-Paket, da bei mir „Syntaxfehler“, erst das manuell heruntergeladene Appimage lässt sich ausführen.
            Aber sei’s drum – ich verwende eh lieber die Version der Distri.

            0
    1. Diese Annahmen, dass KDE Programme viel Zeug mit sich ziehen, sind spätestens seit der 5er Version von KDE auch überhaupt nicht mehr zeitgemäß. KDE hat hart daran gearbeitet alle möglichen Abhängigkeiten zu minimieren. Anwendungen wie digikam (oder auch KDEnlive) haben kaum noch Abhängigkeiten zum KDE Desktop.

      2
  3. Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

    Das hört sich alles sehr interessant an, werde ich mal ausprobieren. Danke für den Artikel!

    0

Kommentar hinterlassen