digiKam 7.0.0 verbessert Gesichtserkennung

Die Entwickler der Qt-basierten Fotoverwaltung digiKam haben sich Zeit gelassen mit der Veröffentlichung der stabilen Version von digiKam 7.0.0. Vor rund einem Jahr begann die Entwicklung, erste Beta erschien bereits kurz vor Weihnachten.

Ein Jahr Entwicklung

Jetzt wurde die stabile Version digiKam 7.0.0 freigegeben, die einige wichtige neue Funktionen mitbringt. Zudem wurden über 750 Fehler beseitigt. Bereits seit einigen Jahren bietet digiKam eine Funktion, die sich als Opt-in der Erkennung von Gesichtern auf Fotos widmet.

Veraltete Algorithmen

Die im Hintergrund verwendeten Algorithmen waren veraltet und seit digiKam 2.0.0 unverändert. Sie waren für die aktuelle Version nicht leistungsfähig genug, um den Arbeitsablauf der Verwaltung der Gesichtserkennung zu automatisieren.

Zum GSoC 2019 neu geschrieben

Beim Google Summer of Code 2017 arbeitete der Student Yingjie Liu an der Integration Neuraler Netzwerke in die Gesichtserkennung. Die Ergebnisse, basierend auf der Dlib-Bibliothek, waren eher experimenteller Natur und erreichte nicht die nötige Geschwindigkeit. Beim GSoC 2019 wurde der Code von Thanh Trung Dinh komplett neugeschrieben.

Deep Learning

Ziel des Projekts war es, all die alten Ideen hinter sich zu lassen und die Erkennungs-Engines auf modernere Ansätze des [wiki title=”Deep_Learning”]Deep Learning[/wiki] umzustellen. Der neue Code in digiKam 7.0.0, der auf neueren Deep-NeuralNetwork-Funktionen aus der [wiki title=”OpenCV”]OpenCV-Bibliothek[/wiki] basiert, verwendet neuronale Netzwerke mit zuvor erlernten Datenmodellen. Die Erkennungsrate konnte auf 97 Prozent angehoben werden und schließt nun auch die Erkennung von Tieren ein.

Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

Speicherlecks geschlossen

Zudem gelang es, schwerwiegende Speicherlecks in der Gesichtserkennungs-Pipeline zu stopfen. Das nahm laut der Ankündigung einige Monate in Anspruch, da die Fehler schwer zu reproduzieren waren. wie dieser Bugreport belegt. Die Lösung des Problems ermöglichte es, eine lange Liste älterer Bugs im Zusammenhang mit der Gesichtserkennung zu schließen.

Daten von über 1.100 RAW-Formaten

Weitere Änderungen betreffen die Unterstützung für noch mehr RAW-Dateien von zusätzlichen 40 Digitalkameras, unter anderem Canon CR3 und Sony A7R4, sowie verbesserte Unterstützung des [wiki title=”High_Efficiency_Image_File_Format”]HEIF-Bilddateiformats[/wiki], Verbesserungen am Flatpak-Build, ein neues Photomosaik-Tool und viele andere Änderungen. Mit letzterem soll sich ein Bild als Mosaik aus vielen anderen Bildern nachbilden lassen.

digiKam 7.0.0 kann von der KDE-Webseite für Linux, macOS und Windows heruntergeladen werden. Zudem steht auf Flathub ein Flatpak bereit, dass allerdings noch RC-Status hat. Völlig ohne Installation kommt das AppImage aus.

10 Kommentare

micha sagt:

18. November 2020 um 0:12 Uhr

Hallo, ich möchte, dass das erkannte Gesicht (max, Müller) automatisch in die Dateiinfo geschrieben wird und das Bild anschließend in Max Müller umbenannt wird. Hat hier jemand eine Idee, wie das gehen könnte?

0

Zum Antworten anmelden
1. Matthias Bendewald sagt:
  
  16. März 2021 um 16:06 Uhr
  
  Das ginge z.B. indem du die Erkennung laufen lässt, alle Bilder mit Max Müller in einem Ordner exportierst und dann anschließend umbenennst (zur Not per Skript, falls dein Dateibrowser das nicht vernünftig für viele Dateien auf einmal kann).
  
  0
  
  Zum Antworten anmelden
Nils sagt:

28. Juli 2020 um 20:29 Uhr

Ich muss ehrlich sagen, dass ich noch nicht so überzeugt bin. Ich habe einen ganzen Haufen Bilder von den gleichen Personen und ich habe diese schon X-Fach bestätigt bzw. Unbekannten Gesichtern zugewiesen und sie werden immer noch falsch erkannt oder anderen Personen zugewiesen.

1

Zum Antworten anmelden
harley-peter sagt:

26. Juli 2020 um 13:46 Uhr

Gibt es so eine Gesichtserkennung auch für Xfce? Ich möchte mir nicht für dieses eine Programm das halbe KDE installlieren.

0

Zum Antworten anmelden
1. adminx sagt:
  
  26. Juli 2020 um 13:52 Uhr
  
  Musst du ja nicht. es gibt Flatpak und AppImage.
  
  0
  
  Zum Antworten anmelden
  1. kamome sagt:
    
    26. Juli 2020 um 21:58 Uhr
    Nein, das halbe KDE muss man nicht installieren, es reicht durchaus das (gefühlt) ganze 😉
    
    423M /var/lib/flatpak/app 104K /var/lib/flatpak/exports 1,4G /var/lib/flatpak/repo 46M /var/lib/flatpak/runtime
    
    0
    Zum Antworten anmelden
    1. adminx sagt:
      
      26. Juli 2020 um 22:52 Uhr
      
      Aber nicht beim AppImage.
      
      0
      
      Zum Antworten anmelden
      1. kamome sagt:
        
        27. Juli 2020 um 1:32 Uhr
        
        Gut, da ist es mit knapp 300 MB dann wirklich nur halb 😉
        Aber heutzutage sind 300 MB für eine App ja nix mehr, dank Elektron und so – wobei digikam hier vielleicht etwas Sinnvolleres als Elektron einpackt … nur erfahre ich das nicht mit dem „.meta4“-Paket, da bei mir „Syntaxfehler“, erst das manuell heruntergeladene Appimage lässt sich ausführen.
        Aber sei’s drum – ich verwende eh lieber die Version der Distri.
        
        0
        
        Zum Antworten anmelden
2. tuxflo sagt:
  
  27. Juli 2020 um 15:00 Uhr
  
  Diese Annahmen, dass KDE Programme viel Zeug mit sich ziehen, sind spätestens seit der 5er Version von KDE auch überhaupt nicht mehr zeitgemäß. KDE hat hart daran gearbeitet alle möglichen Abhängigkeiten zu minimieren. Anwendungen wie digikam (oder auch KDEnlive) haben kaum noch Abhängigkeiten zum KDE Desktop.
  
  2
  
  Zum Antworten anmelden
Kaja sagt:

24. Juli 2020 um 19:32 Uhr

Das verwendete neuronale Netzmodell erkennt auch unscharfe, und verdeckte Gesichter, Profile von Gesichtern, gedruckte Gesichter, abgewandte Gesichter und Teilgesichter, erfordert aber eine Lernphase.

Das hört sich alles sehr interessant an, werde ich mal ausprobieren. Danke für den Artikel!

0

Zum Antworten anmelden

Kommentar hinterlassen Antwort abbrechen

Du musst angemeldet sein, um einen Kommentar abzugeben.