digiKam zum Photo Management

Zum heutigen Digitalen Unabhängigkeitstag (DUT oder englisch DID) habe ich ein Tool ersetzt, das ich letzten Monat noch nicht im Auge hatte, nämlich Apple Photos. Zwar brauche ich den iCloud-Speicher weiterhin aus anderen Gründen, aber mit dem Umstieg meiner Backup-Lösung auf pCloud habe ich so viel zusätzlichen Cloud-Speicher gewonnen, dass ich meine Photo-Bibliothek auch bequem dorthin legen kann.

Mit Apple Photos als Software war ich noch nie so richtig zufrieden (vor Allem, weil ich immer noch Aperture nachtrauere), also habe ich mich mal umgesehen, was so an FOSS-Alternativen auf dem Markt ist und bin bei digiKam hängen geblieben. Das Tool liefert alles, was ich von einer Photo Management Suite so erwarte und ist vom Feature Set der Apple-Lösung mindestens ebenbürtig.

Die Gesichtserkennung funktioniert deutlich besser, jedenfalls was Menschen betrifft. Die Haustiererkennung ist bei Apple zwar auch nicht gerade prickelnd, bei digiKam liefert sie für meine Katzen aber gar keine brauchbaren Ergebnisse (nachdem ich einen Post darüber gesehen habe, dass es angeblich gehen soll, habe ich extra eine ganze Salve an Nahaufnahmen von den beiden geschossen und pro Katze 100 Gesichter manuell getaggt, aber es erkennt sie weiterhin nicht).

Das automatische Tagging von Bildinhalten geschieht bei digiKam über die Funktion „Auto-tag Scan“. Dabei kann man das verwendete KI-Modell auswählen. Nachdem das Standardmodell „EfficientNet B7“ keine für mich brauchbaren Ergebnisse geliefert hat, habe ich noch „YOLOv11 XLarge“ probiert und das findet deutlich mehr (inklusive Katzen, die ich so wenigstens manuell taggen kann).

Bonus

Daneben habe ich noch ein paar Tools teilweise ersetzt:

Pages und Keynote

Diese beiden Produkte aus Apples Office Suite nutze ich wenig und für die meisten Anwendungsfälle reicht mir pandoc vollkommen aus:

  • Da ich mit Pages hauptsächlich Briefe (oder Faxe im Briefformat) schreibe, kann ich diese genauso gut in Markdown schreiben und dann über ein pandoc Template in ein korrekt formatiertes pdf umwandeln (pandoc ${infile} --output=${outfile} --template pandoc-letter-din5008).
  • Präsentationen funktionieren für mich genauso gut in reveal.js. Hier muss man zwar anfangs ein bisschen am CSS rum fummeln, um das Styling hübsch zu machen, aber das lässt sich ja mit Templates lösen. Außerdem ist es eine kleine Umstellung, dass die nächste Folie sich standardmäßig nicht durch Linksklick auf die Aktuelle aufrufen lässt, sondern nur durch die Leertaste (oder Pfeiltasten, wenn man keine 2D-Präsentationen benutzt, oder aufpasst, die richtige zu nehmen). Das lässt sich natürlich in Javascript ändern, aber wenn ich präsentiere, habe ich meist ehh keine Maus dabei, insofern passt das für mich schon mit der Leertaste.

Safari

Ursprünglich hatte ich ja geschrieben, dass es keinen Sinn ergibt, den Browser zu wechseln, weil es auf iOS keine echten Alternativen gibt; inzwischen habe ich aber mehrere Seiten, die im Safari nicht richtig funktionieren. Daher probiere ich jetzt Waterfox, einen Privacy-fokussierten Fork von Firefox aus. Dort laufen alle meine Seiten, ich kann keinen erhöhten Ressourcenverbrauch erkennen, und als Bonus verzichtet er auch darauf, Liquid Glass umzusetzen. Aufgrund der Tab-Synchronisation bin ich mobil auf Firefox Mobile umgestiegen.

Negativ ist mir bisher nur aufgefallen, dass die Synchronisation von Tab Groups nicht wirklich unterstützt wird. Es wird nur die Information synchronisiert, welche Tabs auf welchem Gerät offen sind. Das reicht mir nicht:

  • Es gibt weder eine Möglichkeit, alle Tabs auf einmal zu öffnen, die auf einem anderen Gerät offen sind, noch führt das Schließen auf einem zum Schließen auf dem Anderen (das hätte ich unter dem Begriff Sync erwartet: Das beide Geräte in sync sind).
  • Wenn eine Tab Group offen ist (egal ob aus- oder eingeklappt), sind zwar die darin enthaltenen Tabs in der oben beschriebenen Synchronisation einthalten, die Gruppierung geht aber verloren.
  • Geschlossene Tab Groups werden gar nicht synchronisiert. Die sind aber in Safari gerade mein wesentlicher Anwendungsfall für Tab Groups: Nimm diese Tabs, die nur in einem spezifischen Kontext (für mich zum Beispiel eine Rollenspiel-Kampagne) relevant sind, und wenn ich in einem anderen Kontext unterwegs bin, schließe sie und leg sie weg. Wenn ich jetzt an irgend einem Gerät wieder den Kontext betrete, möchte ich die entsprechende Tab Group öffnen und darin weiter machen können. Das ist für mich kein Dealbreaker, weil ich tatsächlich meistens ohnehin am selben Gerät weiter arbeiten möchte, aber etwas nervig ist es schon.

Zu diesen Punkten gibt es bereits Mozilla-Ideas-Vorschläge (zu den ersten beiden und zum dritten Punkt), sodass ich hier auf Besserung hoffe, oder vielleicht finde ich ein Plugin, was das ermöglicht.

Fazit

Insgesamt bin ich mit der Umstellung ganz zufrieden. #DIDit. #DUTgemacht.