ArchivistaBox ist eine vorkonfigurierte Komplettlösung für Dokumentenmanagement (DMS), Enterprise Resource Planning (ERP) und zunehmend auch Multimedia-Anwendungen der Schweizer Firma Archivista GmbH des Entwicklers Urs Pfister.
ArchivistaBox Lothse
Gerade wurden mit ArchivistaBox 2025/VII und AVMultimedia sowohl Hard- als auch Software aktualisiert. Der ursprüngliche Hauptzweck der ArchivistaBox ist die Digitalisierung, Verschlagwortung und sichere Archivierung von Dokumenten quer über verschiedene Quellen. Seit dem Jahre 2020 können mit der ArchivistaBox auch audiovisuelle Dateien (Filme und Musik) webbasiert verwaltet werden. Da die Datenmenge gerade bei Filmen groß ist, erscheint mit der neuen Version 2025/VII die ArchivistaBox Lothse als neue Hardware-Box. Damit können bis zu zwölf 3,5″-Festplatten verwaltet werden. Dieses Volumen reicht aus, um bis zu eine Million DVDs oder VHS-Kassetten digital zu speichern.
Gegen den Bitrot
Die ArchivistaBox als auch die auf Devuan basierende Linux-Distribution AVMultimedia wurden in der Version 2025/VII für das Digitalisieren dieser Datenträger optimiert. Obwohl das Thema DVD/VHS veraltet erscheint, gibt es in Archiven wie Bibliotheken immer noch beträchtliche Mengen an Datenträgern, die durch Bitrot dem täglichen Zerfall ausgeliefert sind. Sämtliche Programme, um DVDs wie VHS-Kassetten zu digitalisieren, befinden sich auf der neuen Version 2025/VII. Für DVDs stehen neu die Tools sup2srt sowie vobsub2srt zur Verfügung, mit denen Bitmap-basierte Untertitel mit Spracherkennung ins moderne Web-Format (SRT/VTT) überführt werden können.
Digitalisieren lassen
Wer sich nicht zutraut, die eigenen Datenträger zu digitalisieren, kann bis zum 31. Oktober 2025 eine ArchivistaBox erwerben, seine Datenträger zur Digitalisierung an die Firma Archivista GmbH senden und erhält dafür im Wert der erworbenen ArchivistaBox digitalisierte DVDs und/oder VHS-Kassetten. Es werden nur DVDs und VHS-Bänder digitalisiert, die nicht mehr im Handel erhältlich sind.
Pfister, der auch das Filmarchiv moviebox.ch aufgebaut hat, betont, dass es auch unter Linux nicht gerade einfach ist, alte Datenträger zu digitalisieren. Das liegt daran, dass selbst unter Linux die nötigen Programme etwa für DVD-Untertitel in keiner Linux-Distribution enthalten sind.

> Soweit ich die Erfahrung gemacht habe, kann ich zwar mit ffmpeg entscheiden,
> welche der Untertitel ich “mitnehmen” möchte, aber diese verbleiben im Bitmap-Format.
Das stimmt so pauschal nicht. Du kannst auch mit ffmpeg UT (a) als eigenständige Textspur einbetten oder sie (b) “einbrennen”.
Videos mit (a) UT: UT lassen sich wieder als Text extrahieren.
Videos mit (b) UT: Keine Extraktion möglich.
Erstellen von (a):
ffmpeg -i video.mp4 -i untertitel.srt -c copy -c:s mov_text -metadata:s:s:0 language=de output.mp4
Extraktion:
ffmpeg -i output.mp4 -map 0:s:0 untertitel_extrahiert.srt
Dass Abspielprogramme (egal welche) Probleme mit “bildbasierten” UT haben, kann ich mir eigentlich nicht vorstellen. Für die Player ist jeder Frame inkl. Untertitel ein Bild. Deshalb nennt man’s ja auch “eingebrannt”.
Und zu deiner Frage nach mpv unter Windows: Ja, gibt’s. Bitte hier entlang =>
https://mpv.io/installation/
Vielen Dank für den Link, ich habe damals nicht kapiert, dass ich einfach die beiden passenden Dateien hätte nehmen müssen. Danke.
Betr. den Untertiteln. Du sagst ja selber “stimmt so pauschal” nicht. Deine Variante bedingt, dass ich eine bereits besehende Untertitel-Datei aus anderer Quelle verwende (für viele Filme gibt es solche Dateien). Nur hat dieses Vorgehen auch Nachteile.
1) Du musst sicherstellen, dass die gefundene Untertitel-Datei passt bzw. die Untertitel-Datei passend machen (hier kann ich mein Programm subtitleadjust) sehr empfehlen und 2) gibt es von vielen (nicht so bekannten) DVD-Titeln diese Datei gerade nicht.
Natürlich können die Untertitel “zur” Not in den Film “gebrannt” werden, nur ist dann der Film selber “verbrannt”. Der Umweg über ‘sup2srt’ bzw ‘vobsub2srt’ hat den Vorteil, dass ich danach srf/vtt-Untertitel den MP4-Dateien zufügen kann, die optional an/abschaltbar sind und die zu 100% zeitlich stimmen. Nach meiner Erfahrung funktioniert gerade dieser Weg sehr gut. Einzig ein paar Leerzeichen-Fehler kann es geben, dies bei Wörtern, die bei der OCR-Erkennung nicht im Wörterbuch vorkommen. Hier kriegt Tesseract manchmal die Worttrennung nicht sauber hin.
Ferner, und dies möchte ich jetzt noch aus der Perspektive der Langzeitarchivierung anführen, die generierten Text-Untertitel (srt/vtt) bieten sich perfekt dazu an, sie für den Volltext bei der Recherche “mitzusichern”, weil ich damit quasi die “Tonspur” mitkriege, ohne mit Spracherkennung nachhelfen zu müssen.
Bei meinen Experimenten mit Untertitelspur kam es immer wieder vor, dass Text und Bild auseinanderlaufen. Versatz (zur früh/zu spät) lässt sich mit diversen Tools leicht korrigieren. Aber wenn die Videospur z.B. wegen variabler Video-Bitrate quasi eiert, wird’s schwierig. In diesem Fall müsste man alle Timestamps nachjustieren.
Gut, bin ich nicht der einzige, der sich damit abmüht. Ich kann mit subtiteadjust die Untertitel aber recht einfach “verschieben”:
substiteadjust in.srt out.srt +00:00:03.5 (3.5 Sekunden nach hinten)
substiteadjust in.srt out.srt -00:01:10 (1 Min 10 Sekunden nach vorne)
substiteadjust in.srt out.srt *1.0423 (entsprechend schneller)
substiteadjust in.srt out.srt *0.997 (entsprechend langsamer)
Ausserdem werden alle doppelten Einträge entfernt und es wird auch eine txt-Datei (ohne Formatierungen) erstellt. Damit kann ziemlich viel justiert werden. Einzig wenn ein Film komplett unterschiedliche Länge (anderer Schnitt) hat, dann “versagt” mein Teil dann auch.
Hallo Urs (wenn du das bist),
wo finde ich als Nicht-AVMultimedia-User substiteadjust? Ich vermute, das hast du selber entwickelt?
Spannendes Thema!
Viele Grüße aus/bei Berlin
pit
Sorry, war in den Ferien. Ja, subtitleadjust hab ich entwickelt (weil ich nichts gefunden habe, das für mich passte). Es ist nicht 100% perfekt, aber es hilft mir fast jeden Tag und ist doch recht effizient, wenn es darum geht, Untertitel “passgenau” zu kriegen.
Einzig bei vtt/srt-Dateien, die umfangreiche Formatierungen enthalten, hier arbeitet es unter Umständen nicht korrekt (daher nicht 100% perfekt). Fragt sich in solchen Fällen aber auch, wieviel CSS-Zeugs ich in der “archivierten” MP4-Datei haben möchte.
Wie Du richtig annimmst, findet sich subtitleadjust auf meiner AVMultimedia-ISO (dort wäre es unter /home/cvs/archivista/jobs).
Ich habe es vorhin noch auf auf archivista.ch hochgeladen:
archivista.ch/cms/wp-content/uploads/2025/08/subtitleadjust.zip
Beachte aber, dass ich diese Datei bei Änderungen nicht “pflege”, die aktuelle Version findet sich von daher immer auf der letzten AVMultimedia-Version.
Ansonsten sind es ca. 250 Zeilen Perl-Code. Abhängigkeiten gibt es keine (wir arbeiten ja nur mit Text-Dateien) und es dürfte wohl auch unter jeder Umgebung laufen, wo Perl vorhanden ist.
Angefügt sei noch, Lizenz ist GPLv2 (entsprechend der Lizenz für AVMultimedia).
Ich arbeite mit dem Beta Programm makemkv unter Linux. Damit habe ich alle meine alten DVD Backupen können. Neue 30 Tage Beta-Keys erhält man immmer im [Forum-makemkv vom Entwickler](https://forum.makemkv.com/forum/viewtopic.php?f=5&t=1053). Sofern die 30 Tage abgelaufen sind einfach snap Software entfernen neu installieren und den selben Beta-Key eingeben und es kann weiter gehen. Daher verstehe ich den Sinn des Beta-Keys nicht, aber egal Snap world.
Diese Software bietet es Blue-Ray und DVDs in mkv Format zu bringen. Das beste an dieser Software ist, man kann sich alle Untertitel auswählen die man haben möchte. Zum Beispiel nur English und Deutsch. Somit spart man Speicherplatz, weil die Sprachen und Untertitel von Türkisch, Spanisch, Portugiesisch usw. nicht mehr bei sind. Kopiergeschütze Discs werden nicht gelesen, also ist man da auf der sicheren Seite – Es waren bei mir nur 2 DVDs die es nicht als Backup geschafft haben – Könnte aber auch sein, da diese schon sehr zerkratzt waren.
Snap Installieren:
snap install makemkv
Snap Deinstallieren:
snap remove makemkv
Es gibt auch ein flatpak:
[flatpak install com.makemkv.MakeMKV](https://flathub.org/de/apps/com.makemkv.MakeMKV)
Mit ffmpeg kann man dann noch alle Untertitel extrahieren, wenn man möchte srt,sub-Formate.
Einfach Lieblings Suchmaschine anwerfen oder eine Lieblings LLM – Model Fragen, wie man das macht.
Ich mag mich irren, aber hat makemkv eben nicht genau den Vorteil, den Kopierschutz zu umgehen? Eigentlich hab ich mir genau deswegen vor Jahren einen Key zugelegt, der natürlich auch für die Linux-Version gilt. Vorher hab ich entweder mit dvd::rip meine Sammlung auf das NAS gepackt (mit den passenden libs für den Pseudo-Kopierschutz der DVDs) oder mit CloneDVD unter Windows. Jetzt nutze ich eben makemkv, anschliessend Handbrake, auch für Bluray-Discs.
Und bisher konnte ich alles rippen – bis auf die DVDs von Monty Python Flying Circus. Da steigt jedes von mir bisher verwendete Programm sauber aus, obwohl die DVDs problemlos liefen.
Und ich habe mittlerweile festgestellt, dass kodi einiges älteres Zeugs nicht mehr mag, das noch mit dvd::rip erzeugt wurde. Teilweise hab ich schon mit makemkv/handbrake nachgebessert, was auch die Qualität steigert. Da werd ich noch einige Wintermonate nachbessern müssen, um zumindest die wichtigen Sache nachzuziehen (insbesondere meine Classic-Doctor-Who-Sammlung 😉 ).
Programme (MakeMKV und HandBrake), die ich kenne bzw. getestet habe, “entfernen” den Kopierschutz. Wobei “Schutz” etwas “übertrieben” ist. Wer z.B. mit VLC DVDs abspielt, erhält (sofern nicht libdvd-pkg installiert ist) einfach einen Film, bei dem das Bild verruckelt bzw. irgendwie “zertrümmert” abgespielt wird.
Wichtig zu wissen bei MakeMKV ist, dass ganz kleine Videos manchmal nicht erfasst werden, sie gehen ganz einfach verloren. Hier hilft nur der Umweg über VLC, dort können die kleinen “Schippsel” dann beim Abspielen vor dem Verlust “bewahrt” werden.
Die einzige Variante, eine DVD integral zu “retten”, besteht darin, sie 1:1 zu kopieren:
dd if=/dev/sr0 of=meinedvd.iso bs=64M
So erstellte Kopien “tasten” den “Kopierschutz” gar nicht erst an. Die ISO-Dateien können anschliessend aber sowohl mit VLC abgespielt als auch mit MakeMKV und/oder HandBrake ins MP4-Format transferriert werden.
Betr. der Qualität der Ergebnisse ist zentral, dass der “Zeilensprung” (auf den meisten älteren DVDs) ausgemerzt wird. Dieser beruht daher, dass früher beim Röhren-Fernsehen nur jeweils jede zweite “Zeile” im Alternativ-Modus abgespielt wurde. Stichwort PAL (Phase Alternating Line). . Gemäss Wikipedia soll der Entwickler den Namen PAL gewählt haben, weil er argumentierte “Ein Bruch-System wäre wohl schwer verkäuflich gewesen.“
Die entsprechende Option bei ffmpeg lautet “-vf yadif”. Für das optimale Ergebnis habe ich vor einigen Jahren das Programm mkv2mp4.pl entwickelt. Es findet sich auf jeder AVMultimedia-Distribution. Abhängigkeiten (ausser ffmpeg) gibt es keine.
Soweit ich die Erfahrung gemacht habe, kann ich zwar mit ffmpeg entscheiden, welche der Untertitel ich “mitnehmen” möchte, aber diese verbleiben im Bitmap-Format. So generierte MP4-Dateien lassen sich dann zwar korrekt mit den Untertiteln abspielen, doch verbleiben bildbasierte Untertitel. Diese wiederum lassen sich von den in Web-Browsers integrierten Playern i.d.R. nicht abspielen.
Selbst VLC scheint in der Version 3.x (mit 2.x konnte ich es nicht feststellen) beim Abspielen fast immer Probleme mit den bildbasierten Untertiteln zu haben. Das Problem konnte/musste ich unter Linux (gut, ich hab es nur unter AVMultimedia getestet) als auch Windows feststellen. Dabei scheint es eher ein Ressourcen-Problem zu sein. Auf der virtuellen Windows-Instanz konnte ich es sehr gut erkennen, bei einem Freund (der “leider” nur Windows nutzt) war es aber nativ auch entsprechend festzustellen.
Der MPV-Player (den ich an sich immer nutze) kennt dieses Problem zum Glück nicht. By the way (Frage mag auf einer Linux-Seite etwas “gewagt” sein): Gibt es für Windows eine einfache Möglichkeit, MPV zu installieren?
Um “moderne” textbasierte Untertitel zu erstellen, sind Tools wie ‘sup2srt’ (BlueRay) oder ‘vobsub2srt’ notwendig. Damit werden die bildbasierten Untertitel mit Texterkennung (tesseract) in textbasierte Untertitel-Dateien umgewandelt. Und genau diese gibt es neu bei AVMultimedia 2025/VII. Aber wie gesagt, sollte es auch mit ffmpeg gehen, dann bin ich gerne um den entsprechenden Hinweis dankbar.