Ende letzten Jahres berichteten wir über Mozillas Projekt Llamafile, dass es vereinfachen soll, einen Open Source-KI-Stack aufzusetzen. Dazu fasst es die gesamte Komplexität eines vollständigen LLM-Chatbots in einer einzigen Datei zusammen, die, einmal kompiliert, auf mehreren Plattformen lauffähig ist.
Whisperfile
Federführend ist hier Mozilla Ocho, eine Gruppe, die für Innovation und Experimente zuständig ist. Die neueste Entwicklung hört auf den Namen Whisperfile und baut auf Whisper auf, einem maschinellen Lernmodell von OpenAI zur Spracherkennung und -transkription. Die Entwickler bei Mozilla verpacken das Sprachmodell in ausführbare Pakete, die es vereinfachen, das Modell unter Linux, macOS, Windows, FreeBSD, OpenBSD und NetBSD für AMD64 und ARM64 zu verwenden.
WAV bevorzugt
Whisperfile wandelt Sprache von Audio in Text. Das Modell, das in drei Größen verfügbar ist, unterstützt WAV, MP3, FLAC und Ogg Vorbis Theora. Bevorzugt wird WAV mit 16khz, andere Formate werden umgewandelt. Neben der Wandlung von Audio in Text kann das Modell vor der Umwandlung in Text nicht-englisches Audio nach Englisch übersetzen.

Wenn Euch das interessiert, schaut Euch auch mal SpeechNote an: https://github.com/mkiol/dsnote
Viele werden sagen, das ist toll, denn schon bald klappt das mit dem Babelfisch. Den steckt man sich ins Ohr und kann jede Sprache verstehen. Aber wer denkt dabei an die vielen Übersetzer die die NSA entlassen wird?
> Babelfisch
… mehr und blutigere Kriege …
Die NSA Mitarbeiter braucht’s dann an der Front 🙂
Bis dahin wird Krieg auch nur noch mit KI geführt. Oder so…
Interessanter Gedanke, da wäre ja die Zivilbevölkerung unbehelligt davon, denn was will ein Computer mit Land oder dem Sturz einer Regierung?
Der Computer will gar nichts, auch mit KI nicht. Bedeutung haben Dinge nur für Lebewesen und die Zivilbevölkerung wird zwar nicht mehr zum Militär gezogen wie bei dem Kamikaze Friedrich II aber den Schaden trägt dennoch immer die Bevölkerung davon. Krieg spielen Eliten miteinander und es gibt dabei immer nur den gleichen Dummen egal wie es ausgeht.
Natürlich, solange der Mensch noch Eingaben macht. Ich meinte eher das Szenario eins weiter, wenn die Stromversorgung für die “Akteure” das zentrale Gut (Streitpunkt) ist … anyway, wahrscheinlich wären die Verlierer dennoch die gleichen.
Wieder eine wertvolle Info zu KI – wie man sich mit OpenSource Software mit dieser wichtigen Technolgie beschäftigen kann – ohne allzuviel dafür ausgeben zu müssen. Vielen Dank.