Llamafile

Mozilla investiert weiter in lokale KI

Ende letzten Jahres berichteten wir über Mozillas Projekt Llamafile, dass es vereinfachen soll, einen Open Source-KI-Stack aufzusetzen. Dazu fasst es die gesamte Komplexität eines vollständigen LLM-Chatbots in einer einzigen Datei zusammen, die, einmal kompiliert, auf mehreren Plattformen lauffähig ist.

Whisperfile

Federführend ist hier Mozilla Ocho, eine Gruppe, die für Innovation und Experimente zuständig ist. Die neueste Entwicklung hört auf den Namen Whisperfile und baut auf Whisper auf, einem maschinellen Lernmodell von OpenAI zur Spracherkennung und -transkription. Die Entwickler bei Mozilla verpacken das Sprachmodell in ausführbare Pakete, die es vereinfachen, das Modell unter Linux, macOS, Windows, FreeBSD, OpenBSD und NetBSD für AMD64 und ARM64 zu verwenden.

WAV bevorzugt

Whisperfile wandelt Sprache von Audio in Text. Das Modell, das in drei Größen verfügbar ist, unterstützt WAV, MP3, FLAC und Ogg Vorbis Theora. Bevorzugt wird WAV mit 16khz, andere Formate werden umgewandelt. Neben der Wandlung von Audio in Text kann das Modell vor der Umwandlung in Text nicht-englisches Audio nach Englisch übersetzen.

Teilt den Beitrag, falls ihr mögt

Abonnieren
Benachrichtige mich bei
8 Kommentare
Most Voted
Newest Oldest
Inline Feedbacks
View all comments