Question 1

Wird meine Audiodatei auf einen Server hochgeladen?

Accepted Answer

Die Transkription läuft 100% lokal in Ihrem Browser. Danach können Sie optional Audio und Transkript mit uns teilen (Einwilligungs-Checkbox), um den Dienst zu verbessern — vollständig freiwillig.

Question 2

Welche Audioformate werden unterstützt?

Accepted Answer

MP3, WAV, M4A, OGG, FLAC, WEBM, MP4, MOV und alle Formate, die Ihr Browser dekodieren kann.

Question 3

Wie lang darf meine Audiodatei sein?

Accepted Answer

Im Gratis-Modus bis zu 10 Minuten pro Datei. Für längere Aufnahmen unterstützt Premium bis zu 10 Stunden.

Question 4

Welche Sprachen werden unterstützt?

Accepted Answer

Das Whisper-Modell unterstützt 99 Sprachen: Deutsch, Englisch, Portugiesisch, Spanisch, Französisch, Japanisch, Arabisch und viele mehr.

Question 5

Muss ich etwas installieren?

Accepted Answer

Nein. Alles läuft direkt im Browser. Das KI-Modell (~40MB) wird einmalig heruntergeladen und bleibt im Cache.

Question 6

Wird die Transkription gespeichert?

Accepted Answer

Standardmäßig nein — das Ergebnis bleibt nur in Ihrem Browser. Wenn Sie die Einwilligungs-Checkbox markieren, werden Audio und Transkript an unsere Server gesendet und nach 7 Tagen gelöscht. Sie können die Einwilligung jederzeit widerrufen.

Question 7

Was ist der Unterschied zu Premium?

Accepted Answer

Der Gratis-Modus nutzt VoxScriber Nano (4-Bit-Quantisierung, q4) lokal: 10-Min.-Limit, ~85% Genauigkeit, keine Sprecher-Diarisierung, Zeitstempel nur auf Segment-Ebene (~30s). Premium nutzt Cloud-Modelle (AssemblyAI + Whisper Large float32): >95% Genauigkeit, Diarisierung bis 30 Sprecher, Zeitstempel pro Wort, Dateien bis 10h, MP4/MOV/MKV-Support und DOCX/PDF/JSON-Export. Geschwindigkeit: 1h Audio dauert ~20Min. auf Ihrer lokalen CPU vs. ~2Min. auf Premiums dedizierter GPU.

Question 8

Funktioniert es auf dem Handy?

Accepted Answer

Ja, aber die Leistung hängt vom Gerät ab. Auf Smartphones mit wenig RAM kann die Transkription langsamer sein.

Question 9

Ist es wirklich kostenlos?

Accepted Answer

Ja. Der Browser-Transkriptor ist wirklich kostenlos, ohne Testversion, ohne Wasserzeichen und ohne Anmeldung. Wir verdienen Geld mit den Premium-Cloud-Plänen, nicht mit dem kostenlosen Tool.

Question 10

Verlässt mein Audio mein Gerät?

Accepted Answer

Nein – die Transkription erfolgt lokal über WebAssembly. Die einzige Ausnahme ist, wenn Sie explizit das optionale Einverständniskästchen aktivieren, um eine Aufnahme mit uns zu teilen.

Question 11

Gibt es eine Dateigrößenbeschränkung?

Accepted Answer

Die praktische Grenze ist die Dauer (10 Minuten pro Datei) und der Arbeitsspeicher Ihres Geräts, nicht die Megabyte. Eine 10-minütige MP3-Datei ist typischerweise 10-20 MB groß und funktioniert auf den meisten Geräten einwandfrei.

Question 12

Wie lange dauert die Transkription?

Accepted Answer

Mit dem Nano-Modell rechnen Sie auf einem modernen Laptop mit etwa der 1- bis 2-fachen Audiodauer – eine 5-minütige Datei dauert etwa 5-10 Minuten. Der erste Durchlauf fügt einen einmaligen Modell-Download von etwa 40 MB hinzu.

Question 13

Kann ich Untertitel (SRT) exportieren?

Accepted Answer

Ja – zu den kostenlosen Exporten gehören .txt, .srt und .vtt mit Segment-Zeitstempeln. Für Wortzeitstempel-Präzision und DOCX/PDF/JSON-Exporte siehe Premium.

Question 14

Kann ich mehrere Dateien gleichzeitig transkribieren?

Accepted Answer

Ja – Sie können bis zu 5 Dateien in die Warteschlange stellen, die nacheinander in Ihrem Browser verarbeitet werden. Premium entfernt die Warteschlangenbeschränkung und verarbeitet Dateien parallel in der Cloud.

Question 15

Warum dauert die erste Transkription länger?

Accepted Answer

Bei Ihrem ersten Besuch wird das KI-Modell von Ihrem Browser heruntergeladen und kompiliert. Es wird dann zwischengespeichert, sodass jede spätere Transkription sofort beginnt.

Question 16

Funktioniert es offline?

Accepted Answer

Teilweise – sobald das Modell zwischengespeichert ist, benötigt die Transkription selbst keine Verbindung. Sie müssen jedoch online sein, um die Seite selbst zu laden.

Question 17

Funktioniert es mit Schweizerdeutsch oder Dialekten?

Accepted Answer

Standarddeutsch funktioniert am besten; starke Dialekte wie Schwiizerdütsch verringern die Genauigkeit erheblich – sprechen Sie wenn möglich Hochdeutsch.

Question 18

Großschreibt es Nomen korrekt?

Accepted Answer

Ja – die deutsche Großschreibung von Nomen ist Teil der Ausgabe des Modells.

Question 19

Werden Umlaute und das Eszett korrekt geschrieben?

Accepted Answer

Ja – ä, ö, ü und ß werden nativ erzeugt.

	Gratis (Browser)	Premium (Cloud)
Limit pro Datei	10 min	10 horas
Genauigkeit	~85%	>95%
Sprecher-Diarisierung	❌	✅
Zeitstempel pro Wort	❌	✅
Video-Support (MP4/MOV)	❌	✅
Export-Formate	TXT, SRT, VTT	DOCX, PDF, JSON…
Geschwindigkeit (1h Audio)	~2 min / 1h	~2 min / 1h
Datenschutz	100% local	☁️ + 🔒

Deutsch-Audio kostenlos transkribieren — direkt im Browser

Lokale KI

Schnell und lokal

99 Sprachen

Keine Anmeldung

So funktioniert es

Audio hochladen oder aufnehmen

KI läuft auf Ihrem Gerät

Text kopieren oder herunterladen

Wie gut verarbeitet Whisper Deutsch?

Woher Deutsch-Audio normalerweise stammt

Wie genau ist die Browser-Transkription?

Browser- vs. Cloud-Transkription: Welche brauchen Sie?

Unterstützte Audioformate

Mehr benötigt? Premium entdecken

Sprecher-Diarisierung

Dateien bis 10 Stunden

Zusammenfassung, Sentiment & Themen

Vollständiger Export

Häufige Fragen