Qualitätseinstellungen
Erfahren Sie, wie Sie die Transkriptionsqualität konfigurieren, die Unterschiede zwischen den Stufen verstehen, wann Sie erweiterte Funktionen nutzen und das Verhältnis von Genauigkeit zu Kosten optimieren.
Verfügbare Qualitätsstufen
Basis-Qualität
Genauigkeit: 85-92% | Geschwindigkeit: 2-5x schneller | Kosten: Standardkosten
Ideal für klare Audiodateien und den allgemeinen Gebrauch.
Ideal für:
Audiodateien mit guter Qualität
Einzelner Sprecher
Wenig Hintergrundgeräusche
Persönliche oder gelegentliche Nutzung
Begrenztes Budget
Nicht empfohlen für:
Audiodateien mit starken Geräuschen
Mehrere überlappende Sprecher
Komplexe Fachbegriffe
Kritische professionelle Nutzung
Technische Spezifikationen:
Verarbeitung: Optimiertes Basismodell
Sprachmodell: Standard
Rauschunterdrückung: Einfach
Kontext: 30 Sekunden
Fortgeschrittene Qualität
Genauigkeit: 92-96% | Geschwindigkeit: Standardgeschwindigkeit | Kosten: +50% der Kosten
Perfektes Gleichgewicht zwischen Qualität und Kosten.
Ideal für:
Arbeitsbesprechungen
Professionelle Interviews
Inhalte für Veröffentlichungen
Audiodateien mit durchschnittlicher Qualität
Professionelle Nutzung
Nicht empfohlen für:
Sehr knappes Budget
Extrem schlechte Audioqualität
Nicht kritische Transkriptionen
Nur gelegentliche Nutzung
Technische Spezifikationen:
Verarbeitung: Fortgeschrittenes Modell mit Verfeinerung
Sprachmodell: Kontextuell + technisch
Rauschunterdrückung: Intelligent
Kontext: 60 Sekunden
Premium-Qualität
Genauigkeit: 96-99% | Geschwindigkeit: 2-3x langsamer | Kosten: +120% der Kosten
Maximale Genauigkeit für kritische professionelle Anwendungen.
Ideal für:
Medizinische/rechtliche Transkriptionen
Audiodateien mit starker Überlappung
Komplexe technische Inhalte
Akademische Veröffentlichungen
Compliance und Revision
Nicht empfohlen für:
Gelegentliche Nutzung
Begrenztes Budget
Dringende Ergebnisse
Einfache Audiodateien
Technische Spezifikationen:
Verarbeitung: Premium-Modell mit Mehrfachdurchlauf
Sprachmodell: Spezialisiert + technische Domänen
Rauschunterdrückung: Fortgeschrittene KI
Kontext: 120 Sekunden
Erweiterte Einstellungen
Sprecheridentifikation
Trennt die Sprache verschiedener Personen.
| Option | Bestens geeignet für |
|---|---|
| Deaktiviert | Einzelperson oder nicht wichtig |
| Aktiviert | Mehrere Personen, Besprechungen |
Nur bei Bedarf verwenden (mehrere Sprecher). Funktioniert am besten mit 2–6 Sprechern. Erfordert gute Audioqualität.
Zeitstempel
Fügt Zeitmarken hinzu.
| Option | Bestens geeignet für |
|---|---|
| Keine Zeitstempel | Einfacher fortlaufender Text |
| Pro Satz | Untertitel, Synchronisation |
| Pro Wort | Präzise Bearbeitung, Analyse |
Zeitstempel pro Wort sind nützlich für die Videobearbeitung. Zeitstempel pro Satz sind für die meisten Fälle ausreichend.
Schimpfwortfilter
Entfernt oder zensiert Schimpfwörter.
| Option | Bestens geeignet für |
|---|---|
| Deaktiviert | Originalgetreue Transkription |
| Zensieren | Öffentliche Inhalte |
| Entfernen | Firmenumfeld |
Für medizinische/rechtliche Transkriptionen deaktivieren. Zensieren für Inhalte, die öffentlich sein könnten. Entfernen für formelle Firmenumgebungen.
Intelligente Formatierung
Verbessert Zeichensetzung und Formatierung.
| Option | Bestens geeignet für |
|---|---|
| Einfach | Gelegentliche Nutzung |
| Fortgeschritten | Veröffentlichung, Formalität |
Nächste Schritte
Sprecheridentifikation – So trennen Sie Stimmen in Transkriptionen
Unterstützte Formate – Liste der akzeptierten Formate
Große Dateien – Tipps zur Verarbeitung langer Dateien