Question 1

¿El audio se sube a algún servidor?

Accepted Answer

La transcripción se ejecuta 100% localmente en tu navegador. Luego puedes optar por compartir el audio y la transcripción con nosotros (casilla de consentimiento) para mejorar el servicio — completamente opcional.

Question 2

¿Qué formatos de audio se aceptan?

Accepted Answer

MP3, WAV, M4A, OGG, FLAC, WEBM, MP4, MOV y cualquier formato que tu navegador pueda decodificar.

Question 3

¿Cuánto tiempo de audio puedo transcribir?

Accepted Answer

Hasta 10 minutos por archivo en modo gratuito. Para audios más largos, el plan Premium soporta hasta 10 horas.

Question 4

¿En qué idiomas funciona?

Accepted Answer

El modelo Whisper soporta 99 idiomas: español, inglés, portugués, francés, alemán, japonés, árabe y muchos más. La detección es automática.

Question 5

¿Necesito instalar algo?

Accepted Answer

No. Funciona directamente en el navegador. El modelo de IA (~40MB) se descarga una vez y queda en caché.

Question 6

¿Se guarda la transcripción en algún lugar?

Accepted Answer

Por defecto, no — el resultado queda solo en tu navegador. Si marcas la casilla de consentimiento, el audio y la transcripción se envían a nuestros servidores y se eliminan a los 7 días. Puedes revocar el consentimiento en cualquier momento.

Question 7

¿Cuál es la diferencia con el plan Premium?

Accepted Answer

El modo gratuito usa VoxScriber Nano cuantizado en 4 bits (q4) localmente: límite de 10 min por archivo, precisión ~85%, sin diarización de hablantes y marcas de tiempo solo por segmentos (~30s). El Premium usa modelos en la nube (AssemblyAI + Whisper Large float32): precisión >95%, diarización de hasta 30 hablantes, marcas de tiempo por palabra, archivos hasta 10h, soporte MP4/MOV/MKV y exports DOCX, PDF, JSON. Velocidad: 1h de audio tarda ~20min en tu CPU local vs ~2min en el GPU dedicado del Premium.

Question 8

¿Funciona en el móvil?

Accepted Answer

Sí, pero el rendimiento depende del dispositivo. En smartphones con poca RAM, la transcripción puede ser más lenta.

Question 9

¿Es realmente gratuito?

Accepted Answer

Sí. El transcriptor del navegador es genuinamente gratuito, sin período de prueba, sin marca de agua y sin registro. Ganamos dinero con los planes Premium en la nube, no con la herramienta gratuita.

Question 10

¿Sale mi audio de mi dispositivo?

Accepted Answer

No — la transcripción se ejecuta localmente a través de WebAssembly. La única excepción es si marcas explícitamente la casilla de consentimiento opcional para compartir una grabación con nosotros.

Question 11

¿Hay un límite de tamaño de archivo?

Accepted Answer

El límite práctico es la duración (10 minutos por archivo) y la memoria de tu dispositivo, no los megabytes. Un MP3 de 10 minutos suele ser de 10-20MB y funciona bien en la mayoría de los dispositivos.

Question 12

¿Cuánto tiempo toma la transcripción?

Accepted Answer

Con el modelo Nano, espera aproximadamente 1-2 veces la duración del audio en un portátil moderno — un archivo de 5 minutos toma unos 5-10 minutos. La primera ejecución agrega una descarga única del modelo de ~40MB.

Question 13

¿Puedo exportar subtítulos (SRT)?

Accepted Answer

Sí — las exportaciones gratuitas incluyen .txt, .srt y .vtt con marcas de tiempo de segmento. Para precisión de marcas de tiempo a nivel de palabra y exportaciones DOCX/PDF/JSON, consulta Premium.

Question 14

¿Puedo transcribir varios archivos a la vez?

Accepted Answer

Sí — puedes poner en cola hasta 5 archivos y se procesan uno tras otro en tu navegador. Premium elimina el límite de cola y procesa archivos en paralelo en la nube.

Question 15

¿Por qué la primera transcripción tarda más?

Accepted Answer

En tu primera visita, el modelo de IA se descarga y compila en tu navegador. Luego se almacena en caché, por lo que cada transcripción posterior comienza de inmediato.

Question 16

¿Funciona sin conexión?

Accepted Answer

Parcialmente — una vez que el modelo está en caché, la transcripción en sí no necesita conexión. Aún necesitas estar en línea para cargar la página en sí.

Question 17

¿Genera caracteres simplificados o tradicionales?

Accepted Answer

La salida predeterminada es simplificada; si necesita tradicional, convierta el texto después con una herramienta de conversión.

Question 18

¿Admite cantonés?

Accepted Answer

Parcialmente: la precisión es notablemente menor que en mandarín; las grabaciones en mandarín funcionan mejor.

Question 19

¿Puede transcribir mensajes de voz de WeChat?

Accepted Answer

Sí: guarde o exporte el archivo de audio y colóquelo aquí.

	Gratis (navegador)	Premium (nube)
Límite por archivo	10 min	10 horas
Precisión	~85%	>95%
Diarización (quién habla)	❌	✅
Marcas de tiempo por palabra	❌	✅
Soporte de vídeo (MP4/MOV)	❌	✅
Formatos de exportación	TXT, SRT, VTT	DOCX, PDF, JSON…
Velocidad (1h de audio)	~2 min / 1h	~2 min / 1h
Privacidad	100% local	☁️ + 🔒

Transcripción de audio en Chino gratis en tu navegador

IA local

Rápido y local

99 idiomas

Sin registro

Cómo funciona

Sube o graba el audio

La IA corre en tu dispositivo

Copia o descarga el texto

¿Qué tan bien maneja Whisper el Chino?

De dónde suele provenir el audio en Chino

¿Qué tan precisa es la transcripción en el navegador?

Transcripción en el navegador vs en la nube: ¿cuál necesitas?

Formatos de audio compatibles

¿Necesitas más? Conoce el Premium

Diarización de hablantes

Archivos de hasta 10 horas

Resumen, sentimiento y temas

Exportación completa

Preguntas frecuentes