Atrás
3 min de lectura
Transcripción

Configuración de calidad de transcripción

Aprenda a configurar la calidad de la transcripción. Diferencias entre los niveles de calidad y cuándo usar cada uno.

Configuración de calidad

Aprenda a configurar la calidad de la transcripción, comprenda las diferencias entre cada nivel, descubra cuándo usar funciones avanzadas y optimice el equilibrio entre precisión y costo.

Niveles de calidad disponibles

Calidad Básica

Precisión: 85-92% | Velocidad: 2-5x más rápido | Costo: Costo estándar

Ideal para audio claro y uso general.

Ideal para:

  • Audio con buena calidad
  • Un solo hablante
  • Poco ruido de fondo
  • Uso personal o casual
  • Presupuesto limitado

No recomendado para:

  • Audio con mucho ruido
  • Múltiples hablantes superpuestos
  • Jerga técnica compleja
  • Uso profesional crítico

Especificaciones técnicas:

  • Procesamiento: Modelo base optimizado
  • Modelo de lenguaje: Estándar
  • Reducción de ruido: Básica
  • Contexto: 30 segundos

Calidad Avanzada

Precisión: 92-96% | Velocidad: Velocidad estándar | Costo: +50% del costo

Equilibrio perfecto entre calidad y costo.

Ideal para:

  • Reuniones de trabajo
  • Entrevistas profesionales
  • Contenido para publicación
  • Audio de calidad media
  • Uso profesional

No recomendado para:

  • Presupuesto muy ajustado
  • Audio de muy baja calidad
  • Transcripciones no críticas
  • Solo uso casual

Especificaciones técnicas:

  • Procesamiento: Modelo avanzado con refinamiento
  • Modelo de lenguaje: Contextual + técnico
  • Reducción de ruido: Inteligente
  • Contexto: 60 segundos

Calidad Premium

Precisión: 96-99% | Velocidad: 2-3x más lento | Costo: +120% del costo

Precisión máxima para uso profesional crítico.

Ideal para:

  • Transcripciones médicas/legales
  • Audio con mucha superposición
  • Contenido técnico complejo
  • Publicaciones académicas
  • Cumplimiento y auditoría

No recomendado para:

  • Uso casual
  • Presupuesto limitado
  • Resultados urgentes
  • Audio simple

Especificaciones técnicas:

  • Procesamiento: Modelo premium de múltiples pasadas
  • Modelo de lenguaje: Dominios especializados + técnicos
  • Reducción de ruido: IA avanzada
  • Contexto: 120 segundos

Configuración avanzada

Identificación de hablantes

Separa el habla de diferentes personas.

| Opción | Mejor para | |---|---| | Desactivada | Una sola persona o no es importante | | Activada | Múltiples personas, reuniones |

Úselo solo cuando sea necesario (varios hablantes). Funciona mejor con 2-6 hablantes. Requiere buena calidad de audio.

Marcas de tiempo

Añade marcadores de tiempo.

| Opción | Mejor para | |---|---| | Sin marcas de tiempo | Texto corrido simple | | Por frase | Subtítulos, sincronización | | Por palabra | Edición precisa, análisis |

Las marcas de tiempo por palabra son útiles para la edición de video. Las marcas de tiempo por frase son suficientes para la mayoría de los casos.

Filtro de lenguaje obsceno

Elimina o censura lenguaje obsceno.

| Opción | Mejor para | |---|---| | Desactivado | Transcripción fiel | | Censurar | Contenido público | | Eliminar | Entorno corporativo |

Desactívelo para transcripciones médicas/legales. Censure para contenido que pueda ser público. Elimine para entornos corporativos formales.

Formato inteligente

Mejora la puntuación y el formato.

| Opción | Mejor para | |---|---| | Básico | Uso casual | | Avanzado | Publicación, formalidad |

Próximos pasos