브라우저에서 中国語 음성 무료 변환
VoxScriber Nano는 中国語(中文)를 이해하며 기기에서 로컬로 처리됩니다. 무료 모드에서는 10분 제한이 있습니다.
브라우저에서 VoxScriber Nano(오픈소스)를 실행 — 로컬 AI, 파일당 최대 10분, 기본 정확도(~85%). 전문적인 사용에는 Premium을 이용하세요.
변환이 브라우저에서 로컬로 실행됩니다. 서비스 개선을 위해 결과를 선택적으로 공유할 수 있습니다(동의 필요). 제한: 파일당 10분, 정확도 ~85%.
무료 vs Premium — 차이점 확인
| 무료(브라우저) | Premium(클라우드) | |
|---|---|---|
| 파일 제한 | 10 min | 10 horas |
| 정확도 | ~85% | >95% |
| 화자 분리 | ❌ | ✅ |
| 단어별 타임스탬프 | ❌ | ✅ |
| 비디오 지원(MP4/MOV) | ❌ | ✅ |
| 내보내기 형식 | TXT, SRT, VTT | DOCX, PDF, JSON… |
| 속도(1시간 오디오) | ~2 min / 1h | ~2 min / 1h |
| 개인정보 보호 | 100% local | ☁️ + 🔒 |
로컬 AI
변환이 브라우저에서 실행됩니다. 서버 공유는 선택 사항입니다(동의 필요).
빠르고 로컬 처리
브라우저에서 직접 AI 처리 — 대기 시간 없음.
99개 언어
음성 언어를 자동으로 감지합니다.
회원가입 불필요
계정 생성 없이 즉시 시작하세요.
How it works
음성 업로드 또는 녹음
MP3, WAV, M4A, OGG 파일을 드래그하거나 마이크를 직접 사용하세요.
AI가 기기에서 실행
Whisper AI가 한 번 다운로드되어 캐시에 저장됩니다. 다음 방문 시 대기 없음.
텍스트 복사 또는 다운로드
몇 초 안에 결과가 표시됩니다. .txt로 다운로드하거나 한 번의 클릭으로 복사하세요.
Whisper가 中国語를 얼마나 잘 처리하나요?
Whisper는 기본적으로 간체자를 출력하며 표준 중국어(만다린)를 안정적으로 처리하여 문맥에서 성조에 의존하는 동음이의어를 해결합니다. 번체자 출력은 일관성이 없으며(스크립트가 혼합될 수 있음) 광둥어는 만다린보다 현저히 약합니다. 단어 사이에 공백이 추가되지 않으며 이는 중국어에 올바른 방식입니다.
中国語 오디오는 일반적으로 어디서 오나요?
WeChat 음성 메시지, 비즈니스 회의, 대학 강의, 팟캐스트 또는 비디오 콘텐츠.
브라우저 전사의 정확도는 얼마나 되나요?
브라우저 전사는 WebAssembly를 사용하여 OpenAI의 Whisper 모델을 기기에서 직접 실행합니다. 세 가지 모델 크기를 제공하며, 정확도는 선택한 모델에 따라 다릅니다:
- 나노 (~40MB) — 기본값. 명확한 음성에서 약 85% 정확도. 빠른 메모, 음성 메시지 및 초안에 적합합니다. iOS에서 실행되는 유일한 모델입니다.
- 미니 (~150MB) — 대략 90% 정확도. 기기에 4GB 이상의 RAM이 있고 더 깨끗한 출력이 필요한 경우 좋은 중간 지점입니다.
- 플러스 (~500MB) — 가장 정확한 로컬 옵션으로, 선명한 오디오에서 93%에 근접합니다. 다운로드 및 실행 속도가 느리며, 8GB 이상의 RAM을 갖춘 데스크톱 컴퓨터에 가장 적합합니다.
로컬 모델의 정확도를 낮추는 요인: 배경 소음, 여러 사람이 동시에 말하는 경우, 심한 억양, 압축된 음성 메모와 같은 낮은 비트레이트 녹음. 95% 이상의 전문적인 정확도, 단어 수준 타임스탬프 또는 화자 라벨이 필요한 경우 클라우드 모델이 필요합니다. 위의 비교를 참조하세요.
브라우저 대 클라우드 전사: 어떤 것이 필요하신가요?
브라우저 전사는 개인정보 보호가 가장 중요하거나 오디오가 짧을 때 적합합니다. 아무것도 업로드되지 않고, 이후에 삭제할 필요가 없으며, 비용이 들지 않습니다. 트레이드오프는 속도와 정밀도입니다. CPU가 약 20분 동안 1시간 분량의 오디오를 처리하며, 로컬 모델은 화자 라벨과 단어 수준 타이밍을 건너뜁니다.
클라우드 전사는 회의, 인터뷰, 강의, 법적 녹음 등 작업할 때 적합합니다. 전용 GPU는 약 2분 만에 1시간 분량의 오디오를 95% 이상의 정확도로 텍스트로 변환하고, 최대 30명의 화자를 라벨링하며, 최대 10시간 길이의 파일을 허용하고, 자막 형식 외에도 DOCX, PDF 및 JSON으로 내보낼 수 있습니다.
실용적인 경험 법칙: 카페에서 녹음을 큰 소리로 읽어도 괜찮을 정도라면 클라우드의 속도와 정확도가 우세합니다. 오디오가 민감한 경우(의료 상담, 기밀 회의, 개인 음성 메모) 브라우저 도구는 모든 것을 기기에 보관하고 몇 분 내에 사용 가능한 트랜스크립트를 제공합니다. 많은 사용자가 브라우저에서 빠른 개인 메모를, 클라우드에서 전문 작업을 결합합니다.
프리미엄 요금제 보기 →지원되는 오디오 형식
MP3, WAV, M4A, OGG, OPUS, FLAC 또는 WEBM을 업로드하세요. 브라우저가 디코딩할 수 있는 모든 형식입니다. 일반적인 소스는 바로 작동합니다: WhatsApp 음성 메모(OPUS), iPhone 음성 메모(M4A), Android 녹음기 파일, Zoom 녹음(M4A/MP4), Telegram 음성 메시지(OGG), 팟캐스트 파일(MP3). MP4, MOV와 같은 비디오 컨테이너는 브라우저가 코덱을 지원하는 경우 오디오 트랙을 위해 디코딩됩니다. 파일 로드에 실패하면 일반적인 컨테이너에 비정상적인 코덱이 포함된 경우가 대부분이며, 먼저 MP3로 변환하면 거의 모든 경우에 해결됩니다.
다른 형식이 필요하신가요? 무료 변환기를 사용하세요: 무료 MP3 / WAV / OGG / AAC 오디오 변환기
더 필요하신가요? Premium을 사용해 보세요
전문적인 사용 — 화자 분리, 긴 파일, AI 분석 및 모든 내보내기 형식.
화자 분리(다이어리제이션)
각 구간에서 누가 말하는지 자동으로 식별합니다. 회의, 인터뷰, 팟캐스트에 최적.
최대 10시간 파일 지원
로컬 모델은 최대 10분을 지원합니다. Premium은 최대 10시간 파일을 처리합니다.
요약, 감성 분석 & 주제
AI가 내용을 분석하여 요약, 감성 분석, 주제 추출을 생성합니다.
전체 내보내기 옵션
SRT, VTT, DOCX, JSON, PDF로 내보내기 — 자막, 문서, 자동화에 이상적.