Question 1

音声はサーバーに送信されますか？

Accepted Answer

文字起こしはブラウザ内で100%ローカルに動作します。完了後、サービス改善のために音声とテキストを任意でご共有いただけます（同意チェックボックス）。完全に任意であり、同意なしには送信されません。

Question 2

対応している音声フォーマットは？

Accepted Answer

MP3、WAV、M4A、OGG、FLAC、WEBM、MP4、MOVなど、ブラウザがデコードできるあらゆるフォーマットに対応しています。

Question 3

最大何分の音声を文字起こしできますか？

Accepted Answer

無料モードでは1ファイルあたり最大10分。より長い音声にはPremiumプラン（最大10時間対応）をご利用ください。

Question 4

対応言語は何ですか？

Accepted Answer

Whisperモデルは日本語、英語、ポルトガル語、スペイン語、フランス語、ドイツ語、アラビア語など99言語に対応。自動検出機能付き。

Question 5

インストールが必要ですか？

Accepted Answer

いいえ。ブラウザ上で直接動作します。AIモデル（約40MB）は一度ダウンロードされてキャッシュに保存されます。

Question 6

文字起こし結果は保存されますか？

Accepted Answer

デフォルトでは保存されません — 結果はブラウザ内にのみ留まります。同意チェックボックスをオンにすると、音声とテキストがサーバーに送信され7日後に削除されます。同意はいつでも取り消せます。

Question 7

Premiumとの違いは何ですか？

Accepted Answer

無料モードはVoxScriber Nano（4ビット量子化q4）をローカルで使用：10分制限、精度~85%、話者分離なし、~30sセグメント単位のタイムスタンプのみ。Premiumはクラウドモデル（AssemblyAI + Whisper Large float32）を使用：精度>95%、最大30話者の分離、単語単位のタイムスタンプ、最大10時間対応、MP4/MOV/MKVのビデオサポート、DOCX/PDF/JSONエクスポート。速度：1時間の音声がローカルCPUで約20分 vs PremiumのGPUで約2分。

Question 8

スマートフォンでも使えますか？

Accepted Answer

はい。ただしパフォーマンスはデバイスによって異なります。RAMの少ないスマートフォンでは処理が遅くなる場合があります。

Question 9

本当に無料ですか？

Accepted Answer

はい。ブラウザ文字起こしは本当に無料で、試用期間、ウォーターマーク、サインアップは一切ありません。私たちは無料ツールではなく、プレミアムクラウドプランで収益を得ています。

Question 10

音声はデバイスから送信されますか？

Accepted Answer

いいえ—文字起こしはWebAssemblyを介してローカルで実行されます。唯一の例外は、録音を共有するためにオプションの同意チェックボックスを明示的にチェックした場合です。

Question 11

ファイルサイズの制限はありますか？

Accepted Answer

実際の制限は、メガバイト数ではなく、時間（ファイルあたり10分）とデバイスのメモリです。10分のMP3は通常10〜20MBで、ほとんどのデバイスで問題なく動作します。

Question 12

文字起こしにはどのくらい時間がかかりますか？

Accepted Answer

Nanoモデルの場合、最新のラップトップで音声時間の約1〜2倍を見込んでください—5分のファイルには約5〜10分かかります。初回実行時には約40MBのモデルダウンロードが追加されます。

Question 13

字幕（SRT）をエクスポートできますか？

Accepted Answer

はい—無料エクスポートには、セグメントタイムスタンプ付きの.txt、.srt、.vttが含まれます。単語レベルのタイムスタンプ精度やDOCX/PDF/JSONエクスポートについては、プレミアムをご覧ください。

Question 14

複数のファイルを一度に文字起こしできますか？

Accepted Answer

はい—最大5ファイルをキューに入れることができ、ブラウザで順次処理されます。プレミアムではキュー制限がなくなり、クラウドでファイルを並列処理します。

Question 15

最初の文字起こしがなぜ時間がかかるのですか？

Accepted Answer

初回訪問時にAIモデルがブラウザによってダウンロードおよびコンパイルされます。その後キャッシュされるため、以降の文字起こしはすぐに開始されます。

Question 16

オフラインでも動作しますか？

Accepted Answer

部分的に—モデルがキャッシュされると、文字起こし自体は接続を必要としません。ただし、ページ自体を読み込むにはオンラインである必要があります。

Question 17

強いアクセントでも機能しますか？

Accepted Answer

はい。Whisperはほとんどの英語アクセントを適切に処理します。強い地域アクセントの場合はMiniモデルの方が顕著に優れています。

Question 18

自動的に句読点を追加しますか？

Accepted Answer

はい。文章、コンマ、疑問符が自動的に挿入されます。

Question 19

誰が話しているか識別できますか？

Accepted Answer

無料のブラウザ版ではできません。話者識別はプレミアムクラウド機能です。

	無料（ブラウザ）	Premium（クラウド）
ファイル制限	10 min	10 horas
精度	~85%	>95%
話者分離	❌	✅
単語単位のタイムスタンプ	❌	✅
ビデオサポート（MP4/MOV）	❌	✅
エクスポート形式	TXT, SRT, VTT	DOCX, PDF, JSON…
速度（1h音声）	~2 min / 1h	~2 min / 1h
プライバシー	100% local	☁️ + 🔒

英語音声の無料文字起こし — ブラウザで完結

ローカルAI

高速・ローカル処理

99言語対応

登録不要

使い方

音声をアップロードまたは録音

AIがデバイス上で動作

テキストをコピーまたはダウンロード

Whisperは英語をどの程度処理できますか？

英語の音声は通常どこから来ますか？

ブラウザ文字起こしの精度はどのくらいですか？

ブラウザ vs クラウド文字起こし：どちらが必要ですか？

対応音声フォーマット

さらに必要ですか？Premiumをご覧ください

話者識別（ダイアリゼーション）

最大10時間のファイル対応

要約・感情分析・トピック抽出

多彩なエクスポート形式

よくある質問