戻る
4 分で読了
高度な機能

バッチ処理

VoxScriberでバッチ処理を使用して複数ファイルを同時に文字起こしする方法を学びます。

バッチ処理

複数ファイルの文字起こしを自動化します。効率と結果を最大化するための戦略、監視、ベストプラクティスを学びます。

バッチ処理の利点

時間節約

数十から数百のファイルを同時に処理。10倍の速さ

  • ドラッグ&ドロップによる複数ファイルのアップロード
  • 一度の設定
  • 自動並列処理
  • セットアップ時間を90%削減

コスト効率

クレジットとリソースの使用を最適化。30%の節約

  • 自動バッチ割引
  • クレジット使用の最適化
  • 運用オーバーヘッドの削減
  • 大量ボリュームに対するROIの最適化

高度な整理

プロジェクトを整理された状態に保ちます。

  • カスタムタグとカテゴリ
  • 自動フォルダ構造
  • 一貫性のあるメタデータ
  • 高度な検索とフィルタリング

動作方法

ダッシュボードから

ファイルを選択

アップロードエリアに複数のファイルをドラッグ&ドロップするか、クリックして選択します

オプションを設定

すべてのファイルに言語、文字起こしエンジン、話者識別を設定します

整理

タグを追加し、保存先フォルダを選択し、優先度を設定します

処理を開始

"すべて文字起こし"をクリックしてバッチを開始します

進捗を監視

バッチパネルで各ファイルのステータスをリアルタイムで追跡します

結果をエクスポート

すべての文字起こしを希望の形式で一括ダウンロードします

APIから

# Upload multiple files
curl -X POST https://api.vozparatexto.com.br/v1/batch/upload \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "files[]=@audio1.mp3" \
  -F "files[]=@audio2.mp3" \
  -F "files[]=@audio3.mp3" \
  -F "engine=ASSEMBLYAI" \
  -F "language=en-US"
// Response
{
  "batchId": "batch_abc123",
  "totalFiles": 3,
  "status": "PROCESSING",
  "files": [
    { "id": "upload_1", "name": "audio1.mp3", "status": "QUEUED" },
    { "id": "upload_2", "name": "audio2.mp3", "status": "QUEUED" },
    { "id": "upload_3", "name": "audio3.mp3", "status": "QUEUED" }
  ]
}

制限と設定

| リソース | フリープラン | ライトプラン | アドバンスドプラン | プロプラン | |---|---|---|---|---| | 1バッチあたりのファイル数 | 3 | 10 | 25 | 100 | | 並列処理 | 1 | 2 | 3 | 5 | | 最大バッチサイズ | 100 MB | 500 MB | 2 GB | 10 GB | | キューの優先度 | 通常 | 通常 | 高 | 最大 |

バッチ監視

ファイルステータス

| ステータス | 説明 | |---|---| | QUEUED | キューに入って処理待ち | | UPLOADING | アップロード中 | | PROCESSING | 文字起こし中 | | COMPLETED | 文字起こし完了 | | FAILED | 処理失敗 | | RETRYING | 自動リトライ中 |

監視ダッシュボード

バッチパネルに表示される内容:

  • バッチ全体の進捗(%)
  • 各ファイルのステータス
  • 推定完了時間
  • 消費クレジットと推定
  • ファイルごとのエラーログ

最適化戦略

ファイル整理

  • プロジェクトやトピックごとにファイルをグループ化
  • 一貫性のある命名規則を使用
  • 必要に応じて言語ごとに分ける
  • 優先順に並べる

推奨設定

  • 最高のコスト効率を得るにはAssemblyAIを使用(15サイクル/分)
  • 必要な場合のみ話者識別を有効にする
  • 最高の精度を得るために正しい言語を選択
  • 完了通知用にWebhookを設定

大量のバッチを開始する前にクレジット残高を確認してください。システムは開始前に推定コストを計算しますが、進行中の個別の文字起こしはキャンセルできません。

トラブルシューティング

バッチ内の一部のファイルが失敗した場合

考えられる原因: サポートされていない形式、ファイルの破損、クレジット不足。

解決策: 失敗したファイルの形式を確認し、個別に再処理を試み、クレジット残高を確認してください。

処理が非常に遅い場合

考えられる原因: 多数の大容量ファイル、ピーク時間、並列処理の制限。

解決策: 小さなバッチに分割し、オフピーク時に提出し、より多くの並列スロットのためにプランのアップグレードを検討してください。

ファイル間で結果が一貫しない場合

考えられる原因: 音質のばらつき、異なる言語、誤った設定。

解決策: アップロード前に音声を正規化し、必要に応じてファイルごとに言語を設定し、バッチ設定を見直してください。

非常に大きなバッチ(50ファイル以上)の場合は、20〜30ファイルのサブバッチに分割してください。これにより監視が容易になり、問題をより迅速に特定できます。

さらに学ぶ