方法 1:オンラインで迅速な音声認識機能を使用する(インターネット接続が必要)#
注意:1 つの音声ファイルのサイズは 20M を超えてはいけません。複数回リフレッシュできます。
方法 2:ウェブ政府を使用してオンラインで実現する(インターネット接続が必要)#
注意:3 回の試行機会があります。できるだけ音声を 1 つにまとめてアップロードしてください。
方法 3:i 迪云聴写を使用してオンラインで実現する(インターネット接続が必要)#
方法 4:電話番号でログインして阅录を使用する(インターネット接続が必要)#
方法 5:converter.app を使用してテキストに変換する(インターネット接続が必要)#
方法 6:faster-whisper を使用してテキストに変換する(インターネット接続は不要)#
- まず、Githubから自分のコンピューターシステムに適した FFmpeg をダウンロードしてインストールします。インストール手順はWindows10 システムでの FFmpeg のダウンロードとインストール方法を参考にしてください。
- 次に、Githubから faster-whisper-GUI.exe をダウンロードし、右クリックして管理者としてインストールします。
- さらに、huggingfaceで base で終わるモデルを検索し、適切なディレクトリフォルダにコピーします。
- 管理者として FasterWhisperGUI を実行します。
- ローカルモデルを使用し、先ほどダウンロードしたモデルファイルを選択し、モデルをロードします。
- もし Nvidia のグラフィックスカードを使用している場合は、処理デバイスのオプションで cuda を選択してください。
- 変換を実行するには、変換ボタンをクリックします。
- プラスボタンをクリックして変換したいビデオファイルを選択します。
- 変換が完了したら、whisperX および字幕編集にジャンプするためにクリックします。
- 字幕ファイルを保存するために保存ボタンをクリックします。
- 保存する字幕の形式を選択することもできます。