技術
音声認識(STT)とは?
別名: Speech-to-Text / ASR
話し声を文字起こしするAI技術。
⚡ 30秒でわかる
音声認識(STT) の主なポイント
- 1 マイクから入った音声をテキストに変換する技術です。
- 2 OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。
📖 詳しく
音声認識(STT) とは
マイクから入った音声をテキストに変換する技術です。
OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。
❓ FAQ
よくある質問
- Q. 音声認識(STT) とは何ですか?
- A. 話し声を文字起こしするAI技術。 マイクから入った音声をテキストに変換する技術です。
- Q. 音声認識(STT) の主な特徴は?
- A. マイクから入った音声をテキストに変換する技術です。 OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。
- Q. 音声認識(STT) に関連する用語は?
- A. 「音声クローン」、「マルチモーダル」などが関連しています。
- Q. 音声認識(STT) の別名は?
- A. Speech-to-Text、ASR とも呼ばれます。