ai-garage
技術

音声認識(STT)とは?

別名: Speech-to-Text / ASR

話し声を文字起こしするAI技術。

⚡ 30秒でわかる

音声認識(STT) の主なポイント

  • 1 マイクから入った音声をテキストに変換する技術です。
  • 2 OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。

📖 詳しく

音声認識(STT) とは

マイクから入った音声をテキストに変換する技術です。 OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。

❓ FAQ

よくある質問

Q. 音声認識(STT) とは何ですか?
A. 話し声を文字起こしするAI技術。 マイクから入った音声をテキストに変換する技術です。
Q. 音声認識(STT) の主な特徴は?
A. マイクから入った音声をテキストに変換する技術です。 OpenAI の Whisper が業界標準で、議事録・字幕・通訳など幅広く使われています。
Q. 音声認識(STT) に関連する用語は?
A. 「音声クローン」、「マルチモーダル」などが関連しています。
Q. 音声認識(STT) の別名は?
A. Speech-to-Text、ASR とも呼ばれます。

🔗 関連

あわせて読みたい

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →