ai-garage
LLM

SFT(教師あり微調整)とは?

別名: Supervised Fine-Tuning

正解付きのデータで追加学習させる工程。

⚡ 30秒でわかる

SFT(教師あり微調整) の主なポイント

  • 1 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。
  • 2 RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。

📖 詳しく

SFT(教師あり微調整) とは

「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。 RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。

❓ FAQ

よくある質問

Q. SFT(教師あり微調整) とは何ですか?
A. 正解付きのデータで追加学習させる工程。 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。
Q. SFT(教師あり微調整) の主な特徴は?
A. 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。 RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。
Q. SFT(教師あり微調整) に関連する用語は?
A. 「RLHF」、「ファインチューニング」などが関連しています。
Q. SFT(教師あり微調整) の別名は?
A. Supervised Fine-Tuning とも呼ばれます。

🔗 関連

あわせて読みたい

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →