ベースモデルにはたくさんのものが隠されています - トレーニング後では抑制されていますが、巧妙なトリックを使用してアクセスできます。
Omar Shams
Omar Shams8月16日 09:08
(以下のTRLトレーナーコード)言語モデル検索をどのように拡張しますか?言語モデルは、モデルをまったくトレーニングせずに、純粋にガイド付きリサンプリングだけでは解決できない新しい問題を解決するように導くことができますか?答えはある意味「はい」であることが判明しました。これは、トレーニング後の研究と安全性の研究に重要な意味を持ちます。
4.27K