【実践ガイド】Agent Lightningで自作エージェントを強化学習する ─ ユースケース別導入手順
Agent Lightningを使った具体的な実装方法を解説します。APOとGRPO/PPOの違い、GPTモデルとの関係、会議室予約・Text-to-SQL・RAGエージェントの実装例まで、ユースケース別に導入手順を紹介しています。
続きを読む3件の記事
Agent Lightningを使った具体的な実装方法を解説します。APOとGRPO/PPOの違い、GPTモデルとの関係、会議室予約・Text-to-SQL・RAGエージェントの実装例まで、ユースケース別に導入手順を紹介しています。
続きを読む
2025年はRLVRの年でした。o1/o3、DeepSeek R1が推論能力を飛躍的に向上させた今、エージェントを個別にRLで訓練する意味はあるのでしょうか?Agent Lightningを題材に、ベースモデルの賢さとエージェントRLの関係を考察します。
続きを読む
はじめに 本記事では、k-means を用いてデータを分類クラスタリングします。 Python の機械学習ライブラリである scikit-learn を使用して実装します。 環境 以下が今回の環境です。 $ python -V Python 3.7.10 $ pip list | grep -e numpy -e...
続きを読む