CodexがHugging Face Skillsと統合——ML実験をエージェントに委任する新時代
OpenAIのAIコーディングエージェント「Codex」が、Hugging Faceのスキルリポジトリ「HF Skills」と統合され、機械学習モデルのトレーニングから評価・公開までをエンドツーエンドで自動化できるようになった。Hugging Faceが2025年12月に公式ブログで発表した。
何ができるのか
HF Skillsを使うことで、Codexは以下のタスクを自律的にこなせる。
- 言語モデルのファインチューニングおよびRLアライメント(強化学習による調整)
- Trackioを通じたリアルタイムのトレーニングメトリクスの確認と対応
- チェックポイントの評価と結果に基づく判断
- 実験レポートの自動生成
- GGUFフォーマットへのエクスポートとモデルの量子化(ローカル実行向け)
- Hugging Face Hubへのモデル公開
例えば「Qwen3-0.6BをデータセットでファインチューニングしてHubに公開して」と一言伝えるだけで、Codexがデータセットの検証・適切なハードウェアの選択・学習スクリプトの生成・ジョブの投稿・進捗監視まで一気に処理する。
おもちゃではない、本番レベルの技術スタック
この統合が注目される理由の一つは、対応する学習手法の本格度だ。教師ありファインチューニング(SFT)、直接選好最適化(DPO)、検証可能な報酬を用いた強化学習(RLVR)など、現在の生成AIの最前線で使われる手法に対応している。モデルサイズも0.5Bから7Bパラメータまでをカバーし、複数手法を組み合わせたマルチステージパイプラインも構築可能だ。
Claude CodeやGemini CLIとも互換
興味深いのは、HF Skillsが特定のエージェントに縛られていない点だ。CodexはAGENTS.mdファイルを使ってスキルを読み込む仕組みを採用しており、Claude CodeのSkillsやGemini CLIとも互換性を持つ。異なるAIエージェントが同じスキルリポジトリを共有できるという設計は、エージェント間の相互運用性を高めるうえで重要な方向性を示している。
日本のMLエンジニアへの影響
国内でもLLMのファインチューニングへの関心は高まっており、Hugging Face上での日本語モデルの開発も活発だ。今回の統合により、実験の設計から結果レポートの確認まで「エージェントに委任して、人間はレビューに集中する」というワークフローが現実的になる。Hugging Face ProまたはTeam/Enterpriseプランへの加入が必要だが、個人開発者から企業のMLチームまで活用の幅は広い。
CodexとHF Skillsを組み合わせた活用は、AIモデル開発のハードルを下げ、より多くのエンジニアが最先端のトレーニング手法を試せる環境を整えつつある。