✨ 生成AI

LLM・AIエージェント・画像生成・音声合成など生成AI全般の最新ニュース

AIコード生成モデルを「実行結果」で評価する新プラットフォーム「BigCodeArena」が登場

Hugging Faceのコード生成研究チームBigCodeが、AIが生成したコードを実際に実行して品質を評価できるプラットフォーム「BigCodeArena」を発表した。LMArena(旧Chatbot Arena)にインスパイアされた本プラットフォームは、コードの「見た目」ではなく「動作結果」に基づいて人間がモデルを比較・投票できる仕組みを提供する。2025年2月の公開以来、500人以上のユーザーから4,700件以上の投票データが集まっている。

Hugging FaceとVirusTotal、AIセキュリティ強化へ連携——220万超のモデルを継続スキャン

Hugging FaceはマルウェアインテリジェンスプラットフォームのVirusTotalとの協業を発表し、Hugging Face Hub上の220万以上の公開モデル・データセットリポジトリを継続的にセキュリティスキャンする体制を整えた。ファイルハッシュ照合によりユーザーのプライバシーを守りながら脅威を検出する。AIモデルを安全に共有・利用できるエコシステムの構築を目指す。

MetaとHugging Faceが「OpenEnv」発表——AIエージェント開発の標準化に向けたオープンエコシステムを構築

MetaとHugging Faceは、AIエージェント向けの実行環境を共有・公開するための「OpenEnv Hub」を共同で立ち上げた。エージェントが必要とするツールやAPIを安全にサンドボックス化する仕様「OpenEnv 0.1 Spec」もRFCとして公開され、コミュニティからのフィードバックを募っている。強化学習(RL)を活用したポストトレーニングから本番デプロイまで、エージェント開発の共通基盤となることが期待される。

IBMが超小型LLM「Granite 4.0 Nano」を公開——1B・350Mパラメータでエッジ・オンデバイスAIを実現

IBMは、Granite 4.0ファミリーの最小モデルとなる「Granite 4.0 Nano」を発表した。約1.5億〜15億パラメータという超軽量設計でありながら、知識・数学・コード・安全性の各ベンチマークで同規模モデルを上回る性能を示している。Apache 2.0ライセンスで公開されており、エッジデバイスやオンデバイスAIへの組み込みを主な用途として想定している。

最先端AIリサーチエージェント「Deep Research」の構築で学んだこと——Tavilyが明かす設計哲学

AI検索スタートアップのTavilyが、最先端のリサーチエージェント「Deep Research」を構築する中で得た技術的・哲学的な知見を公開した。コンテキスト管理、ツール設計、エージェントハーネスの設計思想など、次世代AIエージェント開発の核心に迫る内容となっている。

Black Forest LabsのFLUX.2がDiffusersに対応——32Bパラメータの新アーキテクチャで画像生成が進化

Black Forest Labs(BFL)が開発した新世代画像生成モデル「FLUX.2」がHugging FaceのDiffusersライブラリに正式対応した。FLUX.1の後継ではなく完全新設計のモデルで、テキストエンコーダーをMistral Small 3.1に一本化し、32Bパラメータの大規模DiTアーキテクチャを採用している。テキスト・画像の両方をガイドとして使える柔軟な生成・編集機能が特徴だ。

OpenAI CodexがHugging Face Skillsと連携——AIモデルのファインチューニングをエージェントに丸投げできる時代へ

OpenAIのコーディングエージェント「Codex」が、Hugging Faceのスキルリポジトリと連携し、言語モデルのファインチューニングから評価・公開まで一連のML実験をエンドツーエンドで自動実行できるようになった。Claude CodeやGemini CLIとも互換性があり、主要なコーディングエージェントで利用可能だ。

NVIDIAがCES 2026で発表——DGX SparkとReachy Miniで「デスクの上のR2-D2」を実現

NVIDIAはCES 2026にて、パーソナルAIスーパーコンピューター「DGX Spark」と小型ロボット「Reachy Mini」を組み合わせたエージェント実装デモを披露した。オープンモデルとNeMo Agent Toolkitを活用し、カメラで視覚認識・音声応答・物理動作を統合したローカルAIエージェントを誰でも自作できる環境が整いつつある。

NVIDIA「Cosmos Reason 2」登場——ロボットや自律AIに高度な推論能力を、オープンモデルのフィジカルAI分野で首位獲得

NVIDIAは、フィジカルAI向けのオープン推論型ビジョン言語モデル「Cosmos Reason 2」を公開した。前バージョンから大幅に精度が向上し、Physical AI BenchおよびPhysical Reasoningの両リーダーボードで1位を獲得。ロボットや自律エージェントが物理世界を理解し、段階的に問題を解決する能力を大きく強化している。

Microsoft、差分アテンションの第2世代「Differential Transformer V2」を発表——カスタムカーネル不要で高速推論を実現

Microsoftの研究チームが、LLMのアテンション機構を刷新する「Differential Transformer V2(DIFF V2)」を発表した。前バージョンの課題だった推論速度の低下とカスタムカーネル依存を解消しつつ、ノイズ抑制能力を維持する設計が特徴だ。FlashAttentionとの親和性も高く、実用的なLLM開発への適用が期待される。

エンタープライズAIエージェントはなぜ失敗するのか——IBMとUCバークレーが「MAST」で根本原因を解明

IBMリサーチとUCバークレーが共同で、エンタープライズIT自動化におけるAIエージェントの失敗パターンを体系的に分析。310件の実行トレースを解析した結果、「自己検証の欠如」「終了条件の認識不足」「文脈汚染による連鎖的失敗」という3つの主要パターンが明らかになった。エージェント設計に直結する実践的な知見として注目を集めている。

GGMLとllama.cppがHugging Faceに参画——ローカルAIの長期的発展を目指す

ローカル推論の基盤ライブラリ「llama.cpp」を開発するGGMLが、Hugging Face(HF)にチームとして参画することが発表された。オープンソースの方針は維持されつつ、HFのリソースによって持続的な開発体制が強化される。ローカルAIがクラウドAIの現実的な代替となる時代を見据えた戦略的な連携だ。

GPUのアイドル時間を60%削減——16のオープンソースRLライブラリから学ぶ非同期強化学習の設計

強化学習(RL)の訓練において、推論と学習を別々のGPUプールに分離する「非同期RLアーキテクチャ」が主流となりつつある。Hugging Faceのチームが16の主要オープンソースライブラリを7つの観点で徹底比較し、その設計パターンと今後の課題を明らかにした。

H CompanyがHolotron-12Bを公開——ハイブリッドSSMアーキテクチャで推論スループット2倍超を実現したコンピューターユースAIエージェント

H CompanyはNVIDIA Nemotron-Nano-2をベースとした12Bパラメータのマルチモーダルモデル「Holotron-12B」を公開した。ハイブリッドSSM(State-Space Model)アーキテクチャにより、単一H100 GPU上で従来モデル比2倍以上の推論スループットを達成している。コンピューターユースエージェント向けに設計された本モデルはHugging Faceで公開中だ。

Hugging Faceオープンソース現状報告 Spring 2026:ユーザー1300万人・モデル200万件突破、地殻変動が続くAIエコシステム

Hugging Faceが2026年春版のオープンソースAIエコシステム現状報告を公開した。ユーザー数・モデル数・データセット数がいずれも約2倍に増加し、Fortune 500企業の30%以上がHugging Faceに登録するなど、大企業の参入が加速している。米国・中国の二強体制に変化は見られないものの、中国モデルの台頭やNVIDIAの貢献度の高さが新たなトレンドとして浮上している。

1日以内でドメイン特化の埋め込みモデルを構築する方法——NVIDIAが公開したRAG改善レシピ

NVIDIAとHugging Faceが、汎用埋め込みモデルをドメイン特化モデルにファインチューニングする完全なパイプラインを公開した。単一GPUで1日以内に完了し、手動ラベリング不要の合成データ生成を活用。AtlassianのJIRAデータセットでの検証では、Recall@60が26%向上した。

量子コンピュータが医療問題を解決できるか?500万ドルをかけた世界初の実証コンペが決着へ

量子コンピューティングの実用性を医療分野で証明することを目指す30ヶ月間のコンペ「Quantum for Bio(Q4Bio)」がいよいよ最終審査を迎える。6チームが競い合い、最大500万ドル(約7億5000万円)の賞金をかけて量子アルゴリズムの実力を問われる。現時点では古典コンピュータとの「ハイブリッド」活用が現実解として浮上している。

FitbitのAIヘルスコーチが医療記録を読み込めるように——Googleが新機能を発表

Googleは、FitbitのAIヘルスコーチに医療記録を連携させる新機能を発表した。来月から米国ユーザー向けにプレビュー提供が始まり、コレステロール値や処方薬などの情報をもとに、よりパーソナライズされた健康アドバイスが受けられるようになる。ただし、診断・治療目的での使用は意図されていないと明示されている。

Adobe Firefly、自前の作品でAIをトレーニングできる「カスタムモデル」を公開ベータ提供開始

AdobeはAI画像生成サービス「Firefly」に、ユーザー自身のアートワークでモデルをトレーニングできる「カスタムモデル」機能を追加し、公開ベータを開始した。クリエイターやブランドが自社の視覚的スタイルを維持したまま大量のコンテンツを生成できる。学習データは非公開で、Adobeの汎用Fireflyモデルの学習には使用されない。