キーワード:OpenAI DevDay 2025, ChatGPTアプリケーションプラットフォーム, GPT-5 Pro, Sora 2, AgentKit, AIエージェント開発, CodeMender, 連続思考マシン, ChatGPT Apps SDK, Agent Builderビジュアルビルダー, GPT-Realtime-Mini音声モデル, Gemini Deep Think技術, CTMニューロダイナミクス

🔥 注目

OpenAI DevDay 2025 主要発表:ChatGPTがアプリケーションプラットフォームに、AgentKitがエージェント開発を強化 : OpenAIは2025年度開発者会議で複数の重要な進展を発表し、ChatGPTが週間アクティブユーザー数8億人に達し、APIが1分あたり60億Token以上を処理していることを明らかにした。主な発表には、開発者がChatGPT内でフル機能のアプリケーションを構築・実行できるようにするApps SDKが含まれ、ChatGPTを新しいオペレーティングシステムとして確立する。同時に、Agent Builder(ビジュアルビルダー)、ChatKit(カスタマイズ可能なチャットUI)、Guardrails(セキュリティモジュール)、Evals(評価ツール)を含むAgentKitをリリースし、AIエージェント開発を大幅に簡素化する。さらに、GPT-5 Pro、Sora 2/2 Proビデオ生成API、GPT-Realtime-Mini音声モデルも同時にリリースされ、Codexプログラミングツールは正式に一般公開され、SDKとエンタープライズ機能が新たに追加された。これらの更新は、AIアプリケーションエコシステムの深い統合と急速な拡大を予見させ、開発者エコシステムとユーザーエクスペリエンスに大きな影響を与えるだろう。
(来源: dotey, jerryjliu0, gdb, Yuchenj_UW, swyx, kevinweil, scaling01, scaling01, gdb, scaling01, scaling01, swyx, scaling01, gdb, gdb, op7418, TheRundownAI, OpenAIDevs, nickaturley, reach_vb, snsf, dotey, edwin)

OpenAI DevDay 2025 重磅发布:ChatGPT成为应用平台,AgentKit赋能智能体开发

Google DeepMindがCodeMenderを発表、AIがソフトウェアの脆弱性を自動修復 : Google DeepMindは、Gemini Deep Think技術を活用し、重要なソフトウェアの脆弱性を自動的に修正するAIエージェントCodeMenderを発表した。このエージェントは、人気のあるコードベースに72件の高品質な修正を提出し、メンテナーに承認・採用された。CodeMenderのリリースは、ソフトウェアセキュリティ分野におけるAIの重要なブレークスルーを示し、開発者が脆弱性を見つけて修正するのに必要な時間を大幅に短縮し、ソフトウェアサプライチェーンのセキュリティを向上させることが期待される。
(来源: Google, GoogleDeepMind)

Google DeepMind推出CodeMender,AI自动修复软件漏洞

Sakana AIの「Continuous Thought Machines」がNeurIPS 2025のフォーカス論文として採択 : Sakana AIは、その「Continuous Thought Machines (CTM)」がNeurIPS 2025のフォーカス論文として採択されたことを発表した。CTMは生物の脳を模倣したAIで、神経力学と同期メカニズムを利用して時間とともに思考し、内部マップを構築することで複雑な迷路を解決し、画像を凝視することで分類を行い、アルゴリズムを学習できる。この画期的な設計は、生物学的知能の模倣と複雑な問題解決におけるAIの可能性を示しており、将来のAIシステムがより強力な創発能力を持つ可能性を予見させる。
(来源: hardmaru, hardmaru)

Sakana AI的“连续思维机器”被NeurIPS 2025接收为焦点论文

ARCS V3が極めて少ないパラメータ数で抽象的推論のブレークスルーを達成 : ARCS V3はARC-AGI-2ベンチマークで90-98%の精度を達成し、そのパラメータ数はわずか19.9Mで、GPT-4の88,442分の1のサイズであり、Transformerアーキテクチャは採用していない。この成果は、大規模モデルへの業界の依存に異議を唱え、抽象的推論タスクにおいて、革新的なアーキテクチャ設計と手法により、極めて低いパラメータ数で優れた性能を達成できることを証明した。研究チームは、このブレークスルーが記憶ではなく真の推論能力を表していると強調し、包括的な検証ログとデモンストレーションビデオを提供している。
(来源: weights_biases)

ARCS V3以极小参数量实现抽象推理突破

Equilibrium Matching (EqM) がフローマッチングを簡素化し、それを凌駕して生成性能を向上 : Yilun Du氏らは、Equilibrium Matching (EqM)の研究を発表した。この手法はフローマッチングを簡素化し、それを凌駕し、ImageNet 256×256で1.96のFIDスコアを達成し、強力な生成性能を示した。EqMは、単一の静的EBM(エネルギーベースモデル)ランドスケープを学習することで生成を行い、これにより、シンプルな勾配ベースの生成プロセスを実現する。この進歩は、生成モデルにより効率的で高性能な代替手段を提供する。
(来源: VictorKaiWang1)

🎯 動向

OpenAIとAMDがMI450 GPUの導入で提携し、AIインフラ構築を加速 : OpenAIはAMDと数十億ドル規模のパートナーシップを締結し、来年から6ギガワットのAMD Instinct MI450 GPUを導入することを発表した。これは、AI計算に対する高まる需要を満たすためである。この提携は、世界のAIインフラ構築を大幅に加速させ、OpenAIのユーザーにより多くの計算リソースを提供するとともに、AMDにも多大な収益をもたらし、双方にとってWin-Winの関係を築く。
(来源: dejavucoder, jachiam0)

Google AI Proプランが大学生に無料アップグレードを提供 : Googleは、大学生がGoogle AI Proプランに1年間無料でアップグレードできることを発表した。このプランには、Gemini、NotebookLM、2TBのストレージスペースなどが含まれており、学生が宿題をこなし、複雑な概念を理解し、学習ガイドを作成し、文章力を向上させることを目的としている。この動きは、教育分野におけるAIツールの普及を促進し、学生の学習と研究を支援することが期待される。
(来源: Google)

Microsoft Copilotがメモリ機能を更新し、「忘れる」と「覚える」コマンドに対応 : Microsoft Copilotは記憶機能を更新し、ユーザーの指示に応じて特定の情報を「覚える」または「忘れる」ことができるようになった。ユーザーは設定でCopilotの記憶を管理でき、AIが支援を提供する際に、個別のニーズにより正確に対応できるようにすると同時に、不要な情報保持を回避する。この更新により、AIアシスタントのプライバシー保護とユーザーエクスペリエンスにおける柔軟性が向上した。
(来源: mustafasuleyman)

LlamaParseがAnthropic Claude Sonnet 4.5をサポートし、ドキュメント処理能力を強化 : LlamaParseは、AnthropicのClaude Sonnet 4.5モデルを統合したことを発表し、ユーザーにより強力なドキュメント理解および解析能力を提供する。今回の更新により、LlamaParseが複雑なドキュメントを処理する際の精度と効率が向上し、Sonnet 4.5と既存の解析オプションとの詳細なベンチマーク結果を公開する予定であると予告した。これは、その性能上の優位性を示すためである。
(来源: jerryjliu0)

HuggingFace Inference EndpointsがNvidia B200 GPUをサポート : HuggingFaceは、そのInference EndpointsがNvidia B200 GPUをサポートするようになったと発表した。このアップグレードは、開発者により強力な計算能力を提供し、大規模なAIモデルを実行・デプロイし、高まる計算需要に応える。この動きは、AIモデルの応用とイノベーションをさらに推進し、高性能AI