关键词:OpenAI DevDay 2025, ChatGPT应用平台, AgentKit, AI智能体开发, GPT-5 Pro, Sora 2, CodeMender, 连续思维机器, ChatGPT Apps SDK, Agent Builder可视化构建器, GPT-Realtime-Mini语音模型, Gemini Deep Think技术, CTM神经动力学

🔥 聚焦

OpenAI DevDay 2025 重磅发布:ChatGPT成为应用平台,AgentKit赋能智能体开发 : OpenAI在2025年度开发者大会上公布了多项重大进展,宣布ChatGPT已拥有8亿周活跃用户,API每分钟处理超过60亿Token。核心发布包括Apps SDK,使开发者能在ChatGPT内构建和运行全功能应用,将ChatGPT打造为新的操作系统。同时推出AgentKit,包含Agent Builder(可视化构建器)、ChatKit(可定制聊天UI)、Guardrails(安全模块)和Evals(评估工具),大幅简化AI智能体开发。此外,GPT-5 Pro、Sora 2/2 Pro视频生成API及GPT-Realtime-Mini语音模型也同步上线,Codex编程工具正式通用,并新增SDK和企业功能。这些更新预示着AI应用生态的深度融合与快速扩张,将深刻影响开发者生态和用户体验。
(来源: dotey, jerryjliu0, gdb, Yuchenj_UW, swyx, kevinweil, scaling01, scaling01, gdb, scaling01, scaling01, swyx, scaling01, gdb, gdb, op7418, TheRundownAI, OpenAIDevs, nickaturley, reach_vb, snsf, dotey, edwin)

OpenAI DevDay 2025 重磅发布:ChatGPT成为应用平台,AgentKit赋能智能体开发

Google DeepMind推出CodeMender,AI自动修复软件漏洞 : Google DeepMind发布了CodeMender,这是一款利用Gemini Deep Think技术自动修补关键软件漏洞的AI代理。该代理已成功向流行的代码库提交了72个高质量修复,并被维护者接受和采纳。CodeMender的推出标志着AI在软件安全领域的重要突破,有望大幅减少开发者寻找和修复漏洞所需的时间,提升软件供应链的安全性。
(来源: Google, GoogleDeepMind)

Google DeepMind推出CodeMender,AI自动修复软件漏洞

Sakana AI的“连续思维机器”被NeurIPS 2025接收为焦点论文 : Sakana AI宣布其“连续思维机器”(Continuous Thought Machines, CTM)被NeurIPS 2025接收为焦点论文。CTM是一种模仿生物大脑的AI,利用神经动力学和同步机制随时间进行思考,能够通过构建内部地图解决复杂迷宫、通过凝视图像进行分类,并学习算法。这一突破性设计展示了AI在模仿生物智能和解决复杂问题方面的潜力,预示着未来AI系统可能具备更强的涌现能力。
(来源: hardmaru, hardmaru)

Sakana AI的“连续思维机器”被NeurIPS 2025接收为焦点论文

ARCS V3以极小参数量实现抽象推理突破 : ARCS V3在ARC-AGI-2基准测试中实现了90-98%的准确率,而参数量仅为19.9M,比GPT-4小88,442倍,且未采用Transformer架构。这一成果挑战了行业对大规模模型的依赖,证明了在抽象推理任务中,通过创新的架构设计和方法,可以在极低参数量下实现卓越性能。研究团队强调,这一突破代表了真正的推理能力而非记忆,并提供了全面的验证日志和演示视频。
(来源: weights_biases)

ARCS V3以极小参数量实现抽象推理突破

Equilibrium Matching (EqM) 简化并超越流匹配,提升生成性能 : Yilun Du等人分享了Equilibrium Matching (EqM)研究,该方法简化并超越了流匹配,在ImageNet 256×256上实现了1.96的FID分数,展现出强大的生成性能。EqM通过学习单个静态EBM(基于能量的模型)景观进行生成,从而实现了一种简单的基于梯度的生成过程。这一进展为生成模型提供了更高效、更高性能的替代方案。
(来源: VictorKaiWang1)

🎯 动向

OpenAI与AMD合作部署MI450 GPU,加速AI基础设施建设 : OpenAI宣布与AMD建立数十亿美元的合作伙伴关系,将从明年开始部署6吉瓦的AMD Instinct MI450 GPU,以满足对AI计算日益增长的需求。此次合作将显著加速全球AI基础设施的建设,为OpenAI的用户提供更多计算资源,同时也为AMD带来可观的收入,实现双方共赢。
(来源: dejavucoder, jachiam0)

Google AI Pro计划向大学生提供免费升级 : Google宣布,大学生可免费升级至Google AI Pro计划,为期一年。该计划包含Gemini、NotebookLM和2TB存储空间等,旨在帮助学生完成作业、理解复杂概念、创建学习指南和改进写作。此举有望促进AI工具在教育领域的普及,赋能学生学习与研究。
(来源: Google)

Microsoft Copilot更新内存功能,支持“忘记”与“记住”指令 : 微软Copilot更新了其记忆功能,现在能够根据用户指令“记住”或“忘记”特定信息。用户可以在设置中管理Copilot的记忆,确保AI在提供帮助时能更精准地响应个性化需求,同时避免不必要的信息保留。这一更新提升了AI助手在隐私保护和用户体验方面的灵活性。
(来源: mustafasuleyman)

LlamaParse现已支持Anthropic Claude Sonnet 4.5,增强文档处理能力 : LlamaParse宣布已集成Anthropic的Claude Sonnet 4.5模型,为用户提供更强大的文档理解和解析能力。此次更新将提升LlamaParse在处理复杂文档时的准确性和效率,并预告将发布Sonnet 4.5与现有解析选项的详细基准测试结果,以展示其性能优势。
(来源: jerryjliu0)

HuggingFace Inference Endpoints现已支持Nvidia B200 GPU : HuggingFace宣布其推理端点(Inference Endpoints)现在支持Nvidia B200 GPU。这一升级为开发者提供了更强大的计算能力,以运行和部署大型AI模型,满足日益增长的计算需求。此举将进一步推动AI模型的应用和创新,降低高性能AI