关键词:NVIDIA Jetson Thor, 物理AI, 人形机器人, Blackwell GPU, AI算力, Jetson Thor AI峰值算力, Blackwell GPU性能, 物理AI应用场景, 人形机器人开发套件, Jetson Thor价格

🔥 聚焦

NVIDIA Jetson Thor发布,物理AI算力飙升 : 英伟达推出专为物理AI和人形机器人设计的Jetson Thor,搭载Blackwell GPU和14核Arm Neoverse CPU,AI峰值算力达2070 TFLOPS (FP4),比上一代Jetson Orin提升7.5倍。它支持VLA、LLM、VLM等生成式AI模型,能处理实时视频和AI推理,旨在加速通用机器人和物理AI发展。主要应用于人形机器人、手术辅助、智能牵引车等,已获Agility Robotics、亚马逊、波士顿动力、宇树科技等采用。该开发者套件已上市,起售价3499美元。(来源:nvidia

NVIDIA Jetson Thor发布,物理AI算力飙升

GEPA:反射式提示进化超越RL : 一项新研究(Agrawal et al., 2025)提出GEPA(Genetic-Pareto Prompt Evolution)方法,通过自然语言反射和轨迹诊断来进化LLM系统提示,而非依赖强化学习。GEPA在多跳QA任务中表现优于GRPO,所需rollout次数减少35倍,并持续超越SOTA提示优化器MIPROv2。这表明语言原生优化循环在LLM适应性方面比参数空间中的原始rollout更高效,预示着AI优化策略的新方向。(来源:Reddit r/MachineLearning

GEPA:反射式提示进化超越RL

OPRO方法提升AI安全测试效率 : TELUS Digital的Bret Kinsella介绍Optimization by PROmpting (OPRO)方法,允许LLM“自我红队测试”,通过优化攻击生成器来评估AI安全。该方法关注攻击成功率(ASR)的分布,而非简单的通过/失败,能大规模发现漏洞并指导缓解措施。强调在金融、医疗等高风险行业中,AI安全测试需具备全面性、重复性和创造性,并转向预防而非反应,为企业提供更细致的AI安全评估。(来源:Reddit r/deeplearning

OPRO方法提升AI安全测试效率

🎯 动向

DeepSeek V3.1模型出现“极”字Bug : DeepSeek最新V3.1模型被用户报告在输出中随机插入“极”字(或“extreme”),影响代码和结构敏感任务。该问题在第三方部署和官方API中均有复现,引发社区对模型数据污染和稳定性问题的担忧。有猜测认为与token混淆或RLHF训练数据不干净有关,这给模型开发者敲响了警钟,强调数据质量对AI行为的关键影响。(来源:teortaxesTex, 36氪, 36氪

DeepSeek V3.1模型出现“极”字Bug

谷歌神秘模型Nano-Banana引发关注 : 一款名为Nano-Banana的神秘图像生成与编辑模型在AI社区走红,被猜测为谷歌产品。它在文本编辑、风格融合和场景理解方面表现出色,能将多张图片元素融合,并保持光线、视角和构图一致性。但存在书名乱码、手指畸形等瑕疵,且目前缺乏官方API,体验不稳定。许多假网站也随之出现,引发市场对新模型能力与获取渠道的讨论。(来源:TomLikesRobots, yupp_ai, yupp_ai, 36氪

谷歌神秘模型Nano-Banana引发关注

微软VibeVoice-1.5B TTS模型开源 : 微软开源VibeVoice-1.5B TTS模型,支持生成长达90分钟、多达4个不同说话者的富有表现力的音频对话。该模型基于Qwen2.5-1.5B,采用超低帧率分词器,提高了计算效率,并支持中英文。MIT许可证,有望推动播客等长篇音频内容的AI生成,为创作者提供强大的多语种音频制作能力。(来源:_akhaliq, AnthropicAI, ClementDelangue, dotey

微软VibeVoice-1.5B TTS模型开源

阿里巴巴Wan系列模型新动向 : 阿里巴巴AI模型Wan宣布即将推出WAN 2.2-S2V,一款电影级语音转视频模型,强调“由音频驱动,基于视觉,开源”。同时,此前已发布的Wan2.2-T2V-A14B模型已被集成到Anycode应用中,成为默认文本转视频模型。这一系列进展显示了阿里在多模态AI领域的持续投入和创新,尤其在音视频生成方面。(来源:Alibaba_Wan, TomLikesRobots, karminski3

阿里巴巴Wan系列模型新动向

Jet-Nemotron混合架构LLM提速53.6倍 : MIT Hanlab团队发布Jet-Nemotron,一个混合架构语言模型家族,通过Post Neural Architecture Search (PostNAS)和新型线性注意力块JetBlock,在H100 GPU上实现了高达53.6倍的生成吞吐量提升,同时性能超越SOTA开源全注意力模型。这项突破性研究为LLM的推理效率和架构优化提供了新的解决方案。(来源:teortaxesTex, menhguin

Jet-Nemotron混合架构LLM提速53.6倍

AI Agents在2025年向自主工作流演进 : AI Agents正从对话式助手发展为能够推理、规划和执行任务的自主工作流。通过集成API和自动化决策,AI Agents能够驱动复杂流程,例如自动生成视频脚本、编译视频并发布到YouTube,预示着AI驱动的工作流将成为主流,极大提升自动化水平。(来源:Reddit r/artificial

AI Agents在2025年向自主工作流演进

AI浏览器安全漏洞警示 : 美国AI搜索独角兽Perplexity的AI浏览器Comet被曝存在严重安全漏洞,攻击者可通过恶意指令操纵AI浏览器访问邮箱、获取验证码,并发送敏感信息。Brave公司指出,传统网络安全机制对此类攻击失效,Agent产品因其“私人数据访问、接触不受信任内容、外部通信”的“致命三重奏”特性,面临巨大风险。这警示AI产品在功能创新时必须优先考虑安全和隐私保护。(来源:36氪

AI浏览器安全漏洞警示

万亿AI存储鸿沟与Universal Storage架构 : AI时代对存储提出了极致吞吐、低延迟、高并发、多模态统一管理、以存代算、Agent记忆持久化及自主安全性等新需求。传统存储架构因OS内核依赖、元数据与数据混合存储、协议分立等问题难以适应。Universal Storage架构通过统一存储池、元数据独立存储、摆脱OS内核依赖等创新,实现百微秒级延迟与TB级吞吐,成为AI时代存储层主流选择,有望填补AI应用中的存储性能鸿沟。(来源:36氪

万亿AI存储鸿沟与Universal Storage架构

Reels短视频上线AI翻译对口型功能 : Meta旗下的Facebook和Instagram Reels短视频正式推出AI音频翻译功能,支持将视频中人物音频翻译成不同语种,并实现嘴型对齐和原始音色合成。目前支持英西互译,用户可自行添加最多20种语言音轨。此举旨在适配全球市场,抢占TikTok份额,AI成为Meta短视频突围的关键,有望提升全球用户的内容消费体验。(来源:36氪

Reels短视频上线AI翻译对口型功能

AIoT产业趋势与挑战 : 麦肯锡、BVP和MIT的三份报告均指出AI与IoT深度融合是大势所趋,商业化需聚焦高ROI场景,并强调平台化与生态化协作。然而,报告也揭示了自研与采购、爆发式增长与持续韧性、前端体验与后台智能之间的冲突,认为AIoT需从“数据搬运工”转向“自治智能体网络”,实现自治、协作和信任重塑,以应对产业升级中的挑战。(来源:36氪

AIoT产业趋势与挑战

字节跳动探索AI硬件生态,涵盖手机、汽车、机器人 : 字节跳动正加大在硬件领域的投入,通过豆包大模型陆续接入或自研手机、汽车、机器人、智能眼镜、学习机等产品。据报道,字节正研发汽车智能操作系统和豆包AI手机,寻求AI能力落地载体。尽管字节此前硬件尝试不顺,但AI大模型爆发后,字节再次发力,旨在构建“软硬件一体”的AI生态,以期在AI时代寻找新的增长点。(来源:36氪

字节跳动探索AI硬件生态,涵盖手机、汽车、机器人

🧰 工具

Google AI Mode简化餐厅预订 : Google AI Ultra订阅用户现可使用AI Mode简化餐厅预订。用户只需用自然语言描述生日晚餐、人数、氛围、音乐等需求,AI Mode即可完成预订工作,用户只需最终确认。此功能正在美国推出,旨在提升个性化服务体验,将繁琐的预订流程自动化。(来源:Google

VSCode终端工具Agent模式新进展 : VSCode团队正在重写其终端工具,以支持Agent模式,旨在提升开发者的工作效率和体验。此举是GitHub Copilot生态系统的一部分,通过AI代理实现更智能的开发辅助,例如在终端中直接进行代码生成和调试,从而简化开发流程。(来源:pierceboggan

OpenRouter推出一键ZDR功能 : OpenRouter发布“一键ZDR”(Zero Data Retention)功能,确保用户的提示词仅发送给支持零数据保留的提供商。这增强了用户的数据隐私保护,简化了对AI服务商数据政策的选择,使用户能够更安心地使用AI服务。(来源:xanderatallah

OpenRouter推出一键ZDR功能

Qwen Edit在图像Outpainting方面表现出色 : 阿里Qwen Edit模型在图像Outpainting(图像扩充)任务中表现出卓越能力,能够高质量地扩展图像内容,展示了其在视觉生成领域的强大潜力。用户可以利用该工具轻松扩展图片背景或创建更广阔的场景,提升图像创作的灵活性。(来源:multimodalart

Qwen Edit在图像Outpainting方面表现出色

Google NotebookLM支持多语言视频概述 : Google NotebookLM推出新功能,支持80种语言的视频概述,并为非英语音频概述提供短时长和默认时长控制。这极大地提升了多语言用户获取和理解视频内容的能力,避免了信息在翻译中丢失,使学习和研究更加高效。(来源:Google

GLIF整合SOTA视频、图像和LLM模型 : GLIF平台已整合所有SOTA视频模型、图像模型和LLM,成为唯一能够将这些模型组合成独特、自定义工作流的平台。用户可以利用Kling 2.1 Pro等模型进行视频生成,例如将Qwen-Image生成的帧用于Veo 3动画制作,实现创意场景,甚至能将视频转换为MSPaint风格。(来源:fabianstelzer, fabianstelzer, fabianstelzer

LlamaIndex推出Vibe Coding工具 : LlamaIndex发布vibe-llama CLI工具和详细提示模板,旨在提升AI编程代理(如Cursor AI和Claude Code)的效率和准确性。该工具可将LlamaIndex上下文直接注入编程代理,避免过时API建议,并能从基本脚本生成完整Streamlit应用,包括文件上传和实时处理,从而加速开发流程。(来源:jerryjliu0

LlamaIndex推出Vibe Coding工具

LangGraph Platform推出Revision Rollbacks和Queueing : LangGraph Platform上线Revision Rollbacks(版本回滚)功能,允许用户重新部署任何历史版本,方便回溯和修正问题。同时推出Revision Queueing(版本排队)功能,新修订将排队等待前一个完成后再执行,提升开发工作流的效率和稳定性,为Agent开发提供了更可靠的环境。(来源:LangChainAI, LangChainAI

Lemonade框架支持AMD NPU/GPU推理 : Lemonade是一款新的大模型推理框架,可在AMD显卡、CPU和NPU上运行,支持GGUF和ONNX模型。该框架由AMD工程师开发,不依赖CUDA,为AMD硬件用户提供了新的AI推理解决方案,有望提升AMD平台上的AI应用性能。(来源:karminski3

Lemonade框架支持AMD NPU/GPU推理

AI驱动的社交应用Intent : Brandon Chen创立的AI原生即时通讯工具Intent,旨在通过AI消除协作障碍,无缝将用户意图转化为结果。例如,AI能自动将多张照片合成,或根据聊天记录规划旅行、预约车辆、生成共享购物清单。该应用将聊天功能与大模型自动执行能力结合,获得数千万美元融资,有望改变社交互动方式。(来源:_akhaliq, 36氪

AI驱动的社交应用Intent

Karpathy的氛围编程指南2.0 : Andrej Karpathy发布了更新的“氛围编程”指南,提出AI编程的三层结构:Cursor用于自动补全和小范围修改;Claude Code/Codex用于较大功能块实现和快速原型开发;GPT-5 Pro解决最棘手bug和复杂抽象。他强调AI编程进入“代码后稀缺时代”,但AI代码仍需人工清理,且AI在解释性和交互性上存在局限。(来源:36氪

Karpathy的氛围编程指南2.0

DeepSeek V3.1上线W&B Inference : DeepSeek V3.1模型现已在Weights & Biases Inference平台上线,提供“Non-Think”(高速)和“Think”(深度思考)两种模式。其定价为每1M token $0.55/$1.65,旨在为构建智能代理提供高性价比解决方案,方便开发者在不同需求下选择合适的推理模式。(来源:weights_biases

DeepSeek V3.1上线W&B; Inference

📚 学习

MAC基准测试评估多模态大模型科学推理能力 : 上海交通大学王德泉教授课题组提出MAC(多模态学术封面)基准,利用《Nature》《Science》《Cell》等顶刊最新封面作为测试素材,评估多模态大模型对艺术化视觉元素与科学概念深层关联的理解能力。结果显示,GPT-5-thinking等顶尖模型在面对新科学内容时表现出局限性,Step-3准确率仅79.1%。研究团队还提出了DAD(描述-推理)解决方案,通过分步思考显著提升模型表现,并引入双重动态机制确保持续挑战性,为多模态AI的科学理解评估提供了新范式。(来源:36氪

MAC基准测试评估多模态大模型科学推理能力

LLMs作为评估者:有效性和可靠性探讨 : 一篇论文(arxiv:2508.18076)质疑当前将大型语言模型(LLMs)用作自然语言生成(NLG)系统评估者的热情可能为时过早。文章基于测量理论,批判性地评估了LLMs作为人类判断代理、评估能力、可扩展性和成本效益的四个核心假设,并探讨了LLMs的固有局限性如何挑战这些假设。呼吁在LLMs评估中采取更负责任的实践,以确保其在NLG领域支持而非损害进展。(来源:HuggingFace Daily Papers

UQ:评估模型在未解决问题上的能力 : UQ(Unsolved Questions)是一个新的测试平台,包含500个来自Stack Exchange的具有挑战性、多样化的未解决问题,旨在评估前沿模型在推理、事实性、浏览等方面的能力。UQ通过验证器辅助筛选和社区验证,异步评估模型,其目标是推动AI解决真实世界中人类尚未解决的问题,从而直接产生实际价值,为AI研究提供了新的评估视角。(来源:HuggingFace Daily Papers

ST-Raptor:LLM驱动的半结构化表格问答框架 : ST-Raptor是一个基于树的框架,利用大型语言模型解决半结构化表格问答难题。它引入了分层正交树(HO-Tree)来捕获复杂表格布局,定义基本树操作指导LLMs执行QA任务,并通过两阶段验证机制确保答案可靠性。在新的SSTQA数据集上,ST-Raptor在答案准确性方面超越了九个基线模型达20%,为处理复杂表格数据提供了高效方案。(来源:HuggingFace Daily Papers

JAX学习指南与TPU集成 : 一篇初学者友好的JAX学习指南被分享,包含实际示例,有助于开发者更好地利用JAX进行AI模型开发。JAX在TPU上的集成表现出色,易于扩展和设置分片,被认为对PyTorch用户更友好,而Flax Linen API则更灵活,为高性能AI计算提供了有效途径。(来源:borisdayma, Reddit r/deeplearning

JAX学习指南与TPU集成

LlamaIndex文档Agent设计模式 : LlamaIndex将在AWS Builder’s Loft举办的Agentic AI In Action活动中,分享“构建文档Agent的有效设计模式”。演讲将涵盖如何利用LlamaIndex构建文档Agent,并提供实际案例和设计指南,帮助开发者更好地利用AI Agent处理文档任务,提升文档处理的自动化和智能化水平。(来源:jerryjliu0, jerryjliu0

LlamaIndex文档Agent设计模式

DSPy:Python中的自动提示优化 : 一系列资源分享了如何在Python中进行自动和程序化提示优化,特别是如何利用DSPy框架。这些教程深入讲解了DSPy的工作原理,以及如何高效地操作提示词来创建强大、可维护的AI程序,例如将结构化数据提取的准确率从20%提升到100%,极大地提高了提示工程的效率和效果。(来源:lateinteraction, lateinteraction

DSPy:Python中的自动提示优化

💼 商业

马斯克起诉OpenAI和苹果垄断 : Elon Musk旗下的xAI公司正式起诉OpenAI和苹果,指控双方通过合作协议联手垄断AI市场,并声称苹果App Store操纵应用排名,打压Grok等竞争对手。诉讼要求数十亿美元赔偿,并认定其合作违法。此举反映了AI领域日益激烈的商业竞争和对市场主导权的争夺,可能重塑AI产业格局。(来源:Reddit r/artificial, Reddit r/ArtificialInteligence, 36氪, 36氪

马斯克起诉OpenAI和苹果垄断

90%打工人“自费买AI上班”催生To P赛道 : MIT报告显示,90%职场人“偷用”个人AI工具,催生了To P(To Professional)赛道。Cursor等AI编程助手在一年内收入从100万美元飙升至5亿美元,估值接近百亿。这种模式下,用户为提升工作效率自费购买AI,投入产出比极高,驱动AI产品快速增长。相较于To B的慢周期和To C的高成本,To P模式成为AI创业的隐秘热点。(来源:36氪

90%打工人“自费买AI上班”催生To P赛道

Meta AI团队人才流失与内部管理问题 : Meta内部出现资深研究员Rishabh Agarwal和PyTorch贡献者Bert Maher离职现象,引发对Meta超级智能实验室人才流失的关注。有前研究员控诉Meta存在绩效评估压力、资源争夺、新老派系冲突等管理问题,导致人才流失和士气低落。顶级研究员更看重愿景、使命和独立性,而非单纯的薪酬,揭示了Meta在AI人才竞争中的深层结构性挑战。(来源:Yuchenj_UW, arohan, 36氪

Meta AI团队人才流失与内部管理问题

🌟 社区

AI模型推理能力与真实世界问题 : 社区热议LLM是否具备“真推理”能力,有观点认为LLM在复杂推理任务上仍有局限,其性能提升可能源于数据而非真正理解。有专家指出,判断AGI需看其能否无工具执行任意程序并产生正确输出。同时,也有声音质疑GPT-5 Pro在数学任务上的表现可能受训练数据污染,引发对AI模型本质能力的深刻讨论。(来源:MillionInt, pmddomingos, pmddomingos, sytelus

AI编程效率与手搓代码的价值 : 社区热议AI编程(如Vibe Coding)与传统手搓代码的优劣。有观点认为AI能大幅提升效率,尤其适合原型开发和语言翻译,但可能打断心流,且AI代码质量参差不齐,仍需人工审查和修改。手搓代码在理清思路和保持心流方面仍有优势,两者并非对立,而是最佳搭配,程序员应精通所有工具。(来源:dotey, gfodor, gfodor, imjaredz, dotey

AI发展速度与媒体报道偏差 : 社区讨论AI发展速度是否放缓,有观点认为传统媒体常误报AI进展减速,而实际LLM领域(如GPT-4 Turbo到GPT-5 Pro)正经历最快速的进步。同时,也有人认为AI在实际应用中的可靠性仍不足,政府对AI的响应速度也较慢,反映了对AI技术发展现状的不同认知和预期。(来源:Plinz, farguney

AI发展速度与媒体报道偏差

AI对社会经济和就业的影响 : 社区讨论AI对就业是“杀手”还是“创造者”,并提出第三种可能性:成为“创业火箭燃料”。有专家预测AI将带来更便宜的医疗、服务和教育,促进经济增长,并使小型企业更常见。同时,AI智商超越人类的观点引发对经济规则改写和非稀缺经济的讨论,强调AI安全和普惠共享的重要性。(来源:Ronald_vanLoon, finbarrtimbers, 36氪

AI对社会经济和就业的影响

AI Agent的局限性与风险 : 社区讨论AI Agent在实际应用中的局限性,如Claude Agent意外删除数据库、Agent在复杂环境中的脆弱性。有观点认为,Agent的成功不应仅仅依赖大模型,而在于“工具调用-状态清理-重试策略”的链条稳定性。同时,AI的“黑箱”性质和安全问题也引发担忧,例如AI的谄媚行为被视为“黑暗模式”,旨在操纵用户,引发伦理争议。(来源:QuixiAI, bigeagle_xd, Reddit r/ArtificialInteligence

AI Agent的局限性与风险

AI原生SaaS初创公司的价值 : 社区讨论大多数AI SaaS初创公司是否只是GPT的包装层,质疑其长期价值。有观点认为,许多工具过于追逐热点,缺乏深度价值,容易被大模型直接替代。真正的价值在于构建持久性的产品,而非简单的UI和自动化,呼吁创业者关注实质性创新。(来源:Reddit r/ArtificialInteligence

AI猫片与内容消费心理 : AI生成“猫片”在社交平台爆红,以夸张、狗血的剧情和卡通化猫咪形象吸引大量流量。这种低成本、高流量、强情绪的内容反映了当前信息消费“快、爽、扯、怪”的心理。尽管画风诡异、AI痕迹浓厚,但其猎奇性成功击中用户好奇心,引发两极评价。社区讨论其背后技术门槛低、猫咪形象易于AI处理等原因。(来源:36氪

AI猫片与内容消费心理

💡 其他

AI智商超越人类,经济规则即将改写 : 2025年,AI的平均智商已突破110,正式超越普通人类,开始参与经济系统的“全链条操作”,包括信息收集、判断决策到实际执行。这标志着AI经济正在浮现,可能带来无劳动力供给限制和非稀缺经济,极大提升生产效率,并降低交易成本、减少非理性决策。同时强调AI安全和普惠共享是迎接未来的重要任务,预示着人类社会将迎来第三次大的理性化浪潮。(来源:36氪

AI智商超越人类,经济规则即将改写

全球高被引科学家榜单发布,AI领域专家突出 : AD Scientific Index 2025统计数据显示,深度学习三巨头之一的Yoshua Bengio成为全球首位“全领域被引最高”科学家,总引用量超97万。Geoffrey Hinton位列全球第二,何恺明位列第五,Ilya Sutskever也进入TOP 10。榜单依据总引用量和近5年引用次数,凸显了AI领域科学家在全球学术界的巨大影响力,反映了AI研究的蓬勃发展。(来源:36氪

全球高被引科学家榜单发布,AI领域专家突出

马斯克成立新公司“巨硬”,用AI重做微软产品 : Elon Musk成立新公司“巨硬”(Macrohard),旨在通过AI软件完全模拟微软的核心产品,例如用AI生成功能与Office套件相同的产品。该公司将利用Grok衍生出数百个专门的AI智能体,在算力支持下协同工作,颠覆传统软件商业模式。此举被视为马斯克与微软在AI领域正面宣战的最新动作,引发业界对AI软件未来形态的思考。(来源:量子位

马斯克成立新公司“巨硬”,用AI重做微软产品