Anahtar Kelimeler:NVIDIA, AI fabrikası, AI altyapısı, OpenAI, GPT kapısı, Siri, AI bulut pazarı, NVIDIA AI kapasite dönüşümü, OpenAI model geçiş tartışması, Apple Siri AI yükseltmesi, Çin AI bulut pazarı rekabeti, AI yetenek savaşı

🔥 聚焦

NVIDIA重塑AI產業:從賣晶片到「賣AI產能」 : 英偉達CEO黃仁勳在最新訪談中指出,通用運算時代已終結,AI需求正經歷雙重指數級增長,推理需求預計將增長10億倍。英偉達正從晶片供應商轉型為「AI基礎設施夥伴」,透過與OpenAI等公司合作建設10GW級別的「AI工廠」,提供從晶片到軟體、系統、網路的「極致協同設計」,以實現最高的單位能耗效能。他強調,這種全棧優化能力是核心競爭壁壘,使英偉達在AI工業革命中佔據主導地位,並有望將AI基礎設施市場從4000億美元推向萬億美元規模。(來源:36氪, 36氪, Reddit r/artificial

黃仁勳:1000 億美元、10GW,從賣卡到“賣 AI 產能”

OpenAI「GPT門」事件引爆:付費用戶被秘密降級與模型切換 : OpenAI被指控秘密將用戶對話路由至未公開的「安全」模型(gpt-5-chat-safety和5-a-t-mini),尤其在偵測到情感或敏感內容時。這一行為,由AIPRM首席工程師證實並引發廣泛用戶回饋,導致模型效能下降,且用戶在不知情或未同意的情況下被切換模型。儘管OpenAI副總裁稱其為臨時安全測試,但此舉引發了對透明度、用戶自主權和潛在詐欺行為的強烈質疑,促使大量用戶取消訂閱並呼籲制定「AI用戶權利」。 (來源:36氪, 36氪, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT

OpenAI「GPT門」事件引爆,Plus、Pro帳戶統統降級,偷換模型全網實錘

蘋果押注2026 Siri重生:系統級AI與第三方模型融合 : 蘋果正透過內部ChatGPT類應用「Veritas」和「Linwood」系統,全面重塑Siri,目標是實現上下文感知對話和深度應用互動。iOS 26.1測試版程式碼顯示,蘋果正為App Intents引入MCP(模型上下文協定)支援,這將允許ChatGPT、Claude等相容AI模型直接與Mac、iPhone和iPad應用互動。此舉標誌著蘋果從「全棧自研」轉向「平台化路線」,透過整合第三方模型,在確保隱私和用戶體驗一致性的同時,加速其AI生態發展,預計新版Siri將於2026年初亮相。(來源:36氪, 36氪

iOS 26.1 隱藏彩蛋曝光,蘋果給 ChatGPT 們造了個新「C 口」

Hinton預言落空:AI未取代放射科醫師,反而使其更忙 : 2016年,AI之父Geoffrey Hinton曾預測AI將在五年內取代放射科醫師,建議停止培訓。然而,近十年過去,美國放射科醫師數量和平均年薪(高達52萬美元)均創歷史新高。AI在實際臨床場景中效能下降、法律監管阻力以及僅覆蓋醫師工作一小部分是主要原因。這體現了「傑文斯悖論」:AI提升影像解讀效率反而增加了對醫師進行監督、溝通和非診斷任務的需求,使他們工作量更大,而非被取代。(來源:36氪

Hinton預言錯了,年薪狂飆52萬美元,AI沒有「幹掉」放射科醫師

🎯 動向

DeepMind Veo 3發布「幀鏈」概念,推動視訊模型通用視覺理解 : DeepMind的Veo 3視訊模型引入了「幀鏈」(CoF)概念,類比大型語言模型的思維鏈(CoT),使其能進行零樣本視覺推理。Veo 3展現出強大的感知、建模和操控視覺世界的能力,有望成為機器視覺領域的「通用基礎模型」。研究預測,隨著模型能力快速提升和成本下降,視訊模型領域「通才將取代專才」,預示著視訊生成和理解進入快速發展的新階段。(來源:36氪, shlomifruchter, scaling01, Reddit r/artificial

DeepMind率先提出CoF:視訊模型有自己的思維鏈

ChatGPT Pulse上線:AI從被動問答轉向主動服務 : OpenAI為ChatGPT Pro用戶推出「Pulse」功能,標誌著ChatGPT從被動問答工具向主動預測用戶需求的私人助理進化。Pulse透過每晚的「非同步研究」,結合用戶聊天記錄、記憶和外部應用(如Gmail、Google Calendar),在清晨推送個性化「每日簡報」。這代表了OpenAI在「智慧主體AI」領域的重要佈局,旨在讓AI助理理解用戶目標並在無提示下主動提供服務,開創人機互動新範式。(來源:36kr

ChatGPT“開竅”了,新Pulse功能上線,你的AI不再坐等指令

強化學習之父Sutton:大型語言模型是錯誤的起點 : 強化學習之父Richard Sutton在訪談中提出,大型語言模型(LLM)是通向真正智慧的錯誤起點。他認為,真正的智慧源於「經驗學習」,即透過行動、觀察與回饋持續修正行為以實現目標,而LLM的預測能力僅是對人類行為的模仿,缺乏獨立目標和對外部世界變化的「驚訝」能力。這一觀點引發了對AGI(通用人工智慧)發展路徑的深刻辯論,質疑當前LLM主導的AI典範。(來源:36kr, paul_cal, algo_diver, scaling01, rao2z, bookwormengr, BlackHC, rao2z

強化學習之父:大型語言模型是一個錯誤的起點

中國AI雲市場競爭白熱化:阿里云領跑,火山引擎高速追趕 : 2025年中國「AI雲」市場競爭激烈,阿里云在整體營收規模上保持領先,涵蓋AI IaaS、PaaS、MaaS。然而,字節跳動旗下的火山引擎在MaaS(模型即服務)Token呼叫市場佔據主導地位,市場份額接近半壁江山,並以驚人增速成為阿里云最大的競爭對手。百度智能雲則在AI公有雲服務(軟體產品和解決方案)市場與阿里云並列第一。市場呈現多維度競爭態勢,Token呼叫量呈指數級增長,預示著未來AI雲市場的巨大增量空間和格局重塑。(來源:36氪

中國AI雲市場,究竟誰是「第一」?

AI人才爭奪戰升級:高薪與H-1B簽證挑戰並存 : AI人才市場持續火爆,小鵬汽車宣布2026年招聘超3000名應屆生,最高年薪達160萬,優秀者上不封頂。Meta為吸引頂尖AI人才開出超2億美元的天價薪酬總包,英偉達和OpenAI也透過收購和股權激勵搶奪人才。然而,美國H-1B簽證政策的收緊(如新增10萬美元費用)對外國高技能人才留在矽谷構成挑戰,引發科技巨頭對人才流失的擔憂,凸顯了全球AI人才競爭的激烈與複雜性。(來源:36氪, 36氪

H-1B 設定10萬美元門檻,華人留在矽谷更難了

🧰 工具

Zhipu AI GLM-4.5-Air:高性價比工具呼叫模型 : Zhipu AI的GLM-4.5-Air模型(106B參數,12B活躍參數)在工具呼叫方面表現出色,接近Claude 4的水平,但成本降低90%。該模型在推理階段顯著減少幻覺,提高了工具呼叫的可靠性,使深度研究工作流更加穩定高效,為開發者提供了高性價比的LLM解決方案。(來源:bookwormengr

bookwormengr

KAT-Dev-32B:專為軟體工程任務設計的32B參數模型 : KAT-Dev-32B是一款32B參數模型,專注於軟體工程任務。它在SWE-Bench Verified基準測試中取得了62.4%的解決率,效能與不同規模的開源模型相比位列第五,展現了開源LLM在程式碼生成、偵錯和開發工作流方面的顯著進步。(來源:_akhaliq

_akhaliq

GPT-5:多智能體系統卓越的協調者 : GPT-5被譽為多智能體系統的出色協調者,尤其適用於編碼以外的領域,如客戶支援。它能深入理解意圖、高效處理大量數據並填補資訊空白,使其在管理複雜的多檢索系統中表現卓越。與Claude 4(因成本)和Gemini 2.5 Pro相比,GPT-5(包括GPT-5-mini)在一致性和工具呼叫準確性方面更勝一籌,為開發高級智能體系統提供了強大支援。(來源:omarsar0

omarsar0

騰訊混元HunyuanImage 3.0:開源文生圖大型模型新標竿 : 騰訊混元團隊發布HunyuanImage 3.0,一款參數超800億的開源文生圖模型,推理時激活130億參數。該模型採用Transfusion-based MoE架構,深度耦合Diffusion和LLM訓練,使其具備強大的世界知識推理、複雜千字級提示理解及圖像內精準文本生成能力。HunyuanImage 3.0旨在革新平面設計和內容創作流程,並計畫未來支援圖生圖、圖像編輯等多模態互動。(來源:nrehiew_, jpt401

HunyuanImage 3.0: Largest & Most Powerful Open-Source Text-to-Image Model

DRAG框架:提升RAG模型對詞彙多樣性的理解 : ACL 2025提出Lexical Diversity-aware RAG(DRAG)框架,首次將「詞彙多樣性」引入RAG的檢索與生成過程。DRAG將查詢語義拆分為不變、可變和補充成分,並採用差異化策略進行相關性評估和風險稀疏校準。該方法顯著提升了RAG準確率(如HotpotQA上提升10.6%),刷新多項基準SOTA,對資訊檢索和問答系統具有重要價值,使其能更精準地理解複雜人類語言。(來源:量子位

讓RAG真正讀懂「言外之意」!新框架引入詞彙多樣性,刷新多項基準SOTA

騰訊混元Hunyuan3D-Part:業界首個高品質原生3D組件生成模型 : 騰訊混元3D團隊推出Hunyuan3D-Part,業界首個能生成高品質、語義可分解3D組件的模型。該模型透過原生3D分割模型P3-SAM和工業級組件生成模型X-Part,實現了高保真、結構一致的3D部件生成。此突破對視訊遊戲製作管線和3D列印產業具有重要意義,能將複雜幾何體拆分為簡單組件,大大降低下游處理難度,並支援模組化組裝。(來源:量子位

業界首個高品質原生3D組件生成模型來了!來自騰訊混元團隊

TinyWorlds:300萬參數復刻DeepMind世界模型,實現即時互動像素遊戲 : X博主anandmaj在一個月內復刻DeepMind Genie 3核心思想,開發出TinyWorlds。這款僅300萬參數的世界模型能即時生成可玩的像素風格遊戲環境,如Pong、Sonic、Zelda和Doom。它透過時空變換器和視訊分詞器捕捉視訊資訊,實現了可互動的像素世界生成,展現了小規模模型在即時世界生成領域的巨大潛力,並支援程式碼開源。(來源:36氪

大神爆肝一個月,復刻DeepMind世界模型,300萬參數就能玩即時互動像素遊戲

OpenWebUI原生支援MCP:LLM工具整合新範式 : OpenWebUI最新更新原生支援Model Context Protocol (MCP) 伺服器,用戶現在可以整合HuggingFace MCP等外部工具。這一功能標準化了LLM與外部數據源和工具的連接方式,擴展了AI應用生態系統,使用戶能在OpenWebUI介面中更靈活、高效地利用各種AI工具。(來源:Reddit r/LocalLLaMA, Reddit r/OpenWebUI

Native MCP now in Open WebUI!

LangChain與Oxylabs合作:建構AI驅動的網頁抓取方案 : LangChain與Oxylabs發布指南,展示如何結合LangChain的智慧與Oxylabs的抓取基礎設施,建構AI驅動的網頁抓取解決方案。該方案支援多語言和多種整合方法,使AI代理能夠克服IP封鎖和驗證碼等常見網頁訪問挑戰,從而實現更高效的即時數據檢索,賦能代理工作流。(來源:LangChainAI

LangChain + Oxylabs Guide

開源LLM評估工具Opik:全面監控與偵錯AI應用 : Opik是一款新發布的開源LLM評估工具,旨在幫助開發者偵錯、評估和監控LLM應用、RAG系統和智能體工作流。它提供全面的追蹤、自動化評估和生產級儀表板,為改進AI系統效能和可靠性提供關鍵洞察。(來源:dl_weekly

📚 學習

Cursor Learn:免費AI基礎視訊課程 : Cursor Learn推出免費六部分AI基礎視訊課程,專為初學者設計,涵蓋Token、上下文和智能體等核心概念。課程包含測驗和互動AI模型,旨在在一小時內提供AI基礎知識,包括智能體協作和上下文管理等高級主題,是AI入門的寶貴資源。(來源:cursor_ai, op7418

Cursor Learn

精選AI/ML GitHub程式碼庫:涵蓋PyTorch、TensorFlow等框架 : GitHub上分享了一系列精選AI/ML程式碼庫,包含PyTorch、TensorFlow、FastAI等多個深度學習框架的實踐筆記本。這些資源覆蓋了電腦視覺、自然語言處理、GANs、Transformer、AutoML和目標偵測等領域,為學習者和實踐者提供了豐富的學習材料,助力技術探索和專案開發。(來源:Reddit r/deeplearning

A curated set of AI/ML GitHub repos — PyTorch, TensorFlow, FastAI, Object Detection and more

免費電子書:《Python數據結構初階》 : 一本名為《A First Course on Data Structures in Python》的免費電子書現已發布。該書提供了AI和機器學習所需的基本建構模組,包括數據結構、演算法思維、複雜度分析、遞迴/動態規劃和搜尋方法,是學習AI基礎知識的寶貴資源。(來源:TheTuringPost

TheTuringPost

LLM科學家與資料科學家路線圖發布 : 針對LLM科學家和資料科學家職業發展,發布了詳細的路線圖。這些資源概述了進入或提升人工智慧、機器學習和資料科學領域所需的技能、工具和學習路徑,為有志者提供了清晰的職業規劃指導。(來源:Ronald_vanLoon, Ronald_vanLoon

Ronald_vanLoon

A16Z Speedrun 2026:AI與娛樂領域創業加速器 : A16Z Speedrun 2026正在接受AI與娛樂領域創業者的申請。該專案為專注於創建自己企業的創始人提供支援,是希望在快速發展的AI驅動產品領域發展的創業者的一次機會。(來源:yoheinakajima

💼 商業

MiniMax版權訴訟案:AI獨角獸上市之路蒙陰影 : 估值超40億美元的中國AI獨角獸MiniMax正面臨迪士尼、環球影業和華納兄弟的聯合版權訴訟。訴訟指控其視訊生成工具「海螺AI」透過用戶提示生成包含受版權保護角色的內容,構成系統性侵權。這起案件對MiniMax的IPO計畫構成毀滅性打擊,凸顯了生成式AI市場中智慧財產權合規的嚴峻挑戰,以及技術創新與法律底線平衡的重要性。(來源:36氪

版權訴訟下的MiniMax:AI獨角獸的上市迷途

AI物流公司Augment獲8500萬美元融資,上線五個月總融資達8億人民幣 : AI物流公司Augment在上線僅五個月後,成功完成8500萬美元A輪融資,總融資額達1.1億美元(約8億人民幣)。其AI代理產品Augie能夠自動化從訂單接收到收款的整個物流生命週期中的複雜、碎片化任務,已為數十家頂級第三方物流公司和託運人管理超過350億美元的貨值,並為客戶節省數百萬美元,展現了AI在優化勞動密集型物流領域的強大商業價值。(來源:36氪

AI物流火了,上線5個月,拿下8億融資

微軟將Anthropic的Claude模型整合至Copilot : 微軟為企業用戶在其Copilot助手中整合了Anthropic的Claude Sonnet 4和Opus 4.1模型。此舉旨在降低對OpenAI的單一依賴,並鞏固微軟作為中立平台提供商的地位。企業用戶現在可以在OpenAI和Anthropic模型之間進行選擇,增強了靈活性,並有望推動企業AI市場的競爭。(來源:Reddit r/deeplearning

🌟 社區

AI對人類理解與社會的影響:效率與「資訊繭房」的悖論 : 社區普遍擔憂AI可能像社群媒體一樣,負面影響人類的理解力、批判性思維和人生目標。透過將內容生成優化為「傳播」而非「真相」或「深度」,AI可能導致「學習高原期」和「無限的糟粕機器」。這引發了關於如何引導AI發展走向成長型工具而非成癮型工具的討論,呼籲在監管、行業實踐和文化規範方面進行轉變。(來源:Reddit r/ArtificialInteligence, Reddit r/artificial, Reddit r/ArtificialInteligence, Yuchenj_UW, colin_fraser, Teknium1, cloneofsimo

AI在職場:效率提升與「隱性剝削」的矛盾 : AI融入職場,尤其對執行層員工而言,正產生悖論:效率提升往往伴隨著更高的產出預期,而員工並未獲得相應回報。這種「隱性剝削」將員工變為AI生成內容的「人工品管員」,增加了認知負荷和焦慮。AI提升了企業生產力,但收益更多流向資本,加劇了戰略管理者與工具依賴型執行者之間的「認知鴻溝」,若不重構組織結構,可能導致普遍倦怠。(來源:36氪, glennko, mbusigin

AI時代「提問力」的價值超越「執行力」 : 在AI驅動的世界中,真正的競爭優勢從執行速度轉向「提問力」——即識別哪些問題值得解決的能力。過度依賴AI進行執行而缺乏批判性問題定義,可能導致高效解決錯誤問題,產生虛假的進步感。設計思維、同理心映射和持續質疑被認為是AI無法取代的關鍵人類技能,能夠幫助個人和組織有效利用AI,專注於解決有意義的挑戰。(來源:36氪

AI地緣政治:中美AI競賽與國際監管爭議 : 中美AI競賽被視為一場馬拉松,而非短跑,中國在機器人應用方面可能領先。美國被敦促關注實用AI投資,而非僅追求超級智慧,但其拒絕了聯合國層面的國際AI監管,強調國家主權。這凸顯了AI發展與國家安全、貿易政策(如H-1B簽證)以及AI基礎設施和人才競爭交織的複雜地緣政治格局。(來源:Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, adcock_brett, Dorialexander, teortaxesTex, teortaxesTex, teortaxesTex, brickroad7, jonst0kes

Emad Mostaque預測「最後的經濟」:AI將重塑人類價值 : Stability AI前CEO Emad Mostaque預測,未來1000天內AI將徹底重塑經濟結構,人類勞動力價值可能歸零甚至為負。他提出「MIND框架」(物質、智力、網路、多樣性)來衡量經濟健康,認為AI帶來的「智力資本」過剩,要求重新評估其他資本的重要性。這一「第四次反轉」將使AI取代認知勞動,需要建立「以人為本」的新型貨幣和通用基礎AI以應對社會轉型。(來源:36氪

Stability AI前CEO驚人預測:人類智力價值歸零,只剩1000天

AI硬體競賽:OpenAI、字節跳動與Meta爭奪消費級設備市場 : OpenAI、字節跳動和Meta等科技巨頭正積極投入消費級AI硬體研發。Meta的Ray-Ban AI眼鏡已取得顯著銷量,而OpenAI據報與蘋果供應商合作開發「無螢幕智慧音箱」,字節跳動則在研發AI智慧眼鏡。這場競賽預示著AI將更深入地融入日常生活,各公司正探索多樣化的產品形態和互動模式,以期在環境感知AI領域佔據先機。(來源:36氪

張一鳴和奧特曼都得學小扎

AI Agent:從人機協作到「人機委託」的範式轉變 : AI行業正迎來從人機協作到「人機委託」的「溫和拐點」,自主AI Agent將大規模執行複雜任務。AI在「打穿程式設計」方面的突破預示其能攻克所有半開放系統。這種轉變將催生「無人公司」組織形態,人類角色從微觀執行轉向宏觀治理,側重價值觀注入、系統架構設計和宏觀導航,並由AI Copilot輔助決策,而非直接干預高速運行的AI系統。(來源:36氪

接近溫和拐點,AI將迎來比撒手速度的週期

AI衝擊外語專業:學生需培養「外語+」複合技能 : AI翻譯技術的崛起正深刻影響外語專業,導致傳統語言類職位需求下降,多所高校撤銷相關專業。外語學生面臨轉型壓力,需從單一語言技能轉向「外語+」複合模式,如「外語+AI」從事自然語言處理,「外語+國際傳播」等。這促使外語教育改革,強調跨文化理解和綜合能力,而非單純的翻譯訓練,以適應AI時代對語言人才的新需求。(來源:36氪, Reddit r/ClaudeAI

GPU價格高企:AI需求驅動與本地LLM優化 : 社區普遍擔憂GPU價格持續高企,認為主要原因是AI資料中心需求的激增和通貨膨脹。許多人認為,除非AI泡沫破裂或客製化晶片大規模普及,否則價格難以顯著下降。然而,為應對此挑戰,社區正努力優化本地LLM效能,如AMD MI50在llama.cpp/ggml中表現優於NVIDIA P40,以及利用iGPU進行基礎LLM任務,以降低本地AI運算成本。(來源:Reddit r/LocalLLaMA, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA

46 GB GPU compute for $20.

💡 其他

LLM擴展的「收益遞減幻覺」與長週期任務 : 研究表明,雖然單輪基準測試可能顯示LLM進展放緩,但模型規模擴展在長週期任務執行上仍帶來非遞減的改進。「收益遞減幻覺」源於單步準確率的微小提升,卻能帶來超指數級的長週期任務完成度提升。長週期任務中的順序運算優勢是並行測試無法比擬的,這表明持續的模型擴展和強化學習訓練對實現高級智能體行為至關重要。(來源:scaling01

scaling01

能量基Transformer (EBT) 提升下一詞元預測效能 : 研究人員推出了能量基Transformer (EBT),透過「能量」評分候選下一詞元,並迭代式地透過梯度步長降低能量進行驗證和選擇。在4400萬參數的實驗中,EBT在四項基準測試中的三項上優於同等規模的傳統Transformer,表明這種新穎的詞元選擇方法有望提升LLM效能。(來源:DeepLearningAI

DeepLearningAI

AI機器人進展:人形銷售員與無訓練自主行走機器狗 : 小鵬汽車在展廳部署了人形汽車銷售員「鐵蛋」,展示了AI在面向客戶機器人領域的應用。此外,一款「具有動物反射能力」的機器狗無需訓練即可在樹林中行走,凸顯了自主機器人技術在模仿生物運動和感知方面的進步。這些發展預示著AI在實體機器人領域的複雜性和實際應用日益增長。(來源:Ronald_vanLoon, Ronald_vanLoon

Ronald_vanLoon