Anahtar Kelimeler:AI ajan, insansı robot, büyük model, AIGC, Microsoft 365 Copilot, DeepMind sanayi meyve sineği modeli, AI akademik makale istismarı, OpenAI açık kaynak modeli, AI ilaç ticarileştirme, uç birim büyük model akıllı kabin, MCP protokolü AI ekosistemi, AI çizim teknikleri

🔥 聚焦

微軟發布AI智慧體及2025工作趨勢報告:微軟推出Microsoft 365 Copilot重大更新,引入Researcher、Analyst等AI智慧體,旨在將AI從工具提升為「AI同事」。新功能包括Notebook(整合Web+Work+Pages)、綜合搜尋(跨應用及第三方來源)和Create(整合GPT-4o圖像生成)。同時發布的2025工作趨勢報告預測,「前沿公司」將湧現,這類公司圍繞「按需智能」構建,由「人機混合」團隊支援,員工需具備「智慧體老闆思維」。報告預示AI將在未來幾年深刻重塑工作模式和組織架構,強調AI智慧體將成為核心生產力。(來源: 新智元)

微軟發布AI智慧體及2025工作趨勢報告

DeepMind模擬果蠅登Nature封面:Google DeepMind與HHMI Janelia研究所合作,利用AI和物理模擬技術創建了一個高度逼真的虛擬果蠅模型。該模型基於高解析度掃描資料,在MuJoCo物理引擎中構建,並加入了流體動力學和足部黏附模擬。透過深度強化學習和模仿學習(利用真實果蠅行為影片),AI神經網路成功驅動虛擬果蠅模擬複雜的飛行與行走行為,甚至包括視覺導航。該研究不僅揭示了生物運動背後的複雜機制,也為神經科學和機器人學提供了強大的研究平台。模型和程式碼已開源,推動相關領域研究。(來源: 新智元)

DeepMind模擬果蠅登Nature封面

Nature揭露AI在學術論文中的濫用現象:Nature頭版文章指出,大量學術論文(Academ-AI追蹤器已記錄超700篇)在未聲明的情況下使用AI(如ChatGPT)撰寫,甚至包含「我是一個AI語言模型」等明顯痕跡。更令人擔憂的是,一些出版商(如Elsevier)被發現悄悄刪除了這些AI痕跡而未發布勘誤,引發對科學誠信的擔憂。研究人員呼籲作者明確披露AI的具體使用方式,出版商應建立更嚴格的審查機制並公開更正記錄,以維護學術研究的透明度和可信度。(來源: 新智元)

Nature揭露AI在學術論文中的濫用現象

OpenAI預測營收高速增長並計劃重組,引發爭議:OpenAI預計到2029年總營收將達1250億美元,智慧體等新業務收入將超越ChatGPT。同時,公司計劃重組為公益公司(PBC),此舉引發AI教父Hinton及10名前員工等人的公開反對。反對者認為重組會削弱非營利組織的控制權,違背確保AGI安全開發和造福人類的初衷,將商業利益置於慈善使命之上。他們呼籲OpenAI解釋重組如何符合其使命,並要求保留非營利組織的治理保障。(來源: 智東西, 騰訊科技, 學術頭條)

OpenAI預測營收高速增長並計劃重組,引發爭議

🎯 動向

人形機器人成上海車展焦點,車企加速佈局:2025上海車展上,人形機器人成為新亮點。小鵬展示了能與人互動的機器人IRON,並計劃2026年量產用於工廠;奇瑞展出自研的Mornine gen-1,具備多模態感知和問答能力;上汽榮威、長安深藍等也展出合作或引入的機器人用於引流。特斯拉、廣汽、比亞迪(自研及投資智元、帕西尼)等車企也在加速人形機器人研發與應用,看好其在工業製造、服務等領域的潛力。儘管前景廣闊,但行業尚處早期,存在市場不確定性和泡沫化風險。(來源: NBD汽車)

人形機器人成上海車展焦點,車企加速佈局

吉林省加碼機器人產業,推動汽車與機器人技術融合:老牌汽車大省吉林正積極佈局機器人產業。星網宇達、一汽富維與吉林省仿生機器人創新中心簽署戰略合作協議,共同研發具身智能、大模型等。該創新中心由吉林大學牽頭,旨在構建完整的機器人產業鏈。此舉利用了吉林省成熟的汽車供應鏈基礎(零部件與機器人技術重疊度高),並順應了國家及地方(深圳、北京)對具身智能產業的大力支持政策。機器人技術,特別是與自動駕駛相通的部分,被視為汽車產業智能化後的新機遇。(來源: 科創板日報)

吉林省加碼機器人產業,推動汽車與機器人技術融合

全球首部AIGC長片電影《海上女王鄭一嫂》登陸院線:這部70分鐘的電影全程使用AI製作,講述了傳奇女海盜鄭一嫂的故事,並在新加坡上映。製作方面臨諸多挑戰:AI難以處理長對白和複雜鏡頭調度,易生成重複或不連貫畫面;人物形象一致性難以保證,出現「撞臉」或「變臉」問題,需人工後期修復。劇本創作、分鏡和剪輯仍需人類主導,AI尚不能完全理解歷史細節和創作意圖。儘管存在局限,AIGC顯著降低了製作門檻和成本,尤其利好新團隊,展示了人機協作在影視製作中的潛力與未來方向。(來源: 深響)

全球首部AIGC長片電影《海上女王鄭一嫂》登陸院線

OpenAI推出輕量版Deep Research功能並向免費使用者開放:OpenAI宣布推出由o4-mini驅動的輕量版深度研究(Deep Research)功能,旨在提供接近完整版的智能水平,但回覆更簡潔、成本更低。該功能已向Plus、Team、Enterprise、Edu及免費使用者開放。付費使用者在用盡完整版額度後會自動切換至輕量版。實測顯示,輕量版速度快但資訊深度和信源引用不如完整版,處理複雜任務時表現欠佳,更像提供思路而非完整報告。完整版則能進行深度搜尋和分析,生成結構化報告,但仍有改進空間。(來源: APPSO, 量子位, gdb)

OpenAI推出輕量版Deep Research功能並向免費使用者開放

Google I/O 2025前瞻:AI原生與XR融合:即將於5月20日舉行的Google I/O 2025預計將重點展示AI與多裝置協同。Android 16將深度整合Gemini大模型,使其成為系統原生能力,並開放更多API給開發者。視覺上將採用Material 3 Expressive設計語言,並強化對平板、可穿戴及XR裝置的適配。備受關注的Android XR作業系統將首次亮相,該系統同樣以Gemini為核心互動引擎,旨在連接現實與虛擬。Google AI眼鏡和與三星合作的Project Moohan MR裝置預計也會登場,展示Google在AI助理和開放XR生態方面的佈局。(來源: 雷科技)

Google I/O 2025前瞻:AI原生與XR融合

月之暗面Kimi內測內容社群功能以應對競爭:面對DeepSeek等模型的衝擊,月之暗面正為其AI助理Kimi內測內容社群功能。該社群目前處於灰度測試階段,內容主要由AI抓取生成,並邀請垂直領域頻道號入駐,具備點讚、評論等互動功能。此舉被視為月之暗面在應用層面的創新,旨在透過內容生態構建差異化優勢,以應對DeepSeek在技術層面帶來的競爭壓力。此前Kimi憑藉長文本處理能力和市場推廣一度成為C端AI市場的明星產品,但隨後被DeepSeek和騰訊元寶等在使用者量上超越。(來源: 司庫財經)

月之暗面Kimi內測內容社群功能以應對競爭

OpenAI計劃今夏發布新開源模型:據TechCrunch報導,OpenAI計劃在今年夏天發布一款新的開源大語言模型,採用寬鬆許可,允許免費下載和商業化使用。該模型旨在性能上超越Meta的Llama和DeepSeek的現有開源模型,並可能包含一個「接力」(handoff)功能,即當開源模型遇到難題時,可調用OpenAI的雲端大模型協助處理。此舉被視為OpenAI在開源策略上的重大轉變,旨在吸引開發者、增強競爭力並完善其AI生態。(來源: 智東西)

OpenAI計劃今夏發布新開源模型

MCP協議推動AI Agent生態發展,但面臨商業挑戰:MCP(Model Communication Protocol)協議旨在標準化AI模型與外部工具/服務的互動,簡化整合複雜度(從M×N到M+N),被譽為AI應用的「USB-C接口」。Manus Agent的成功演示和OpenAI等巨頭(阿里、騰訊、百度等國內廠商也已跟進)對MCP的支持,極大地推動了其普及和Agent生態的發展。然而,各廠商在擁抱MCP的同時,往往構建「全閉環」生態(如阿里雲整合高德地圖、騰訊雲接入微信讀書),保護自身資料和生態優勢,這可能導致生態碎片化,限制MCP成為真正通用標準。未來Agent生態可能呈現「有限開放」格局,MCP作為「生態連接器」而非唯一標準。(來源: 產業家)

MCP協議推動AI Agent生態發展,但面臨商業挑戰

大模型價格戰持續,百度李彥宏稱DeepSeek「慢且貴」:百度發布文心4.5 Turbo和X1 Turbo模型,強調其性價比優於DeepSeek。李彥宏指出,DeepSeek不僅能力受限(文本處理為主),且調用成本高、速度慢。文心4.5 Turbo定價低於DeepSeek V3優惠時段,X1 Turbo定價與DeepSeek R1優惠時段持平但遠低於其標準時段。字節豆包、Google Gemini Flash等新模型也紛紛以低價策略應對。然而,文章指出僅靠性價比不足以取勝,DeepSeek的成功關鍵在於其思維鏈等技術創新帶來的獨特體驗。國內模型商業變現途徑相對單一(API收費),而國外(如OpenAI)則有C端訂閱等多元模式。(來源: 直面AI)

大模型價格戰持續,百度李彥宏稱DeepSeek「慢且貴」

AI製藥行業十年沉浮,面臨商業化與技術挑戰:AI製藥行業發展十餘年,旨在透過AI提高藥物研發效率、降低成本。FDA近期取消動物實驗要求,利好AI建模等替代方法。行業經歷過資本熱潮(2021年高峰),但隨著部分管線在臨床階段失敗(如BenevolentAI)和資本退潮,行業進入調整期。明星公司如晶泰科技(AI+CRO)上市後拓展至AI+新材料等領域尋求更快商業化回報;英矽智能則堅持「自研管線+License Out」模式,已達成數項授權合作。行業仍面臨資料獲取難(藥企核心資料不共享)、演算法驗證週期長、缺乏上市藥物等挑戰。但AlphaFold、生成式AI等技術突破正帶來新希望,行業期待首款AI研發藥物成功上市的「奇點」。(來源: 億歐網)

AI製藥行業十年沉浮,面臨商業化與技術挑戰

面壁智能端側大模型驅動智能座艙,十個月實現量產上車:面壁智能推出由其端側大模型MiniCPM驅動的智能座艙助理cpmGO,已在長安馬自達新車上實現量產,僅用時10個月。cpmGO純本地運行,保障資料隱私,實現毫秒級響應,且不受網路限制。其具備多模態感知(視覺、語音、UI)和互動能力,支援「可見即可說」操作,內建純端側GUI Agent可理解並執行螢幕操作。面壁智能已與高通、聯發科、英特爾、中科創達等多家晶片及Tier1廠商合作,推動端側AI在汽車領域的應用,旨在解決雲端方案的成本、延遲和隱私痛點,實現更流暢、安全的智能座艙體驗。(來源: 量子位)

面壁智能端側大模型驅動智能座艙,十個月實現量產上車

上海科學智能研究院利用AI驅動多領域科研範式變革:上智院攜手復旦大學等高校,依託CFFF智算平台(40 PFlop/s算力),利用AI推動生命科學、氣象、材料、醫學、氣候、人文社科等領域的研究。成果包括:「扶搖」氣象大模型實現公里級、秒級城市天氣預報;「女媧」生命大模型加速siRNA藥物研發;「燧人」物質大模型探索新材料與藥物發現;與中山醫院合作研發「觀心CardioMind」心血管專科大模型;PI@Climate氣候大模型整合多學科知識應對氣候變化;VI-CNOPs演算法優化颱風路徑概率預報;中華文明大模型助力考古、古文字研究;以及在聯邦學習、多模態、圖學習等基礎AI技術上的突破,共同構建開放協作的科學智能生態。(來源: 量子位)

上海科學智能研究院利用AI驅動多領域科研範式變革

🧰 工具

史丹佛大學開源AI報告生成工具Storm:Storm是一個能自動進行網路搜尋、整合資訊並生成類似維基百科風格結構化報告的AI工具。使用者輸入一個主題,Storm會模擬研究人員的工作流程:規劃研究大綱、查找相關資訊來源、整合資訊並撰寫報告。這對於需要快速撰寫背景報告、文獻綜述或深度分析的使用者非常有幫助。專案已在GitHub開源,並提供線上試用版本。(來源: karminski3)

史丹佛大學開源AI報告生成工具Storm

開源知識圖譜框架Graphiti發布:Graphiti是一個能夠將使用者互動、結構化/非結構化資料及外部資訊持續整合到可查詢知識圖譜中的框架。其特點是支援增量更新和高效檢索,無需重新計算整個圖譜,特別適合需要上下文感知和歷史追溯的互動式AI應用開發。該專案在GitHub上已獲得較高關注度(4.4K Star)。(來源: karminski3)

開源知識圖譜框架Graphiti發布

Lovable 2.0更新,提升AI網站建構體驗:AI網站建構工具Lovable發布2.0版本,增加了多人協作編輯、自動安全掃描、10倍智能提升的聊天代理、直接在應用內編輯程式碼的開發模式以及自訂域名支援等功能。同時更新了品牌形象和UI設計,旨在提供更強大、安全、協作性更好的AI驅動網站開發體驗。(來源: op7418)

字節跳動「即夢」影片模型升級,提升多鏡頭一致性:字節跳動的影片生成工具「即夢」發布了3.0模型更新。根據使用者分享的案例,新模型在單次生成多鏡頭影片時,展現出優秀的角色和場景一致性,並且這種一致性效果可以穩定複現。該模型支援文生影片和圖生影片兩種模式,顯著提升了AI影片創作的實用性和品質。(來源: op7418)

WAN Video進入商業化階段,仍提供免費服務:AI影片生成平台WAN Video宣布進入商業化階段,但同時推出了免費的「Relax mode」,提供無限制的免費生成次數。使用者分享的案例展示了其生成樂高士兵戰爭場景的效果,雖然提示詞要求較高,但結果尚可。這為使用者提供了免費體驗和使用AI影片生成能力的機會。(來源: dotey)

WAN Video進入商業化階段,仍提供免費服務

MiniMax TTS接入MCP-Server,簡化多模態應用開發:MiniMax將其強大的中文TTS(文本轉語音)及語音克隆能力,連同文生圖/影片、圖生影片等工具,透過開源的MCP-Server(Model Communication Protocol Server)提供服務。使用者可在Cursor等支援MCP的客戶端中輕鬆調用這些工具,實現如分角色有聲小說生成、馬斯克音色克隆講故事等創意應用。MCP協議簡化了AI模型與工具的整合,降低了開發門檻。(來源: 袋鼠帝AI客棧)

MiniMax TTS接入MCP-Server,簡化多模態應用開發

EasyDoc:專為RAG優化的智能文件解析引擎:EasyDoc提供API服務,用於解析PDF、Word、PPT等文件,輸出適合LLM處理的JSON格式。其優勢在於能智能識別內容塊、分析文件層次結構(保留父子關係),並深度解讀表格和圖片內容(提供結構化資料和語義理解),有效解決RAG應用中文件預處理的痛點,如複雜圖文混排、表格提取不準等問題。提供Lite、Pro、Premium三種模式及免費試用額度,支援私有化部署。(來源: AI進修生)

EasyDoc:專為RAG優化的智能文件解析引擎

Dyad:本地化、開源的AI應用建構器:Dyad是一款免費、開源、可在本地運行的AI應用建構工具,定位為v0、Lovable、Bolt等平台的替代品。它允許使用者在本地電腦上進行開發,便於與IDE(如Cursor)結合使用。最新版本增加了對Ollama的整合,支援使用本地大語言模型進行建構。使用者可以利用免費API密鑰(如Gemini)進行開發。(來源: Reddit r/LocalLLaMA)

Dyad:本地化、開源的AI應用建構器

📚 學習

無問芯穹分享AI Infra趨勢與實踐:無問芯穹首席解決方案架構師劉川林在AI Partner大會上分享了AI基礎設施的趨勢與實踐。他指出,隨著預訓練資料趨於耗盡,強化學習(如DeepSeek R1範式)成為模型性能提升的關鍵,這對Infra提出了新挑戰。無問芯穹依託軟硬結合優化能力,構建了支援多元異構國產晶片的算力平台,並透過自研訓練框架、優化通訊效率、動態資源分配等方式,適應LLM和MoE模型訓練需求,為生數科技等多模態模型訓練提供支援。同時,針對推理場景,優化了DeepSeek R1部署,並透過基於ComfyUI的接口化服務解決AIGC流量波動問題,降低AI應用成本。(來源: 36氪)

無問芯穹分享AI Infra趨勢與實踐

達摩院開源DyDiT架構:算力減半,視覺生成品質無損:達摩院等機構在ICLR 2025提出動態架構DyDiT,旨在優化DiT(Diffusion Transformer)模型的推理效率。DyDiT能根據生成過程的時間步長和圖像的空間區域動態調整計算資源分配,在簡單步驟或背景區域減少計算量。實驗表明,僅需少量微調成本,DyDiT可將DiT-XL模型的推理FLOPs減少51%,速度提升1.73倍,同時保持生成圖像品質(FID指標)幾乎不變。該方法已開源,並計劃適配更多文生圖/影片模型。(來源: 量子位)

達摩院開源DyDiT架構:算力減半,視覺生成品質無損

UniToken:融合理解與生成的統一視覺編碼方案:復旦大學與美團提出UniToken框架,旨在解決多模態大模型中圖文理解與圖像生成任務間的表示割裂和訓練干擾問題。UniToken透過融合連續(SigLIP)和離散(VQ-GAN)兩種視覺編碼器,為下游任務提供一套兼備高層語義和底層細節的統一視覺表示。採用多階段訓練策略(視覺語義對齊、多任務聯合訓練、指令微調)並結合細粒度視覺增強技術(AnyRes、ViT微調),UniToken在多個基準測試中取得了SOTA或接近SOTA的性能。程式碼和模型已開源。(來源: 量子位)

UniToken:融合理解與生成的統一視覺編碼方案

清華等提出測試時強化學習TTRL:針對現有測試時縮放(TTS)技術在面對新資料分佈時泛化能力有限,以及測試時訓練(TTT)缺乏獎勵訊號的問題,清華大學和上海AI Lab提出TTRL。該方法能在無標註資料的情況下,利用模型自身的先驗知識,透過多數投票等方式生成偽標籤和獎勵訊號,對LLM進行強化學習。實驗表明,TTRL能在多種任務上持續提升模型性能,如將Qwen-2.5-Math-7B在AIME 2024上的pass@1指標提升159%,性能接近有監督訓練的模型。(來源: AINLPer)

清華等提出測試時強化學習TTRL

上交大&螞蟻提出混合注意力機制Rodimus:為解決Transformer推理時KV緩存帶來的高時空複雜度問題,上海交大與螞蟻集團提出Rodimus模型系列。該架構透過資料驅動的溫控選擇機制(DDTS)改進線性注意力的狀態更新,並結合滑動窗口共享鍵注意力(SW-SKA),有效融合了語義、Token和Head壓縮。Rodimus*在推理時能實現O(1)空間複雜度。基於此架構訓練的輕量級程式碼模型Rodimus+-Coder(1.6B和4B)在同規模下性能達到SOTA。論文已被ICLR 2025接收,程式碼已開源。(來源: AINLPer)

上交大&螞蟻提出混合注意力機制Rodimus*

RAG Agent部署的十大經驗教訓:Contextual AI創辦人Douwe Kiela分享了部署RAG Agent的經驗:1. 系統能力優先於模型性能;2. 內部專業知識是核心價值燃料;3. 處理大規模、含噪資料的能力是護城河;4. 生產環境落地遠難於試點;5. 速度勝於完美,快速迭代;6. 工程師時間寶貴,避免底層優化陷阱;7. 降低使用門檻,嵌入現有系統;8. 創造「驚嘆時刻」提升使用者黏性;9. 可觀測性(歸因、審計)比準確率更重要;10. 目標要遠大,敢於挑戰核心業務。(來源: AI覺醒)

RAG Agent部署的十大經驗教訓

💼 商業

英偉達收購Lepton AI後停止其營運:英偉達在收購由賈揚清、白俊傑創立的AI雲平台公司Lepton AI後,宣布將於2025年5月20日停止Lepton AI平台營運,並已停止新使用者註冊。賈揚清回應稱交易「不是人才收購」,但未透露更多細節。Lepton AI專注於提供AI模型開發、訓練、部署的雲服務及算力租賃,與英偉達部分客戶(如CoreWeave)存在競爭關係。此次收購及後續動作可能反映了英偉達試圖加強對AI供應鏈(從晶片到服務)的垂直整合,提升其在AI計算領域的主導地位。(來源: AI前線)

英偉達收購Lepton AI後停止其營運

AI Partner大會投資人圓桌:尋找AI超級應用的確定性:在36氪AI Partner大會上,金沙江聯合資本吳楠、上海產投鄒澤炯、創新工場任博冰等投資人探討了AI超級應用的投資邏輯。投資人認為,儘管底層技術和市場格局存在不確定性,但確定性機會存在於能解決實際問題、找到PMF並產生營收的垂類應用,如AI+醫療、AI+教育、自動駕駛等。創業公司面對大廠競爭,應深耕垂直領域,利用大廠難以覆蓋的細分場景和深度Know-How建立壁壘。同時,創業者需具備跨學科能力和高效決策能力,關注團隊建設和商業模式驗證。DeepSeek的成功啟示投資人關注技術驅動、有定力且能挖掘人才潛力的團隊。(來源: 36氪)

AI Partner大會投資人圓桌:尋找AI超級應用的確定性

資情留言板:AI與機器人領域資產交易資訊:36氪資情留言板發布第160期,包含多條AI和機器人相關資產的買賣資訊。轉讓資訊包括持有智元機器人、雲深處科技、沃飛長空(eVTOL相關)股份的基金LP份額。求購資訊包括字節跳動、銀河通用、宇樹科技、雲深處科技、智元機器人、摩爾線程、星動紀元等公司的股份。此外,還有人形機器人領域的普遍求購需求。這些交易線索反映了當前資本市場對AI、人形機器人、自動駕駛、半導體等硬科技領域頭部企業的濃厚興趣。(來源: 36氪)

國產Agent公司Manus AI獲超5億融資,估值翻5倍:據彭博社報導,通用AI Agent產品Manus的母公司蝴蝶效應(Butterfly Effect)完成7500萬美元(約5.5億人民幣)新融資,由矽谷風投Benchmark領投,投後估值達近5億美元。Manus Agent能自主執行訂票、分析股票等網頁任務,此前因高價內測碼引發關注。新融資將用於擴展服務至美、日、中東等市場,並計劃在日本設辦公室。儘管產品受追捧,但其依賴Anthropic Claude模型導致成本高昂(平均每任務2美元),且面臨伺服器容量限制。(來源: 智東西, 矽兔君)

國產Agent公司Manus AI獲超5億融資,估值翻5倍

塗鴉智能轉型AI Agent平台,搶灘AI硬體市場:AIoT雲平台塗鴉智能發布TuyaOpen開源框架、海德薇邊緣計算平台、Tuya.AI及升級版AI Agent開發平台,全面擁抱AI。公司認為AI大模型(尤其是多模態互動、專家級效率、分散式決策能力)能極大降低智能硬體使用門檻,推動行業普及。塗鴉AI Agent平台已接入全球主流大模型,幫助客戶開發智能戒指、AI玩偶等爆款產品,並與孩子王等合作推進AI伴身智能硬體。公司預計2025年將是新AI硬體爆發年,其AI Agent戰略將在2-3年後進入收穫期。(來源: 36氪)

🌟 社區

AI培訓課程亂象:虛假宣傳與效果存疑:社交媒體上充斥著「AI速成致富」的培訓課程廣告,宣稱普通人可透過學習AI繪畫、模型微調等快速變現。然而,實際體驗和消費者回饋揭示諸多問題:講師資質模糊甚至造假(如Coverhero創辦人身份不實);課程內容與宣傳承諾不符,難以達到「接單變現」效果;利用飢餓行銷和虛假案例誘導消費;退費困難。業內人士指出,此類課程內容往往過於理論化或流於表面,普通人難以透過短期培訓掌握足以轉行或穩定創收的AI技能。建議使用者利用免費資源和社群學習,警惕高價速成陷阱。(來源: 新周刊)

AI培訓課程亂象:虛假宣傳與效果存疑

開發者對比Claude與Gemini 2.5 + Cursor程式設計體驗:一位開發者分享了使用Claude和Gemini 2.5 Pro + Cursor開發拼字遊戲的體驗。使用Claude API花費417美元,體驗不佳:上下文窗口易丟失,導致模型頻繁「失憶」;修復bug時常引入新問題;無法驗證程式碼正確性。相比之下,使用免費的Gemini 2.5 Pro(透過Cursor整合)體驗大幅提升:成本為零;上下文理解能力更強(得益於Cursor的文件結構傳遞);互動流程更像結對程式設計;Debug過程更理性。結論是,Gemini 2.5 + Cursor的組合提供了更實用、高效的AI輔助程式設計體驗。(來源: CSDN)

開發者對比Claude與Gemini 2.5 + Cursor程式設計體驗

Perplexity iOS助理獲初步好評:Perplexity CEO轉發使用者評論,顯示其iOS AI助理在早期評測中表現良好。評論指出,該助理在蘋果生態系統內的表現甚至優於Siri,例如在根據語音指令播放特定YouTube影片等任務上更準確。這表明Perplexity助理在理解自然語言意圖和執行跨應用操作方面具有一定優勢。(來源: AravSrinivas)

Perplexity iOS助理獲初步好評

Reddit熱議:AI生成與真實照片辨別:Reddit使用者發起討論,展示5張相似女性照片,其中一張為真實照片,其餘由AI生成,讓大家辨別。評論區討論激烈,使用者從光影、皮膚質感、飾品細節(如項鍊鏈條)等角度分析,但意見不一。這反映了當前AI圖像生成技術的高水平以及辨別真偽的難度。(來源: Reddit r/ChatGPT)

Reddit熱議:ChatGPT生成奇怪圖片:多位使用者在Reddit分享,要求ChatGPT生成特定圖片(如「美國地圖」)時,意外得到了核爆炸(蘑菇雲)或其他不相關的圖片(如R2D2)。這引發了關於模型穩定性和潛在偏差的討論,尚不清楚是模型隨機錯誤還是特定提示觸發了異常。(來源: Reddit r/ChatGPT)

Reddit熱議:ChatGPT生成奇怪圖片

Reddit討論:AI是否會讓軟體工程師上癮?:一位軟體工程師在Reddit發帖,表示AI工具(如程式設計助手)極大提高了工作效率和品質,使用後難以停止,感覺有些「上癮」。評論區對此展開討論,部分人認為這更像是對高效工具的依賴,類似依賴編譯器而非組合語言,是生產力提升的自然結果;另一些人則認同可能存在「上癮」風險,並擔憂過度依賴可能導致技能退化,建議有意識地進行「AI排毒」或保持基礎技能鍛鍊。(來源: Reddit r/ArtificialInteligence)

Reddit討論:AI宗教與崇拜現象:使用者討論AI是否可能成為宗教或崇拜對象。論點包括:已有「AI Jesus」出現;關於AI意識的討論可能引向信仰;Longtermism等思潮帶有類宗教色彩;LLM能提供個性化精神慰藉和指導。評論中提到已有現實案例(如jrprudence.com的Nova協議),並討論了AI在滿足人類精神需求方面的潛力與風險,以及對「AI邪教」的擔憂。(來源: Reddit r/ArtificialInteligence)

Reddit討論:AI生成圖片無法「修復」舊照:使用者透過實驗證明,使用ChatGPT等AI工具處理舊照片時,AI並非真正修復或提升解析度,而是基於原圖生成一張全新的、相似的圖像。用名人照片(如Samuel L Jackson)測試時,生成結果明顯是另一個人,只是風格和姿勢相似。這提示使用者需正確理解AI圖像處理的能力邊界,它更擅長「創作」而非「修復」。(來源: Reddit r/ChatGPT)

💡 其他

AI Partner大會金句集錦:36氪整理並發布了2025 AI Partner大會上的嘉賓精彩觀點摘要。這些觀點圍繞AI超級應用的未來演進、行業變革以及商業邏輯重構等主題展開,反映了當前AI領域專家和行業先鋒的思考。(來源: 36氪)

AI Partner大會金句集錦

阿聯酋成首個使用AI起草法律的國家:據The Hill報導,阿聯酋已開始利用人工智能協助起草法律文本。這一舉措標誌著AI在立法領域的初步應用,可能旨在提高立法效率或分析複雜法規。此消息引發了關於AI在治理中角色的討論,例如是否能減少對傳統政治角色的依賴。(來源: Reddit r/ArtificialInteligence)

阿聯酋成首個使用AI起草法律的國家

Anthropic啟動「AI模型福祉」研究項目:Anthropic公司宣布啟動一項新計劃,旨在研究AI模型的「福祉」(model welfare)。儘管該領域存在爭議(一些專家認為模型沒有主觀感受或價值觀),Anthropic此舉可能旨在探索更負責任、更符合倫理的模型開發和互動方式,或研究如何評估和減輕模型在訓練或互動中可能產生的「不良」狀態或行為。(來源: Reddit r/ClaudeAI)

Anthropic啟動「AI模型福祉」研究項目

AI需要大量水資源引發關注:美國政府報告及媒體(404media)指出,訓練和運行大型AI模型需要消耗大量水資源,主要用於資料中心的冷卻。這引發了對AI發展環境成本的擔憂,尤其是在水資源緊張的地區。(來源: Reddit r/artificial)

AI需要大量水資源引發關注

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir