AI Daily – 2025-04-17(Evening)

Kata Kunci:AI, OpenAI, model o3 dan o4-mini, visual reasoning dan tool calling, OpenAI open source Codex CLI, Google DolphinGemma dolphin language, IoT cerdas dan protokol MCP, AI untuk visual reasoning, OpenAI model o4-mini, cara menggunakan Codex CLI, Google DolphinGemma untuk NLP, implementasi protokol MCP di IoT

🔥 Fokus

OpenAI merilis model o3 dan o4-mini, memperkuat penalaran visual dan pemanggilan alat: OpenAI meluncurkan dua model penalaran baru, o3 dan o4-mini, yang secara signifikan meningkatkan kemampuan penalaran AI, terutama di bidang visual. Ini adalah pertama kalinya OpenAI merilis model yang dapat mengintegrasikan gambar ke dalam rantai pemikiran untuk penalaran, mampu menafsirkan grafik, foto, bahkan sketsa tangan, dan menggabungkannya dengan alat seperti Python, pencarian web, pembuatan gambar, dll., untuk menangani tugas kompleks multi-langkah. o3 diposisikan sebagai model penalaran terkuat, memecahkan rekor dalam berbagai benchmark, terutama unggul dalam analisis visual; o4-mini dioptimalkan untuk kecepatan dan biaya. Model baru ini secara bertahap akan menggantikan seri o1 lama, dan tersedia untuk pengguna Plus, Pro, Team, dan perusahaan. Sementara itu, OpenAI membuka sumber (open-sourced) Agent pemrograman ringan Codex CLI, dan meluncurkan program insentif jutaan dolar. Umpan balik pengujian pengguna awal positif, menunjukkan peningkatan signifikan dalam tingkat kecerdasan dan proaktivitas, tetapi masih ada masalah halusinasi dan keandalan dalam skenario tertentu (Sumber: 智东西, 元宇宙之心MetaverseHub, 新智元, 量子位, Reddit r/LocalLLaMA, Reddit r/deeplearning)

o3和o4-mini来了,OpenAI突破最强“看图思考”,开源AI编程神器,史上最大收购曝光

Model AI Google DolphinGemma mencoba memecahkan bahasa lumba-lumba: Google meluncurkan model AI ringan (parameter 400M) DolphinGemma berbasis arsitektur Gemma, yang bertujuan untuk memahami komunikasi akustik lumba-lumba. Model ini dilatih menggunakan data audio, mempelajari pola suara lumba-lumba dan menghasilkan suara serupa, yang diharapkan dapat mewujudkan komunikasi lintas spesies awal. Proyek ini bekerja sama dengan WDP (Wild Dolphin Project) yang telah lama meneliti lumba-lumba, memanfaatkan dataset berlabel yang telah dikumpulkan selama puluhan tahun. Dikombinasikan dengan sistem komputer bawah air CHAT yang dikembangkan oleh Georgia Tech (akan berbasis Pixel 9), para peneliti berharap dapat berinteraksi dengan lumba-lumba melalui kosakata bersama yang disederhanakan. CEO Google Pichai menyebutnya sebagai “langkah keren menuju komunikasi lintas spesies” dan berencana untuk membuka sumber model ini. CEO DeepMind Hassabis juga menyatakan harapan di masa depan untuk berkomunikasi dengan hewan cerdas lainnya seperti anjing (Sumber: 新智元)

谷歌AI成功破解海豚语,海洋版ChatGPT来了,掀人类跨物种交流革命

Pergeseran Paradigma: Dari “Internet of People” ke “Internet of Intelligences” dan Protokol MCP: Seiring pertumbuhan pengguna internet yang mencapai puncaknya, fokus industri bergeser dari menghubungkan manusia (Internet of People) ke menghubungkan agen AI (Internet of Intelligences). AI Agent dapat menggantikan pengguna untuk menjalankan tugas dan memanggil layanan, sementara standar terbuka seperti MCP (Model Context Protocol) memungkinkan interoperabilitas antara model dan alat yang berbeda, mirip dengan “USB-C” di dunia AI. Hal ini dapat membentuk kembali lanskap kekuasaan platform, melemahkan monopoli pintu masuk traffic tradisional atas distribusi konten dan perhatian pengguna, sekaligus memberikan peluang kebangkitan bagi situs web dan layanan kecil dan menengah yang kurang aktif (jika terhubung ke protokol sebagai “plugin kemampuan”). Metrik platform mungkin bergeser dari DAU ke AAU (Active Agent Unit), pasokan konten bergeser dari UGC ke AIGC, interaksi berevolusi dari GUI ke CUI/API, batas antara ToC dan ToB menjadi kabur, bergerak menuju ekosistem ToAI. Microsoft, Google, OpenAI, dan perusahaan besar Tiongkok semuanya telah menyusun strategi untuk MCP atau protokol terkait (Sumber: 朋克商店)

链接 70 亿人 vs. 链接 7 万亿 Agent:传统互联网的终局与新剧本

🎯 Tren

Volcano Engine merilis model pemikiran mendalam Doubao 1.5: Volcano Engine meluncurkan model pemikiran mendalam Doubao 1.5, menggunakan arsitektur MoE, dengan total parameter 200B dan parameter aktif 20B. Model ini menunjukkan kinerja luar biasa dalam berbagai benchmark di bidang matematika, pemrograman, dan sains, sebagian melampaui DeepSeek-R1, mendekati level OpenAI o1/o3-mini-high, dan mencetak skor lebih tinggi dalam tes ARC-AGI. Fitur khasnya termasuk “mencari sambil berpikir” (berbeda dari mencari dulu baru berpikir) dan kemampuan pemahaman visual berdasarkan informasi teks dan gambar. Pada saat yang sama, model text-to-image 3.0 (mendukung gambar HD 2K, optimasi tata letak teks) dan model pemahaman visual (peningkatan kemampuan lokalisasi, penghitungan, pemahaman video) juga ditingkatkan. Hingga akhir Maret, jumlah pemanggilan harian model besar Doubao melebihi 12,7 triliun token (Sumber: 智东西)

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

Asisten AI bawaan WeChat 「Yuanbao」 diluncurkan: Aplikasi Tencent Yuanbao hadir di WeChat sebagai asisten AI, pengguna dapat menambahkannya sebagai teman untuk berinteraksi langsung di antarmuka obrolan. Asisten ini didukung oleh mesin mode ganda Hunyuan dan DeepSeek, dioptimalkan untuk skenario WeChat, mendukung analisis artikel akun publik, gambar, dokumen (dalam 100M), serta melakukan tanya jawab cerdas dan interaksi sehari-hari. Balasan yang kompleks akan diarahkan ke aplikasi Yuanbao. Ini merupakan langkah penting dalam integrasi fungsi AI WeChat setelah pengujian skala abu-abu pencarian AI, yang bertujuan untuk mengintegrasikan kemampuan AI secara lebih alami ke dalam skenario percakapan inti. Tencent baru-baru ini meningkatkan promosi dan investasi daya komputasi untuk Yuanbao, memandang AI sebagai arah strategis yang penting (Sumber: 界面新闻, 华尔街见闻)

微信上线首个AI助手,以后可以在微信和元宝聊天了

Alibaba Tongyi Qianwen meraih peringkat pertama daya saing model besar komersial Tiongkok versi Omdia: Lembaga riset internasional Omdia merilis laporan “Model Besar Komersial Tiongkok Tahunan 2025”, Alibaba Cloud Tongyi Qianwen dinobatkan sebagai pemimpin untuk tahun kedua berturut-turut, dan menempati peringkat pertama dalam tiga dimensi: daya saing keseluruhan, kemampuan model, dan kemampuan eksekusi. Laporan tersebut mengakui posisi terdepan Alibaba dalam teknologi model, pembangunan ekosistem open source (unduhan global model seri Qwen melebihi 200 juta, model turunan lebih dari 100.000), dan implementasi komersial (strategi MaaS). Sebelumnya, laporan Indeks AI Stanford juga menempatkan Alibaba sebagai institusi ketiga di dunia dan pertama di Tiongkok dalam jumlah model penting yang dirilis. Alibaba terus berinvestasi dalam infrastruktur cloud AI, berencana menginvestasikan lebih dari 380 miliar yuan dalam tiga tahun ke depan (Sumber: 乌鸦智能说)

实现“双杀”,中国大模型竞争力排名出炉:第一名是他

Alibaba dan ByteDance dikabarkan merambah kacamata pintar AI: Setelah Baidu, Xiaomi, dan lainnya, Alibaba dan ByteDance dilaporkan sedang mengembangkan kacamata pintar AI. Proyek Alibaba dipimpin oleh tim Tmall Genie, mengintegrasikan kemampuan Quark AI, berencana meluncurkan dua versi: dengan layar dan tanpa layar, perangkat keras mungkin menggunakan solusi dual-chip Qualcomm + Hengxuan. Proyek ByteDance dipimpin oleh tim Pico, mengintegrasikan model besar Doubao, mungkin akan dirilis terlebih dahulu di luar negeri. Masuknya raksasa teknologi dengan keunggulan teknologi, modal, dan ekosistem dapat mempercepat perkembangan pasar, tetapi juga menghadapi tantangan pengalaman pengembangan perangkat keras yang relatif kurang. Langkah ini dapat menggeser persaingan kacamata pintar dari parameter perangkat keras ke layanan ekosistem, membawa tekanan dan peluang bagi pemain yang ada seperti Rokid dan RayNeo (Sumber: 科技新知)

阿里、字节终结百镜大战?

Google menggunakan AI untuk meningkatkan efisiensi pemblokiran iklan berbahaya secara signifikan: Google pada tahun 2024 menggunakan model AI yang ditingkatkan (termasuk LLM) untuk memperkuat penegakan kebijakan iklan, berhasil menangguhkan 39,2 juta akun pengiklan berbahaya, tiga kali lipat dari tahun 2023. Model AI berpartisipasi dalam 97% penegakan iklan, mampu mengidentifikasi dan menangani strategi penipuan yang terus berubah dengan lebih cepat. Langkah ini bertujuan untuk memerangi penyalahgunaan jaringan iklan, klaim palsu, pelanggaran merek dagang, dan penipuan deepfake yang dihasilkan AI. Meskipun masih ada iklan buruk yang lolos (5,1 miliar dihapus secara global), dengan memblokir akun di sumbernya, efek keseluruhan meningkat secara signifikan. Google menekankan bahwa manusia masih terlibat dalam proses tersebut, tetapi penerapan AI telah menjadi kunci keamanan iklan skala besar (Sumber: Reddit r/ArtificialInteligence)

Google suspended 39.2 million malicious advertisers in 2024 thanks to AI | Google is adding LLMs to everything, including ad policy enforcement.

MIT mengembangkan sistem AI untuk memprediksi pengikatan fragmen protein: Peneliti MIT telah mengembangkan sistem AI yang dapat memprediksi fragmen protein (peptida) mana yang dapat mengikat atau menghambat fungsi protein target. Ini memiliki signifikansi penting untuk penemuan obat dan bioteknologi, membantu merancang metode pengobatan atau alat diagnostik baru. Sistem ini menggunakan machine learning untuk menganalisis data struktur dan interaksi protein guna mengidentifikasi urutan peptida pendek dengan potensi kemampuan mengikat (Sumber: Ronald_vanLoon)

#AI system predicts protein fragments that can bind to or inhibit a target

Grok menambahkan fitur memori percakapan: Asisten AI platform X, Grok, mengumumkan penambahan fitur memori, yang memungkinkannya mengingat konten percakapan pengguna sebelumnya. Ini berarti Grok dapat memberikan respons, rekomendasi, atau saran yang lebih personal dan koheren dalam interaksi selanjutnya, meningkatkan pengalaman pengguna (Sumber: grok)
Google mengumumkan protokol terbuka untuk komunikasi antar Agen: Google mengumumkan peluncuran protokol terbuka yang bertujuan memungkinkan berbagai agen kecerdasan buatan (AI agents) untuk saling berkomunikasi dan berkolaborasi. Ini mirip dengan tujuan MCP (Model Context Protocol), yang bertujuan untuk mendobrak penghalang antar aplikasi AI, mendorong alur kerja AI yang lebih kompleks dan terintegrasi serta pembentukan ekosistem aplikasi (Sumber: Ronald_vanLoon)

Agent2Agent: Google announces open protocol so #AI agents can talk to each other

🧰 Alat

Penyesuaian fitur pembuatan gambar ChatGPT: Pengguna menemukan bahwa tombol “Create Image” di bagian bawah antarmuka ChatGPT telah dihapus, tetapi melalui prompt pembuatan gambar yang jelas atau awalan tertentu (seperti “Tolong buat gambar:”) fungsi pembuatan gambar masih dapat dipanggil pada model yang didukung (seperti GPT-4o, o3, o4-mini). Model GPT-4.5 dan o1 pro saat ini tidak mendukung pembuatan gambar dengan cara ini (Sumber: dotey)

现在 ChatGPT 从底部移除了 Create Image 的工具

Integrasi JetBrains IDE dengan pelengkapan kode LLM lokal gratis: JetBrains mengumumkan pembaruan besar untuk AI Assistant-nya, menyediakan lapisan fungsi AI gratis di produk IDE-nya (seperti Rider), termasuk pelengkapan kode tanpa batas, dan mendukung integrasi model LLM lokal. Langkah ini bertujuan untuk menurunkan ambang batas pengembangan yang dibantu AI. Sementara itu, lapisan berbayar AI Pro dan AI Ultimate menawarkan lebih banyak fitur canggih dan akses ke model cloud (seperti GPT-4.1, Claude 3.7, Gemini 2.0) (Sumber: Reddit r/LocalLLaMA)
HypernaturalAI: Alat AI untuk pembuatan konten profesional, yang dirancang untuk meningkatkan efisiensi dan kreativitas dalam skenario seperti pemasaran konten (Sumber: Ronald_vanLoon)
Demonstrasi pembuatan video Kling 2.0: Pengguna membagikan klip video yang dibuat menggunakan model pembuatan video Kling 2.0 yang diluncurkan oleh Kuaishou, menunjukkan efek generasinya (Sumber: op7418)
Framework Cactus untuk benchmarking AI di perangkat: Cactus adalah framework yang dirancang untuk menjalankan model AI secara efisien pada perangkat edge (ponsel, drone, dll.) tanpa perlu koneksi internet. Pengembang merilis demo aplikasi obrolan berbasis Cactus untuk menguji kecepatan berjalan (tokens/sec) berbagai model (seperti Gemma 1B, SmollLM) di berbagai ponsel, dan menyediakan tautan unduhan bagi pengguna untuk menguji (Sumber: Reddit r/deeplearning)

Benchmarking On-Device AI

Praktik pipeline AI hibrida OpenWebUI: Pengguna berbagi studi kasus sukses menggunakan Open WebUI sebagai frontend untuk membangun pipeline AI hibrida. Pipeline ini dapat secara otomatis merutekan pertanyaan pengguna ke kueri SQL terstruktur (melalui LangChain SQL Agent yang mengoperasikan DuckDB) atau database vektor (Pinecone) untuk pencarian semantik, dan memanfaatkan Gemini Flash untuk menghasilkan jawaban akhir, mencapai respons cepat (Sumber: Reddit r/OpenWebUI)
Masalah penggunaan basis pengetahuan dan API OpenWebUI: Pengguna Reddit mendiskusikan masalah yang dihadapi saat menggunakan fungsi basis pengetahuan (RAG) di OpenWebUI, termasuk cara mengarahkan dokumen ke direktori server alih-alih unggahan web, dan cara mendapatkan serta mengelola ID file dalam basis pengetahuan melalui API untuk mencapai sinkronisasi file (Sumber: Reddit r/OpenWebUI, Reddit r/OpenWebUI)
Permintaan bantuan integrasi OpenWebUI dengan server MCP: Pengguna mencari bantuan untuk mengatur server Karakeep MCP secara lokal dan mengintegrasikannya dengan OpenWebUI, mengalami kesulitan (Sumber: Reddit r/OpenWebUI)

Looking for help with MCP

Menggunakan mode berpikir Grok3 melalui OpenWebUI: Pengguna bertanya apakah ada cara untuk mengaktifkan mode “Think” atau “Deepsearch” khas Grok3 saat menggunakan API Grok yang terhubung ke OpenWebUI (Sumber: Reddit r/OpenWebUI)

📚 Pembelajaran

Studi orientasi tujuan LLM: Peneliti DeepMind mengeksplorasi masalah potensi kemampuan LLM yang kurang dimanfaatkan saat menjalankan tugas. Melalui penggunaan evaluasi sub-tugas, ditemukan bahwa LLM seringkali tidak sepenuhnya menggunakan kemampuan yang dimilikinya, yaitu tidak sepenuhnya “berorientasi pada tujuan”. Studi ini membantu memahami mekanisme internal dan keterbatasan LLM (Sumber: GoogleDeepMind)

What if LLMs are sometimes capable of doing a task but don't try hard enough to do it?

Keterbatasan model AI terdepan pada tugas fisik: Sebuah studi yang menargetkan kasus manufaktur menunjukkan bahwa model AI terdepan saat ini (termasuk model multimodal) berkinerja buruk dalam menangani tugas fisik sederhana (seperti membuat komponen kuningan), terutama memiliki kekurangan signifikan dalam pengenalan visual dan pemahaman spasial. Gemini 2.5 Pro relatif terbaik, tetapi masih ada kesenjangan besar. Hal ini menandakan bahwa kemajuan aplikasi AI di dunia fisik mungkin tertinggal dari dunia digital, membutuhkan arsitektur atau metode pelatihan baru untuk meningkatkan pemahaman spasial dan efisiensi sampel (Sumber: Reddit r/MachineLearning)
Studi menemukan kemampuan AI dalam debugging kode kurang: Meskipun AI telah membuat kemajuan dalam menghasilkan kode, sebuah studi menunjukkan bahwa AI saat ini berkinerja buruk dalam debugging kode, belum dapat menggantikan programmer manusia. Namun, beberapa pengembang percaya bahwa LLM sangat berguna dalam men-debug masalah tertentu (Sumber: Reddit r/artificial)

AI isn’t ready to replace human coders for debugging, researchers say | Ars Technica

Praktik optimasi kinerja LLM lokal: Qwen2.5-7B mencapai 5000 t/s pada dual 3090: Pengguna berbagi pengalaman mengoptimalkan kecepatan inferensi LLM lokal pada dua kartu grafis RTX 3090. Dengan memilih model Qwen2.5-7B, menggunakan kuantisasi W8A8, dan menggunakan mesin Aphrodite, menyesuaikan jumlah permintaan konkuren (max_num_seqs=32), akhirnya pada panjang konteks sekitar 5k, mencapai kecepatan pemrosesan prompt hingga sekitar 4500 t/s dan kecepatan generasi sekitar 825 t/s. Ini memberikan referensi optimasi kinerja untuk penelitian atau aplikasi yang perlu memproses data dalam jumlah besar secara lokal (Sumber: Reddit r/LocalLLaMA)
Mekanisme atensi baru CALA dirilis: Seorang peneliti merilis draf awal makalah mekanisme atensi baru yang dirancangnya bernama “Context-Aggregated Linear Attention” (CALA). CALA bertujuan untuk menggabungkan efisiensi O(N) dari atensi linear dengan peningkatan kemampuan persepsi lokal melalui penyisipan langkah “agregasi konteks lokal”. Makalah ini membahas desainnya, poin inovasi dibandingkan mekanisme atensi lainnya, dan optimasi kompleks yang diperlukan untuk mencapai efisiensi O(N) (seperti fusi kernel CUDA). Peneliti berharap komunitas berpartisipasi dalam validasi dan pengembangan selanjutnya (Sumber: Reddit r/MachineLearning)

[P] Today, to give back to the open source community, I release my first paper- a novel attention mechanism, Context-Aggregated Linear Attention, or CALA.

Menggunakan Claude 3.7 Sonnet untuk mengevaluasi keakraban kosakata: Pengguna menghabiskan sekitar $300 melalui panggilan API Claude 3.7 Sonnet untuk menghasilkan dataset skor keakraban (memperkirakan proporsi kognisi orang Amerika berusia 10 tahun ke atas) untuk kata dan frasa bahasa Inggris di Wiktionary. Pengguna percaya bahwa Sonnet berkinerja lebih baik daripada model teratas lainnya dalam tugas ini, mampu membedakan dengan lebih baik antara bahasa sehari-hari dan istilah profesional. Kode proyek dan dataset telah dibuka sumbernya, tetapi pengguna mengeluhkan biaya tinggi dan mencari metode yang lebih ekonomis (Sumber: Reddit r/ClaudeAI)

Why I Spent $300 Using Claude 3.7 Sonnet to Score How Well-Known English Words and Phrases Are

💼 Bisnis

Pasar aplikasi pendamping AI mendingin, penempatan iklan dan jumlah unduhan menurun: Data dari DataEye Research Institute menunjukkan bahwa aplikasi pendamping AI sosial yang diwakili oleh Xingye, Maoxiang, dan Zhumengdao mengalami pendinginan pasar pada awal 2025, dengan jumlah unduhan dan volume penempatan iklan keduanya menurun tajam, beberapa produk bahkan mengalami pemotongan volume penempatan hingga setengahnya atau lebih drastis. Analisis menunjukkan alasannya meliputi: 1) Fokus strategis industri AI bergeser ke model pemikiran mendalam seperti DeepSeek dan asisten AI, menurunkan pentingnya AI sosial; 2) Homogenisasi produk yang parah, mengurangi rasa baru pengguna; 3) Model bisnis langganan keanggotaan arus utama kurang menarik. Artikel ini membahas nilai inti AI sosial (nilai emosional kuat, nilai rasional cukup, nilai fisiologis lemah), dan menunjukkan bahwa arah masa depan mungkin terletak pada fokus pada penyembuhan emosional atau pengembangan terminal pendamping AI (Sumber: DataEye应用数据情报)

投放、下载量全面腰斩,百亿赛道为何暴跌?

Zhipu AI memulai proses IPO, mengincar “saham LLM pertama”: Perusahaan AI dari Tsinghua, Zhipu AI, memulai proses IPO pada bulan April setelah menerima beberapa putaran pendanaan (termasuk investasi 1,5 miliar baru-baru ini dari BUMN Hangzhou dan Zhuhai). Artikel ini menganalisis keunggulannya dalam latar belakang teknis (gen Tsinghua), posisi strategis (mandiri dan terkendali, masuk daftar AS), dan investor yang kuat (awal Fortune Capital, pertengahan Tencent, Ant Group, Sequoia, Saudi Aramco, baru-baru ini BUMN daerah). Memilih IPO saat ini dianggap sebagai strategi untuk mengkonsolidasikan posisi industri dengan merebut posisi “saham LLM pertama” di tengah gempuran model berbiaya rendah seperti DeepSeek, sekaligus memenuhi persyaratan pengembalian investor (terutama BUMN daerah yang mendorong IPO). Zhipu AI berencana merilis beberapa model tahun ini, masih merupakan “tahun pengeluaran besar”, IPO membantu menyelesaikan masalah pendanaan dan valuasi (Sumber: 真故研究室)

大模型第一股,抢钱上瘾

Wirausahawan Yao Class Tsinghua era AI 1.0 memulai kembali: Artikel ini mengulas perjalanan wirausaha lulusan Yao Class Tsinghua (seperti Yin Qi dari Megvii, Lou Tiancheng dari Pony.ai, dll.) di era AI 1.0 (pengenalan wajah, mengemudi otonom, dll.), termasuk menangkap peluang teknologi awal, mendapatkan dukungan modal, tetapi juga menghadapi kesulitan implementasi komersial, persaingan yang meningkat, dan tantangan IPO. Dengan munculnya gelombang AI 2.0 (model besar, kecerdasan terwujud), “anak-anak jenius” ini kembali terjun ke dunia wirausaha, seperti Yin Qi yang merambah mobil pintar (Qianli Tech), mantan karyawan Megvii Fan Haoqiang yang mendirikan perusahaan kecerdasan terwujud Yuanli Lingji. Mereka melanjutkan gen Yao Class untuk menantang “area tak bertuan”, mencoba mencari terobosan dalam siklus teknologi baru, tetapi juga menghadapi persaingan yang lebih ketat dan kesulitan komersialisasi (Sumber: 直面AI)

失意的清华姚班“天才少年”,又开始 AI 创业了

Wuzhao kembali ke DingTalk untuk mendorong reformasi, menekankan produk dan pengalaman pelanggan: Pendiri DingTalk Chen Hang (Wuzhao) dengan cepat memulai perbaikan internal setelah kembali. Dia menempatkan produk dan pengalaman pelanggan sebagai prioritas utama, menuntut tim desain produk dan riset untuk meninjau secara komprehensif alur pengalaman produk, membandingkannya dengan produk pesaing, dan secara pribadi memimpin kunjungan “penyamaran” ke pelanggan untuk mendengarkan umpan balik, memulai kembali mode “co-creation”. Dalam hal komersialisasi, dia menuntut penyelidikan semua jalur berbayar, beberapa paywall telah dihapus atau diperbaiki, menunjukkan bahwa target komersialisasi mengalah pada pengalaman produk dan inovasi AI. Dalam manajemen, dia menertibkan disiplin kerja (misalnya, menuntut masuk kerja jam 9), menekankan manajer untuk memimpin dengan contoh, terjun langsung ke lapangan, menentang manajer murni, menyederhanakan proses pelaporan (tidak membuat PPT), dan mengendalikan biaya (Sumber: 智能涌现)

无招重整钉钉:“暗访”三地客户,推动中层重返一线 | 智能涌现独家

Bocha AI: Penyedia layanan pencarian AI di balik DeepSeek, menantang Bing: Bocha AI menyediakan layanan API pencarian terhubung internet untuk DeepSeek dan lebih dari 60% aplikasi AI di Tiongkok. CEO Liu Xun memperkenalkan perbedaan teknis antara pencarian AI dan pencarian tradisional (indeks vektor, peringkat semantik, integrasi generatif), dan menekankan bahwa layanannya hanyalah perantara. Daya saing inti Bocha AI terletak pada pemrosesan data, model re-ranking yang dikembangkan sendiri, arsitektur konkurensi tinggi latensi rendah, keunggulan biaya (sekitar 1/3 harga Bing), dan kepatuhan data. Liu Xun percaya bahwa pencarian AI akan mengganggu model peringkat lelang pencarian tradisional, mendorong perusahaan beralih dari SEO ke GEO (lebih fokus pada kualitas konten dan pembangunan basis pengetahuan). Dia menilai bahwa hanya membuat aplikasi pencarian AI (seperti Perplexity) bukanlah jalur yang baik, model keuntungannya tidak jelas, sementara Bocha AI memposisikan diri sebagai infrastruktur yang menyediakan kemampuan pencarian untuk AI, bertujuan untuk mengurangi biaya pengembangan AGI (Sumber: 腾讯科技)

为DeepSeek提供“联网搜索”功能的这家公司,把价格打到了Bing的1/3

🌟 Komunitas

Kesenjangan AI dan pembagian politik: Mengapa “orang yang paling membenci AI memilih Trump”?: Artikel ini menganalisis bahwa sebagian pendukung Trump, seperti petani di negara bagian pertanian tradisional dan pekerja di Rust Belt, adalah kelompok yang terkena dampak otomatisasi AI, gagal berbagi dividen teknologi, dan merasa termarginalisasi. Mereka tidak puas dengan keadaan saat ini, berharap pada janji MAGA Trump (seperti reshoring manufaktur, membatasi raksasa teknologi). Artikel tersebut menunjukkan bahwa kesulitan kelompok-kelompok ini berasal dari penyesuaian struktur ekonomi dan kesenjangan keterampilan yang disebabkan oleh perubahan teknologi, sementara kebijakan pemerintahan Trump (seperti hambatan tarif, kurangnya pendidikan dasar AI) mungkin sulit untuk benar-benar menyelesaikan masalah, bahkan memperburuk kesulitan. Penulis membandingkan upaya Tiongkok dalam inklusivitas AI (seperti komputasi timur data barat, pemberdayaan AI industri, model besar gratis, pendidikan dasar AI), yang bertujuan agar seluruh rakyat berbagi dividen teknologi, menghindari perpecahan sosial (Sumber: 脑极体)

最讨厌AI的人选了特朗普

Pandangan komunitas tentang kemampuan pemrograman o3 beragam: Setelah Aider Leaderboard diperbarui menampilkan skor kemampuan pemrograman o3, seorang pengguna (karminski3) menyatakan bahwa hasil tersebut tidak sesuai dengan pengalaman pengujian pribadinya, menyarankan lebih banyak orang untuk mencoba dan memberikan umpan balik. Hal ini mencerminkan bahwa evaluasi kemampuan model baru oleh komunitas memiliki perspektif dan kontroversi yang beragam, benchmark tunggal mungkin tidak sepenuhnya mencerminkan pengalaman penggunaan aktual (Sumber: karminski3)

Aider Leaderboard 更新了

Pengguna menemukan model baru OpenAI mengalami penurunan kecerdasan saat ditanya dalam bahasa Mandarin: Pengguna op7418 melaporkan bahwa ketika menggunakan bahasa Mandarin untuk bertanya kepada model o3 dan o4-mini yang baru dirilis OpenAI, kinerja model jelas lebih buruk daripada menggunakan bahasa Inggris, terutama pada tugas yang memerlukan penalaran gambar, pertanyaan dalam bahasa Mandarin tampaknya tidak dapat memicu kemampuan analisis gambarnya. Pengguna tersebut berspekulasi bahwa OpenAI mungkin telah membatasi atau kurang mengoptimalkan input bahasa Mandarin (Sumber: op7418)

艹 发现问题了

Pengalaman pengguna: o3 dikombinasikan dengan DALL-E menghasilkan gambar yang lebih baik: Pengguna op7418 menemukan bahwa saat menggunakan model o3 di ChatGPT untuk memanggil pembuatan gambar (mungkin DALL-E 3), hasilnya lebih baik daripada generasi langsung, terutama untuk konsep kompleks yang memerlukan pemahaman latar belakang oleh model (seperti adegan novel tertentu). o3 dapat memahami konten teks terlebih dahulu, lalu menghasilkan gambar yang lebih relevan (Sumber: op7418)

我去,在 o3 调用 4o 生成图片的效果比直接生成好太多了

Pengguna berbagi cara melewati batasan konten ChatGPT untuk menghasilkan gambar: Pengguna Reddit berbagi cara melewati batasan konten ChatGPT (DALL-E 3) dengan “membujuk” atau menyempurnakan prompt secara bertahap, menghasilkan gambar yang mendekati tetapi tidak melanggar aturan (seperti pakaian renang). Bagian komentar membahas teknik metode ini serta pandangan tentang kewajaran batasan konten AI (Sumber: Reddit r/ChatGPT)
Reaksi komunitas terhadap rilis model baru OpenAI: Perhatian pada kurangnya open source: Dalam utas Reddit yang membahas rilis o3 dan o4-mini oleh OpenAI, banyak komentar menyatakan ketidakpuasan terhadap sikap OpenAI yang bersikeras pada rute closed source, menganggapnya kurang berarti bagi komunitas dan peneliti, berharap mereka merilis model open source yang dapat di-deploy secara lokal (Sumber: Reddit r/LocalLLaMA)
Penggunaan AI yang tak terduga: Berbagi komunitas: Pengguna Reddit mengumpulkan kasus penggunaan AI yang tidak mainstream tetapi praktis. Balasan termasuk: menggunakan AI untuk psikoterapi, belajar teori musik, merapikan transkrip wawancara dan menyusun alur cerita, membantu pasien ADHD memprioritaskan tugas, membuat lagu ulang tahun yang dipersonalisasi untuk anak-anak, dll., menunjukkan potensi luas AI dalam kehidupan sehari-hari dan skenario kebutuhan spesifik (Sumber: Reddit r/ArtificialInteligence)
Humor komunitas: Mengolok-olok penamaan model Nvidia & Llama 2: Pengguna Reddit memposting dengan humor mengeluhkan nama model baru Nvidia yang rumit dan sulit diingat, serta menggunakan nada sarkastik untuk menunjukkan Llama 2 menduduki peringkat teratas di suatu papan peringkat, mengolok-olok fluktuasi benchmark dan pandangan komunitas tentang model baru dan lama (Sumber: Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

Somebody needs to tell Nvidia to calm down with these new model names.

Pengguna bimbang antara Claude Max & ChatGPT Pro: Setelah OpenAI merilis o3, seorang pengguna di Reddit menyatakan keraguan antara berlangganan Claude Max atau ChatGPT Pro, menganggap o3 mungkin merupakan peningkatan dari o1 yang kuat, berpotensi melampaui model saat ini. Bagian komentar membahas pembatasan laju yang baru-baru ini dialami Claude, masalah kinerja, serta kelebihan dan kekurangan masing-masing dalam skenario spesifik seperti pengkodean (Sumber: Reddit r/ClaudeAI)
Humor komunitas: Mengolok-olok interaksi AI & pengguna: Pengguna Reddit berbagi postingan lelucon tentang apakah AI memiliki emosi atau kesadaran, memicu diskusi santai di antara anggota komunitas tentang antropomorfisme AI dan harapan pengguna (Sumber: Reddit r/ChatGPT)

Half the users?

Pengguna mengeluh batasan kapasitas Claude menyebabkan balasan hilang: Pengguna Reddit menyatakan ketidakpuasan terhadap model Anthropic Claude, menunjukkan bahwa setelah model menghasilkan jawaban yang lengkap dan berguna, konten tersebut dihapus karena “kapasitas terlampaui”, menyebabkan frustrasi besar bagi pengguna. Ini mencerminkan bahwa beberapa layanan AI saat ini masih memiliki masalah dalam stabilitas dan pengalaman pengguna (Sumber: Reddit r/ClaudeAI)
Penurunan drastis peringkat Claude di LiveBench menimbulkan pertanyaan: Pengguna memperhatikan bahwa peringkat model seri Claude Sonnet pada benchmark pemrograman LiveBench tiba-tiba turun drastis, sementara peringkat model OpenAI naik, memicu diskusi tentang keandalan benchmark dan apakah ada faktor kepentingan di baliknya. Anggota komunitas merasa bingung dengan fenomena ini, berpikir mungkin ada perubahan metode pengujian atau fluktuasi kinerja model yang sebenarnya (Sumber: Reddit r/ClaudeAI)
Pengguna menampilkan selfie karakter game yang dihasilkan AI: Pengguna Reddit berbagi serangkaian “selfie” yang dibuat menggunakan ChatGPT (DALL-E 3) untuk karakter video game terkenal, menunjukkan kemampuan AI dalam memahami fitur karakter dan menghasilkan gambar kreatif. Pengguna di bagian komentar juga ikut serta, menghasilkan selfie karakter favorit mereka, membentuk interaksi yang menarik (Sumber: Reddit r/ChatGPT)
Bisakah AI menggantikan eksekutif? Diskusi hangat komunitas: Di Reddit, diskusi tentang mengapa AI lebih dulu menggantikan pekerja kerah putih tingkat dasar daripada eksekutif bergaji tinggi. Pandangan meliputi: kemampuan AI saat ini tidak cukup untuk menangani pengambilan keputusan kompleks eksekutif; struktur kekuasaan menentukan bahwa eksekutif memegang kekuasaan pengambilan keputusan penggantian; penggantian eksekutif oleh AI dapat menyebabkan keputusan yang lebih kejam dan mengutamakan efisiensi, belum tentu menguntungkan karyawan; serta kekhawatiran tentang tata kelola dan kontrol AI (Sumber: Reddit r/ArtificialInteligence)
Alat ringkasan AI sulit menangkap “kilasan inspirasi” penting: Pengguna di Reddit mengeluh bahwa saat menggunakan alat AI (seperti Gemini atau ekstensi Chrome) untuk merangkum podcast atau video panjang, seringkali bisa mendapatkan poin-poin penting, tetapi sering melewatkan “kutipan emas” singkat namun sangat inspiratif atau momen kunci. Pengguna memikirkan apakah efek ringkasan dapat ditingkatkan dengan memberikan umpan balik, dan bertanya apakah orang lain memiliki pengalaman serupa (Sumber: Reddit r/artificial)
Komunitas menyatakan ketidakpuasan terhadap strategi rilis OpenAI: Pengguna Reddit memposting kritik terhadap rilis OpenAI baru-baru ini (seperti o3/o4-mini, Codex CLI), berpendapat bahwa esensi teknologinya adalah aplikasi skala besar dari metode yang sudah diketahui, bukan inovasi fundamental, dan pemasaran berlebihan produk closed source, kurang berkontribusi pada komunitas open source, gagal memberikan nilai pembelajaran nyata, lebih melayani kepentingan komersial, yang membuat jenuh (Sumber: Reddit r/LocalLLaMA)

Honest thoughts on the OpenAI release

ChatGPT secara tak terduga “menyembuhkan” gangguan sendi temporomandibular (TMJ) pengguna selama lima tahun: Seorang pengguna Reddit berbagi pengalaman mengejutkan: bunyi klik sendi rahang (gejala TMJ) yang mengganggunya selama lima tahun, setelah mencoba latihan sederhana yang disarankan oleh ChatGPT (menjaga simetri dengan lidah menempel di langit-langit mulut saat membuka dan menutup mulut), hilang hanya dalam waktu sekitar satu menit, dan efeknya bertahan. Pengguna tersebut sebelumnya telah berobat dan melakukan pemeriksaan MRI tanpa hasil. Kasus ini memicu diskusi komunitas tentang potensi AI dalam memberikan saran kesehatan non-tradisional namun efektif (Sumber: Reddit r/ChatGPT)

💡 Lain-lain

Pemikiran Kissinger tentang perkembangan AI: Manusia mungkin menjadi kendala terbesar: Mendiang pemikir Henry Kissinger dkk. dalam artikelnya membahas kemungkinan perkembangan AI di masa depan, termasuk mencapai kemampuan perencanaan, memiliki “groundedness” (keterhubungan yang andal dengan realitas), memori dan pemahaman kausal, bahkan mengembangkan kesadaran diri awal. Artikel tersebut memperingatkan bahwa seiring meningkatnya kemampuan AI, pandangannya terhadap manusia dapat berubah, terutama ketika manusia menunjukkan kepasifan di hadapan AI, kecanduan dunia digital dan terlepas dari realitas, AI mungkin memandang manusia sebagai kendala pembangunan daripada mitra. Artikel tersebut juga membahas dampak mendalam dari pemberian bentuk fisik dan kemampuan bertindak otonom kepada AI, serta tantangan tak diketahui yang mungkin timbul setelah Artificial General Intelligence (AGI) terhubung ke jaringan, menyerukan manusia untuk beradaptasi secara aktif daripada fatalisme atau penolakan (Sumber: 腾讯研究院)
Demonstrasi aplikasi robot yang digerakkan AI: Media sosial menampilkan beberapa contoh aplikasi robot yang digerakkan atau dibantu oleh AI, termasuk robot yang dikembangkan oleh Google DeepMind yang dapat bermain tenis meja, lengan robotik yang dapat melakukan operasi halus (seperti memisahkan selaput cangkang telur puyuh, menanam berlian, membuat karya seni dengan pahat), serta robot dengan bentuk aneh (seperti anjing robot, robot serangga yang dikendalikan nirkabel, robot yang bergerak menggunakan roda Mecanum), dll., menunjukkan kemajuan AI dalam meningkatkan persepsi, pengambilan keputusan, dan kemampuan kontrol robot (Sumber: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)
Diskusi aplikasi AI di bidang kesehatan: Media sosial menyebutkan beberapa artikel dan diskusi tentang aplikasi AI di bidang kesehatan, dengan fokus meliputi bagaimana AI membantu penyedia layanan kesehatan menghadapi perubahan sosial, potensi inovatif AI generatif di bidang medis, serta arah aplikasi spesifik (Sumber: Ronald_vanLoon, Ronald_vanLoon)

#AI Can Help #Healthcare Providers Respond to a Changing Society

Demonstrasi teknologi konseptual yang diberdayakan AI: Media sosial menampilkan beberapa teknologi atau produk konseptual yang menggabungkan AI, misalnya konsep mobil terbang otonom yang digerakkan AI, serta peran yang mungkin dimainkan AI dalam skenario ritel masa depan (Sumber: Ronald_vanLoon, Ronald_vanLoon)
Community college AS menghadapi maraknya “siswa bot”: Laporan menunjukkan bahwa community college di AS menghadapi sejumlah besar aplikasi pendaftaran palsu yang diajukan oleh bot (kemungkinan digerakkan oleh AI), ini membawa tantangan bagi sistem penerimaan dan manajemen sekolah, pihak sekolah sedang berusaha mencari solusi (Sumber: Reddit r/artificial)

As ‘Bot’ Students Continue to Flood In, Community Colleges Struggle to Respond

OpenAI merilis GPT-4.1 tanpa memberikan laporan keamanan menarik perhatian: Media teknologi melaporkan bahwa OpenAI saat merilis GPT-4.1 tidak menyediakan laporan evaluasi keamanan terperinci seperti yang biasa dilakukan saat merilis model baru. Pihak OpenAI mungkin menganggap model ini berbasis pada teknologi yang ada, risikonya terkendali, tetapi langkah ini memicu diskusi tentang transparansi dan tanggung jawab keamanan AI (Sumber: Reddit r/artificial)

OpenAI ships GPT-4.1 without a safety report

Percepatan pengembangan AGI dan ketertinggalan keamanan menimbulkan kekhawatiran: Artikel menunjukkan bahwa garis waktu ekspektasi industri kecerdasan buatan untuk mencapai Artificial General Intelligence (AGI) semakin pendek, tetapi pada saat yang sama, perhatian dan investasi pada masalah keamanan AI relatif tertinggal, ini menimbulkan kekhawatiran tentang risiko pengembangan AI di masa depan (Sumber: Reddit r/artificial)

AI industry ‘timelines’ to human-like AGI are getting shorter. But AI safety is getting increasingly short shrift

AS dikabarkan mempertimbangkan larangan terhadap DeepSeek: Laporan menyebutkan bahwa pemerintahan Trump mungkin mempertimbangkan untuk melarang model besar Tiongkok DeepSeek digunakan di AS, dan memberikan tekanan pada pemasok seperti Nvidia yang menyediakan chip untuk perusahaan AI Tiongkok. Langkah ini mungkin didasarkan pada pertimbangan keamanan data, persaingan nasional, dan perlindungan perusahaan AI lokal (seperti OpenAI), memicu kekhawatiran tentang pembatasan teknologi dan masa depan model open source (Sumber: Reddit r/LocalLLaMA)

Trump administration reportedly considers a US DeepSeek ban

Usulan membangun think tank AI Agent untuk memecahkan masalah AI: Pengguna Reddit mengusulkan ide: memanfaatkan AI Agent (ANDSI, Artificial Narrow Domain Superintelligence) yang berspesialisasi dalam domain tertentu dan memiliki kemampuan super untuk membentuk “think tank”, membiarkan mereka bekerja sama untuk secara khusus mengatasi masalah yang dihadapi bidang AI saat ini, seperti menghilangkan halusinasi, mengeksplorasi fusi model AI multi-arsitektur, dll. Ide ini berpendapat bahwa memanfaatkan kecerdasan super AI untuk mempercepat pengembangan AI itu sendiri mungkin lebih potensial daripada hanya menggunakan AI untuk menggantikan pekerjaan manusia (Sumber: Reddit r/deeplearning)
Seruan untuk Open Source AGI demi menjamin masa depan umat manusia: Tautan video YouTube, yang judulnya menyatakan bahwa Open Source Artificial General Intelligence (Open Source AGI) sangat penting untuk memastikan masa depan umat manusia, menyiratkan bahwa jalur pengembangan AGI yang terbuka, transparan, dan terdistribusi lebih menguntungkan bagi kesejahteraan manusia daripada jalur tertutup dan terpusat (Sumber: Reddit r/ArtificialInteligence)

The Choice is Ours: Why Open Source AGI is Crucial for Humanity's Future