Berita AI - 2025-07-21(Edisi malam)

Kata Kunci：OpenAI, Kompetisi Matematika Internasional (IMO), Model Bahasa Besar (LLM), AI Agent, GPT-5, Robot Humanoid, Kecerdasan Berwujud (Embodied Intelligence), Kontroversi Medali Emas IMO, Keterbatasan Pencarian Memori LLM, Alat ChatGPT Agent, Pesanan Robot Humanoid Ubtech, Persaingan Kecerdasan Berwujud antara JD dan Meituan

🔥 Fokus

Kontroversi Medali Emas IMO OpenAI: OpenAI mengumumkan bahwa model AI-nya telah mencapai level medali emas dalam International Mathematical Olympiad (IMO), yang memicu kontroversi luas. Fokusnya adalah pada OpenAI yang tidak mematuhi persyaratan IMO untuk mengumumkan hasilnya sebelum upacara penutupan, yang dituduh mencuri perhatian siswa dan kurangnya rasa hormat. Selain itu, pengujian OpenAI tidak diselenggarakan secara resmi oleh IMO, dan penilaiannya tidak dilakukan oleh juri resmi, sehingga “medali emas” dipertanyakan. Insiden ini memicu diskusi tentang aturan kompetisi AI, standar evaluasi, dan keadilan kompetisi antara AI dan manusia. (Sumber: 36氪, 36氪, 36氪, 36氪)

Keterbatasan Pengambilan Memori Model Besar: Penelitian oleh University of Virginia dan New York University mengungkapkan bahwa Large Language Model (LLM) mengalami “proactive interference” dalam pengambilan memori, yaitu informasi lama mengganggu ingatan informasi baru, yang menyebabkan penurunan akurasi. Bahkan untuk tugas pengambilan sederhana, akurasi model menurun secara signifikan dengan meningkatnya item yang mengganggu, akhirnya mendekati nol. Para peneliti mencoba intervensi dengan prompt engineering, tetapi efeknya terbatas, menunjukkan bahwa LLM memiliki hambatan yang mirip dengan memori kerja manusia dan membutuhkan metode baru untuk meningkatkan ketahanannya terhadap gangguan. (Sumber: 36氪)

Masalah Kepercayaan Diri Model Besar: Penelitian oleh Google DeepMind dan University of London menemukan bahwa LLM cenderung meninggalkan jawaban yang benar ketika dipertanyakan, menunjukkan “kurangnya kepercayaan diri”. Bahkan jika keberatannya tidak benar, model dapat mengubah jawabannya karena terlalu sensitif. Penelitian ini berpendapat bahwa hal ini terkait dengan pelatihan reinforcement learning yang terlalu mengakomodasi input eksternal, bergantung pada pencocokan pola daripada penalaran logis, dan keterbatasan mekanisme memori, yang dapat menyebabkan model menyimpang dari kesimpulan yang benar dalam percakapan multi-putaran. (Sumber: 36氪)

🎯 Tren

OpenAI Akan Merilis GPT-5: Beberapa sumber menunjukkan bahwa OpenAI akan merilis GPT-5 dalam dua minggu, yang kemungkinan merupakan sistem yang terdiri dari beberapa model, termasuk router yang dapat beralih di antara model yang berbeda. Selain itu, GPT-6 mungkin sudah mulai dilatih. OpenAI berencana untuk menambahkan lebih dari satu juta GPU pada akhir tahun untuk menyediakan dukungan daya komputasi untuk model baru. (Sumber: 36氪)

Perkembangan Cepat AI Agent: Gartner memperkirakan bahwa pada tahun 2028, 33% perangkat lunak perusahaan akan menyertakan AI Agent, dan 15% pekerjaan sehari-hari akan diselesaikan secara mandiri oleh Agent. AI Agent sedang bergerak dari tahap awal menuju kematangan, dan peningkatan dalam penalaran multimodal, pembuatan video, dan kemampuan pemrosesan tugas yang kompleks akan mendorong perkembangannya yang cepat. (Sumber: 36氪, 36氪)

🧰 Alat

ChatGPT Agent: OpenAI merilis ChatGPT Agent, yang dapat secara otomatis merencanakan dan menjalankan langkah-langkah berdasarkan instruksi pengguna, dan memanggil berbagai alat untuk menyelesaikan tugas-tugas kompleks. Model ini dilatih secara end-to-end dan menunjukkan kemampuan yang kuat dalam perencanaan tugas, pemanggilan lintas-alat, dan pembuatan dokumen, tetapi juga memiliki masalah seperti penyelesaian tugas yang tidak memadai dan kecepatan yang lambat. (Sumber: 36氪, 36氪)

💼 Bisnis

OpenAI Menghadapi Tantangan Bisnis: JPMorgan Chase merilis laporan mendalam tentang OpenAI, yang menunjukkan bahwa keunggulan kompetitif inovasi modelnya menjadi rentan, dan tren komoditas model tidak dapat dihindari. OpenAI bertaruh pada strategi seperti AI agent, tata letak perangkat keras, dan diversifikasi pendapatan untuk mengatasi tantangan. (Sumber: 36氪)

Pesanan Robot Humanoid UBTECH Mencapai Rekor Tertinggi: UBTECH memenangkan proyek pengadaan peralatan robot senilai 90,51 juta Yuan dari Mee Yee Automobile, memecahkan rekor jumlah pesanan tunggal untuk perusahaan robot humanoid global. UBTECH berencana untuk memproduksi sekitar 1.000 robot humanoid tahun ini dan memperkirakan pengiriman akan mencapai ribuan pada tahun 2026 dan puluhan ribu pada tahun 2027. (Sumber: 36氪)

Meta Menghabiskan Banyak Uang untuk Merekrut Bakat AI: Meta menghabiskan banyak uang untuk merekrut bakat AI, membentuk “laboratorium super intelijen”, di mana 50% penelitinya berasal dari China. Untuk menarik bakat, Meta menawarkan gaji tinggi dan sumber daya komputasi yang memadai, yang bertujuan untuk mencapai terobosan dalam Artificial General Intelligence (AGI). (Sumber: 36氪, 36氪)

🌟 Komunitas

Dampak AI terhadap Pekerjaan: Diskusi tentang AI yang menggantikan pekerjaan tetap hangat di media sosial. Beberapa orang khawatir bahwa AI akan menyebabkan pengangguran massal, sementara yang lain percaya bahwa AI akan menciptakan peluang kerja baru dan meningkatkan produktivitas. Para ahli menunjukkan bahwa AI saat ini terutama menggantikan pekerjaan yang berulang, dan kreativitas dan penilaian manusia tetap penting. (Sumber: Berbagai diskusi sosial)

Masalah Etika AI: Diskusi tentang masalah etika AI terus memanas. Orang-orang peduli dengan keamanan AI, perlindungan privasi, dan potensi risiko penyalahgunaan. Para ahli menyerukan peningkatan regulasi AI untuk memastikan bahwa teknologi AI bermanfaat bagi umat manusia. (Sumber: Berbagai diskusi sosial)

Hubungan antara AI dan Manusia: Orang-orang memiliki pandangan yang berbeda tentang arah masa depan hubungan antara AI dan manusia. Beberapa orang berpikir bahwa AI pada akhirnya akan melampaui kecerdasan manusia, sementara yang lain berpikir bahwa AI hanyalah sebuah alat, dan manusia selalu memegang kendali. (Sumber: Berbagai diskusi sosial)

Aplikasi Alat Pemrograman AI: Komunitas pengembang secara aktif berbagi dan mendiskusikan pengalaman mereka dalam menerapkan alat pemrograman AI. Beberapa pengembang percaya bahwa alat pemrograman AI telah secara signifikan meningkatkan efisiensi pengembangan, sementara yang lain menunjukkan bahwa kualitas kode yang dihasilkan AI masih perlu ditingkatkan. (Sumber: Berbagai diskusi sosial)

💡 Lainnya

Kebangkitan Pasar Mainan Pendamping AI: Pasar mainan pendamping AI berkembang pesat, tetapi produknya sangat homogen dan kurangnya produk yang populer. Arah perkembangan di masa depan terletak pada peningkatan diferensiasi produk dan pengalaman interaksi emosional, sambil memperhatikan masalah etika seperti penggantian emosional. (Sumber: 36氪)

JD.com dan Meituan Bersaing di Bidang Embodied Intelligence: JD.com dan Meituan telah berinvestasi di beberapa perusahaan embodied intelligence, bersaing di bidang ini. JD.com telah membentuk departemen khusus untuk embodied intelligence dan meluncurkan platform JoyInside, bekerja sama dengan produsen perangkat keras robot untuk menciptakan “otak AI”. Meituan telah berinvestasi di perusahaan seperti XYZ Robotics, StarMap, dan Unitree Robotics, yang berfokus pada “otak yang melekat” dan badan robot. (Sumber: 36氪)

Midea Membangun Taman Industri Cerdas: Midea telah menginvestasikan 7 miliar Yuan untuk membangun taman inovasi global di Shanghai. Taman ini menggunakan platform digital iBUILDING untuk mewujudkan interkoneksi peralatan, optimalisasi efisiensi energi, dan manajemen cerdas, menunjukkan kemampuan integrasi Midea di bidang teknologi bangunan. (Sumber: 36氪)

🔥 Fokus

🎯 Tren

🧰 Alat

💼 Bisnis

🌟 Komunitas

💡 Lainnya

Tag Terkait

Related Posts

Berita AI – 2025-10-29(Edisi pagi)

Berita AI – 2025-10-28(Edisi pagi)

Berita AI – 2025-10-27(Edisi malam)