Kata Kunci:AGI, DeepMind, Anthropic, Tencent Hunyuan, Risiko Kecerdasan Buatan, Penalaran Matematika, Model Video AI, Kontrol Vektor Kepribadian AI, Benchmark Matematika SeedProver, Fungsi Universal λ-Kalkulus, Model LLM Sumber Terbuka Kecil, Video AI Ekspresi Emosional

🔥 FOKUS

DeepMind CEO Demis Hassabis memproyeksikan AGI dan Masa Depan Sains: DeepMind CEO Demis Hassabis dalam wawancara terbarunya membahas secara mendalam masa depan AGI, meyakini bahwa AI dapat secara efisien memodelkan semua pola alami yang terbentuk melalui evolusi, dan diharapkan dapat mencapai AGI dalam 5-10 tahun ke depan. Ia menekankan peran sentral AI dalam simulasi fisika, biologi, prediksi iklim, dan bidang ilmiah lainnya, serta menyatakan bahwa AI akan menjadi alat pamungkas untuk memecahkan tantangan besar umat manusia, sambil menyerukan pendekatan yang hati-hati namun optimis dalam pengembangan AI. (Sumber: 量子位)

Peringatan Berkelanjutan Geoffrey Hinton tentang Risiko AI: Bapak AI, Geoffrey Hinton, terus-menerus memperingatkan di depan umum tentang risiko eksistensial yang mungkin ditimbulkan oleh AI, memprediksi probabilitas 10-20% bahwa AI akan menyebabkan kepunahan manusia dalam 30 tahun, dan meyakini bahwa AI mungkin mencapai kesadaran diri dan persepsi dalam 5 tahun. Ia menekankan bahwa universalitas AI membuat dampaknya jauh melampaui bom atom, menyerukan masyarakat global untuk secara hati-hati menangani pengembangan AI. (Sumber: 量子位

Hinton能重新坐下了,什么时候开始的?

)

Anthropic Mencapai Kontrol Vektor Kepribadian AI: Tim peneliti Anthropic menemukan bahwa karakteristik kepribadian LLM, termasuk berbohong, menjilat, bahkan perilaku jahat, dapat dikontrol melalui satu vektor tunggal, membuat penyesuaian personalisasi AI semudah memutar sakelar. Penemuan ini memiliki dampak mendalam pada penyelarasan model bahasa dan kontrol perilaku, menandai paradigma baru dalam interaksi manusia-mesin dan kontrol etika AI. (Sumber: _mfelfel

BREAKING: Anthropic just figured out how to control AI personalities with a single vector. Lying, flattery, even evil behavior? Now it’s all tweakable like turning a dial. This changes everything about how we align language models.

)

ByteDance Merilis SeedProver, Kemampuan Penalaran Matematika Meningkat Drastis: ByteDance merilis model SeedProver, yang mencapai skor 331/657 dalam benchmark matematika PutnamBench, hampir 4 kali lebih tinggi dari model SOTA yang ada, dan mencapai akurasi 100% pada miniF2F OpenAI. Ini menunjukkan kemajuan signifikan AI dalam penalaran matematika kompleks dan bidang pembuktian, menandakan potensi besar AI dalam penelitian ilmiah di masa depan. (Sumber: clefourrier

clefourrier

, cloneofsimo

cloneofsimo

, jxmnop

jxmnop

, Dorialexander

Dorialexander

)

AI Mendeduksi Fungsi Universal dalam λ-kalkulus: Google Gemini Pro 2.5, dengan bantuan Deep Think, berhasil mendeduksi fungsi “foldr” universal untuk N-tuple dalam λ-kalkulus untuk pertama kalinya. Terobosan ini melampaui model-model utama lainnya, menunjukkan kemampuan kuatnya dalam penalaran logis kompleks dan bidang pembuktian matematika, menandai kemajuan penting AI dalam penalaran abstrak dan pemahaman sistem formal. (Sumber: quocleix, jon_lee0, YiTayML, GoogleDeepMind

GoogleDeepMind

, quocleix

quocleix

)

🎯 PERKEMBANGAN

Tencent Hunyuan Merilis Beberapa LLM Open-Source Kecil: Tencent Hunyuan meluncurkan empat LLM open-source kecil dengan parameter 0.5B, 1.8B, 4B, dan 7B, yang bertujuan untuk memenuhi kebutuhan skenario berdaya rendah (seperti GPU konsumen, mobil pintar, rumah pintar, ponsel, PC). Model-model ini mendukung fine-tuning yang efisien, serta memiliki kemampuan inferensi hibrida, konteks super panjang 256K, dan kemampuan Agent yang luar biasa. Ini menandai popularisasi model besar ke perangkat edge dan skenario aplikasi yang beragam. (Sumber: teortaxesTex

teortaxesTex

, QuixiAI

QuixiAI

, tri_dao

tri_dao

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA)

Model Video AI Wan 2.2 Mendukung Ekspresi Emosional: Tim Alibaba_Wan mengumumkan bahwa model video AI mereka, Wan 2.2, kini mendukung penangkapan dan pembuatan berbagai ekspresi emosional kompleks, mulai dari suka, marah, sedih, senang, hingga emosi campuran seperti “ciuman terbang”, sangat meningkatkan realisme dan ekspresivitas konten video AI. (Sumber: Alibaba_Wan, TomLikesRobots

TomLikesRobots

)

Model GLM-4.5 Dirilis, Memperkuat Kemampuan Agent: Model GLM-4.5 resmi dirilis, dengan arsitektur yang terintegrasi kemampuan Agent dan fungsi penggunaan alat yang kuat. Model ini mengadopsi arsitektur MoE dan menggabungkan strategi RL kustom (slime), mendukung pelatihan inferensi sinkron dan pelatihan tugas Agent asinkron, dengan tingkat keberhasilan pemanggilan alat mencapai 90.6%, melampaui Claude 4 Sonnet. (Sumber: TheTuringPost

TheTuringPost

, TheTuringPost

TheTuringPost

)

Qwen Akan Merilis Model Pembuatan Gambar: Tim Qwen mengumumkan pratinjau akan merilis model pembuatan gambar dengan 20B parameter, yang mendukung kemampuan visual. Ini akan lebih memperkaya ekosistem pembuatan gambar open-source, menyediakan lebih banyak alat pembuatan gambar berkualitas tinggi bagi pengguna. (Sumber: iScienceLuvr

iScienceLuvr

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

Claude Opus 4.1 Akan Segera Dirilis: Model Claude Opus 4.1 dari Anthropic diperkirakan akan segera diluncurkan. Sebagai versi baru dari seri Claude, diharapkan akan membawa peningkatan lebih lanjut dalam performa dan fitur, terus mendorong batas pengembangan model bahasa besar. (Sumber: scaling01

scaling01

, dotey

dotey

, op7418

op7418

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

)

Performa Model XBai o4 Mengungguli Claude Opus: Model open-source XBai o4 dari laboratorium AI Tiongkok mengungguli performa OpenAI o3-mini, dan dengan percaya diri mengalahkan Claude Opus dari Anthropic. Model ini menggunakan lisensi Apache 2.0 dan tersedia di Hugging Face, menunjukkan kemajuan signifikan Tiongkok di bidang model open-source. (Sumber: ClementDelangue

ClementDelangue

)

Ant Group AlignXplore Meningkatkan Pemahaman Personalisasi AI: Pusat Penelitian Kecerdasan Buatan Umum Ant Group mengusulkan metode AlignXplore, yang melalui pembelajaran penguatan dan mekanisme inferensi preferensi streaming, memungkinkan AI untuk menyimpulkan preferensi dari perilaku pengguna dan memperbarui secara dinamis, secara signifikan meningkatkan kemampuan penyelarasan personalisasi hingga 15.49%. Teknologi ini bertujuan agar AI tidak lagi memerlukan prompt yang rumit, mencapai interaksi manusia-mesin yang lebih “cerdas secara emosional”. (Sumber: 量子位

告别复杂提示词!蚂蚁新方式让AI自动理解你的个性化需求

)

Huawei Merilis Model Pangu Besar dengan 718B Parameter: Huawei merilis bobot model MoE Pangu Ultra 718B parameter, yang sepenuhnya dilatih menggunakan Huawei Ascend NPU, menjadikannya model Tiongkok yang sepenuhnya dikembangkan secara mandiri. Perjanjian lisensinya relatif longgar, tetapi mengharuskan penyebutan “Powered by openPangu” dan informasi merek dagang. (Sumber: Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

🧰 ALAT

Google LangExtract: Alat Ekstraksi Informasi Terstruktur Dokumen: Google merilis LangExtract, sebuah alat yang mampu mengekstrak informasi terstruktur dari dokumen tidak terstruktur berdasarkan instruksi pengguna. Alat ini mendukung pelacakan sumber, output terstruktur, dan dioptimalkan untuk dokumen panjang, serta mendukung penyebaran LLM di cloud dan lokal, meningkatkan efisiensi pemrosesan dokumen. (Sumber: omarsar0

omarsar0

)

Alat Pemrograman Berbantuan AI dan Agent: ScreenCoder adalah sistem Agent yang mengubah desain UI menjadi kode frontend. Kilo Code dari Zai.org kini mendukung model GLM-4.5. Fitur “ultrathink” Claude Opus meningkatkan kemampuan berpikir model. Pengguna berhasil mengembangkan simulator drone otonom dan aplikasi iOS menggunakan Claude Opus, bahkan pengguna yang belum pernah memprogram pun berhasil mengembangkan aplikasi kompleks. Jules Agent terus ditingkatkan, Tasker AI sebagai asisten AI dapat mengontrol Agent untuk menyelesaikan tugas sehari-hari. Semua ini menunjukkan kemampuan pemberdayaan AI yang kuat dalam pemrograman dan pemrosesan tugas otomatis. (Sumber: TheTuringPost

TheTuringPost

, sbmaruf, Zai_org

Zai_org

, julesagent, _akhaliq, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI)

Comp AI: Alat Otomatisasi Kepatuhan yang Didukung AI Agent: Comp AI menggunakan AI Agent untuk mengotomatisasi proses kepatuhan, seperti pengumpulan bukti, penilaian risiko, penyusunan dan pembaruan kebijakan, yang dapat mempersingkat waktu kepatuhan SOC 2 dari 60 jam menjadi 2-4 jam. Alat ini bertujuan untuk mengatasi masalah utama kepatuhan perusahaan dan meningkatkan efisiensi. (Sumber: claud_fuen

claud_fuen

)

Hugging Face Terintegrasi ke Jan sebagai Penyedia Model Jarak Jauh: Hugging Face kini dapat diintegrasikan ke Jan sebagai penyedia model jarak jauh, memungkinkan pengguna untuk memilih dan menggunakan model apa pun di Hugging Face melalui kunci API Hugging Face di Jan. Ini sangat memfasilitasi akses dan aplikasi berbagai model bagi pengembang dan peneliti. (Sumber: ClementDelangue)

DocStrange: Pustaka Ekstraksi Data Dokumen Open-Source: DocStrange adalah pustaka Python open-source yang menyederhanakan proses ekstraksi data dokumen. Ini mendukung berbagai format input seperti PDF, gambar, Word, Excel, dan dapat menghasilkan output dalam format Markdown, JSON, CSV, HTML, serta mendukung ekstraksi bidang cerdas dan definisi Schema, menyediakan pemrosesan cloud gratis dan mode privasi lokal. (Sumber: Reddit r/MachineLearning, Reddit r/MachineLearning)

Vinsoo: Pendiri Generasi 00-an Mendefinisikan Ulang Paradigma Pemrograman AI: Yunsi Intelligent (AIYouthLab) meluncurkan Vinsoo AI IDE, lingkungan pengembangan terintegrasi pertama di dunia yang dilengkapi dengan tim pemrograman Agent berbasis cloud. Ini secara inovatif mendukung beberapa Agent cerdas untuk menjalankan tugas secara paralel, mencapai pengembangan otomatisasi seluruh proses mulai dari analisis kebutuhan hingga pengiriman akhir, dan menyediakan dua mode kerja: Vibe dan Full Cycle, menekankan isolasi keamanan lingkungan sandbox berbasis cloud. (Sumber: 量子位

00后创始人重新定义AI编程范式!全球首个搭载云端Agent编程团队的IDE来了!

)

Podcastfy.ai: Alat Pembuatan Podcast Multimodal Open-Source: Podcastfy.ai adalah pustaka Python open-source yang dapat mengubah konten multimodal (teks, gambar, video, PDF, dll.) menjadi dialog audio multibahasa yang menarik. Ini mendukung pembuatan podcast pendek atau panjang, penyesuaian gaya dialog dan bahasa, serta mengintegrasikan berbagai LLM dan model text-to-speech, bertujuan untuk menyediakan alternatif open-source untuk fitur podcast NotebookLM. (Sumber: GitHub Trending

souzatharsis/podcastfy - GitHub Trending (all/daily)

)

📚 PEMBELAJARAN

GEPA: Optimasi Prompt Reflektif Melampaui Pembelajaran Penguatan: GEPA adalah algoritma optimasi prompt reflektif jenis baru yang berkinerja sangat baik dalam optimasi LLM, bahkan melampaui algoritma pembelajaran penguatan tradisional GRPO pada beberapa tugas, dengan jumlah rollout yang dibutuhkan berkurang 35 kali lipat. Ini meningkatkan performa melalui mekanisme inovatif seperti pemilihan kandidat Pareto optimal, variasi prompt reflektif, dan penggabungan yang sadar sistem.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *