Berita AI – 2025-04-25(Pagi)

Kata Kunci:Model Inferensi, Agen AI, Pembelajaran Penguatan, Model Besar, DeepSeek-R1, Navigasi Visual-Bahasa (VLN), Pembelajaran Mandiri DINOv2, Agen LangGraph RAG, Lokalisasi Chip AI, Metode Optimasi SRPO, Transfer Keterampilan Operasi Kecerdasan Berwujud, Tata Kelola Komputasi Kuantum

🔥 Fokus

Model penalaran menjadi fokus baru AI, DeepSeek-R1 guncang industri: Menyusul rilis model seri o OpenAI yang berfokus pada penalaran terstruktur, open source dan performa luar biasa DeepSeek-R1 (terutama dalam matematika dan kode) menandai babak baru dalam persaingan model besar. Fokus industri bergeser dari skala parameter pra-pelatihan ke peningkatan kemampuan penalaran melalui reinforcement learning. Perusahaan besar domestik Tiongkok seperti Baidu (Wenxin X1), Alibaba (Tongyi Qianwen Qwen-QwQ-32B), Tencent (Hunyuán T1), ByteDance (Doubao 1.5), iFlytek (Spark X1) dengan cepat mengikuti, merilis model penalaran mereka sendiri, membentuk lanskap baru di mana model penalaran domestik menantang OpenAI. Pergeseran ini menekankan pentingnya kemampuan model untuk berpikir mendalam, merencanakan, menganalisis, dan menggunakan alat, menandakan bahwa implementasi aplikasi seperti Agent akan lebih bergantung pada model dasar penalaran yang kuat. (Sumber: 国产六大推理模型激战OpenAI?, “AI寒武纪”爆发至今,五类新物种登上历史舞台)

Model penalaran menjadi fokus baru AI, DeepSeek-R1 guncang industri

Aplikasi belanja AI Nate dilaporkan melakukan penipuan, pendiri dituduh menipu investasi $40 juta: Departemen Kehakiman AS menuduh pendiri aplikasi belanja AI Nate, Albert Saniger, menipu investasi dengan mempromosikan teknologi AI palsu. Nate mengklaim dapat menggunakan teknologi AI untuk menyederhanakan proses belanja lintas platform, memungkinkan checkout sekali klik, tetapi sebenarnya dituduh mempekerjakan ratusan karyawan di Filipina untuk memproses pesanan secara manual, menggunakan “manusia” untuk menyamar sebagai “kecerdasan”. Insiden ini mengungkap potensi gelembung dan risiko penipuan dalam demam startup AI, dan juga memicu diskusi tentang budaya Silicon Valley “Fake it till you make it”, menekankan batas antara promosi berlebihan dan penipuan. Kasus ini juga mencerminkan tantangan kelayakan teknis dari beberapa konsep aplikasi AI sebelum teknologi AI (terutama model besar) matang. (Sumber: AI购物竟是人工驱动,硅谷创投圈又玩出新花活)

Aplikasi belanja AI Nate dilaporkan melakukan penipuan, pendiri dituduh menipu investasi $40 juta

AI terintegrasi ke dalam alur kerja, merekonstruksi nilai tempat kerja dan model manajemen: AI bergerak dari konsep ke praktik, terintegrasi secara mendalam ke dalam operasi perusahaan dan pekerjaan sehari-hari karyawan. Alibaba Cloud menggunakan model besar dan tata kelola data untuk mewujudkan “dasbor manajemen operasi organisasi”, mengoptimalkan proses OKR/CRD; Deloitte China berkomitmen untuk membina puluhan ribu talenta AI untuk beradaptasi dengan kebutuhan organisasi padat kecerdasan; Yum China menerapkan alat AI hingga ke tingkat manajer restoran. Ini menunjukkan bahwa AI bukan hanya alat efisiensi, tetapi juga membentuk kembali sifat pekerjaan, struktur organisasi, dan kebutuhan bakat. Pekerjaan berulang dan terstandarisasi digantikan oleh AI, menuntut persyaratan yang lebih tinggi pada kreativitas karyawan, pemikiran kritis, pengambilan keputusan, dan kemampuan kolaborasi AI (adaptabilitas AI). Manajemen perusahaan perlu beralih dari pengawasan ke pemberdayaan, membangun paradigma baru dan mekanisme kepercayaan untuk kolaborasi manusia-AI. (Sumber: 当AI来和我做同事:重构职场价值坐标系, 重塑工作:AI时代的组织进化与管理革命)

AI terintegrasi ke dalam alur kerja, merekonstruksi nilai tempat kerja dan model manajemen

🎯 Perkembangan

Model visual self-supervised DINOv2 memperkenalkan mekanisme register: Meta AI Research memperbarui metode dan model pembelajaran self-supervised DINOv2, berdasarkan makalah “Vision Transformers Need Registers”, versi baru menambahkan mekanisme “register”. DINOv2 bertujuan untuk mempelajari fitur visual yang kuat tanpa pengawasan, yang dapat langsung digunakan untuk berbagai tugas computer vision (seperti klasifikasi, segmentasi, estimasi kedalaman), dan berkinerja baik di berbagai domain tanpa perlu fine-tuning. Pembaruan ini kemungkinan akan lebih meningkatkan kinerja model dan kualitas fitur. (Sumber: facebookresearch/dinov2 – GitHub Trending (all/daily))

Reinforcement Learning (RL) menjadi jalur kunci untuk pasca-pelatihan dan peningkatan kemampuan LLM: Cendekiawan seperti David Silver dan Richard Sutton menunjukkan bahwa AI memasuki “era pengalaman”, RL memainkan peran inti dalam tahap pasca-pelatihan LLM. Dengan belajar dari umpan balik manusia (RLHF), demonstrasi, atau aturan untuk model hadiah (Inverse RL), RL memberdayakan LLM dengan kemampuan optimasi berkelanjutan, eksplorasi, dan generalisasi yang melampaui pembelajaran imitasi (seperti SFT). Terutama dalam tugas penalaran (seperti matematika, kode), RL membantu model menemukan pola pemecahan yang lebih efektif (seperti rantai pemikiran yang panjang), menembus batasan metode berbasis data. Ini menandai perkembangan LLM dari ketergantungan pada data statis ke pembelajaran dinamis melalui interaksi dan umpan balik. (Sumber: 被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路)

Reinforcement Learning (RL) menjadi jalur kunci untuk pasca-pelatihan dan peningkatan kemampuan LLM

Visual-Language-Navigation (VLN) masih menjadi tantangan penting dalam embodied intelligence: Associate Professor Wu Qi dari Universitas Adelaide menunjukkan bahwa meskipun tugas manipulasi (Manipulation) sedang populer di bidang embodied intelligence, Visual-Language-Navigation (VLN) sebagai komponen kunci dari Visual-Language-Action (VLA), masih menghadapi banyak tantangan di lingkungan yang tidak terstruktur dan dinamis (terutama adegan rumah tangga), dan jauh dari terselesaikan sepenuhnya. Navigasi adalah dasar bagi robot untuk melakukan tugas-tugas berikutnya. Hambatan utama VLN saat ini meliputi kurangnya data berkualitas tinggi (simulator, lingkungan 3D, data tugas), kesenjangan transfer Sim2Real, dan kesulitan rekayasa penerapan yang efisien di sisi perangkat (edge). (Sumber: 阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈)

Visual-Language-Navigation (VLN) masih menjadi tantangan penting dalam embodied intelligence

AI menunjukkan jalur komersialisasi yang jelas di bidang periklanan dan pemasaran: Dibandingkan dengan skenario aplikasi AI lainnya, komersialisasi teknologi AI di bidang periklanan dan pemasaran tampaknya lebih jelas dan cepat. Dengan memanfaatkan AI untuk analisis data, pembuatan profil pengguna, penargetan presisi, dan pemasaran otomatis, perusahaan seperti Applovin Corp dan Zeta Global telah berhasil mengubah ekosistem periklanan, meningkatkan efisiensi dan laba atas investasi. Ini menunjukkan bahwa dalam gelombang AI, aplikasi yang dapat dengan cepat menghasilkan nilai komersial lebih mudah disukai pasar, dan pemasaran periklanan adalah contoh tipikalnya. (Sumber: “AI寒武纪”爆发至今,五类新物种登上历史舞台)

AI menunjukkan jalur komersialisasi yang jelas di bidang periklanan dan pemasaran

Ketegangan rantai pasokan chip AI dan tren lokalisasi: Persaingan teknologi Tiongkok-AS meningkat, kontrol ekspor AS terhadap chip AI ke Tiongkok (terutama model kelas atas seperti Nvidia H20) terus diperketat. Dilaporkan bahwa beberapa perusahaan teknologi Tiongkok (seperti ByteDance, Alibaba, Tencent) menimbun sejumlah besar chip Nvidia sebelum larangan berlaku untuk mempertahankan kemampuan R&D dan penerapan AI. Sementara itu, untuk mengatasi risiko rantai pasokan dan masalah “chokehold”, jalur teknologi AI yang sepenuhnya dilokalkan mendapat lebih banyak perhatian, misalnya, iFlytek melatih dan menerapkan model besar Spark-nya berdasarkan daya komputasi domestik seperti Huawei Ascend, yang mungkin menjadi tren penting untuk pengembangan AI domestik di masa depan. (Sumber: 国产六大推理模型激战OpenAI?, Reddit r/artificial, Reddit r/ArtificialInteligence)

Ketegangan rantai pasokan chip AI dan tren lokalisasi

🧰 Alat

Suna: Platform agen AI universal open source: Kortix AI meluncurkan Suna, sebuah Generalist AI Agent open source. Pengguna dapat melalui percakapan bahasa alami untuk meminta Suna membantu menyelesaikan berbagai tugas dunia nyata, termasuk riset web, analisis data, otomatisasi browser (navigasi web, ekstraksi data), manajemen file (pembuatan dan pengeditan dokumen), web crawling, pencarian diperluas, eksekusi baris perintah, penerapan situs web, serta mengintegrasikan berbagai API dan layanan. Suna bertujuan untuk menjadi pendamping digital pengguna, mengotomatiskan alur kerja yang kompleks. (Sumber: kortix-ai/suna – GitHub Trending (all/daily))

Suna: Platform agen AI universal open source

Repositori Leaked System Prompts mengumpulkan prompt internal dari berbagai model besar: Sebuah repositori populer bernama leaked-system-prompts muncul di GitHub, mengumpulkan dan mempublikasikan System Prompts internal dari beberapa model AI utama. Prompt ini mengungkapkan instruksi, aturan, pengaturan peran, dan batasan keamanan yang dirancang untuk diikuti oleh model. Repositori ini mencakup prompt yang bocor dari banyak model seperti seri Anthropic Claude (2.0, 2.1, 3 Haiku/Opus/Sonnet, 3.5 Sonnet, 3.7 Sonnet), Google Gemini 1.5, OpenAI ChatGPT (berbagai versi termasuk 4o), DALL-E 3, Microsoft Copilot, xAI Grok (berbagai versi), memberikan jendela bagi peneliti dan pengembang untuk memahami mekanisme kerja internal model-model ini secara mendalam. (Sumber: jujumilk3/leaked-system-prompts – GitHub Trending (all/daily))

Platform generasi video WAN meluncurkan layanan percepatan berbayar: Versi luar negeri dari platform generasi video AI WAN (WAN.Video) mengumumkan memasuki tahap komersialisasi, meluncurkan opsi berbayar. Semua pengguna masih dapat menikmati generasi video gratis tanpa batas (mode Relax), tetapi perlu mengantri. Pengguna berbayar dapat memperoleh layanan generasi prioritas tanpa antrian, sehingga mendapatkan hasil video lebih cepat. Ini menyediakan jalur percepatan bagi pengguna yang membutuhkan efisiensi tinggi atau untuk tujuan komersial. (Sumber: op7418)

Platform generasi video WAN meluncurkan layanan percepatan berbayar

Model Dia TTS hadir di Hugging Face API: Pengguna sekarang dapat langsung memanggil API model Text-to-Speech Dia 1.6B melalui platform Hugging Face, layanan ini didukung oleh FAL AI. Pengembang hanya memerlukan beberapa baris kode untuk mengintegrasikan, mewujudkan fungsi sintesis suara berkualitas tinggi. Integrasi ini menurunkan ambang batas untuk menggunakan model TTS canggih, memudahkan pengembang untuk dengan cepat menambahkan kemampuan suara dalam aplikasi mereka. (Sumber: huggingface)

Model klasifikasi ModernBERT terintegrasi dengan vLLM untuk inferensi cepat: Model ModernBERT sekarang dapat berjalan di kerangka kerja vLLM, secara signifikan meningkatkan kecepatan inferensi. Diklaim kecepatannya cukup untuk memproses lebih dari 200.000 makalah arXiv dalam beberapa menit. Integrasi ini memungkinkan ratusan model ModernBERT yang dihosting di Hugging Face Hub untuk diterapkan dan digunakan lebih cepat dalam tugas klasifikasi teks. (Sumber: huggingface)

Trackers: Pustaka pelacakan objek Python berkinerja tinggi: Roboflow merilis pustaka Python open source bernama Trackers, yang berfokus pada tugas pelacakan objek. Pustaka ini dirancang secara modular, mendukung berbagai algoritma pelacakan, dan dapat dengan mudah diintegrasikan dengan pustaka machine learning populer seperti Ultralytics dan Transformers. Performanya kuat, mampu melacak sejumlah besar objek secara bersamaan, dan berhasil melacak lebih dari 269 telur dalam video demo. (Sumber: karminski3)

Unsloth merilis teknologi kuantisasi Dynamic v2.0 GGUF dan modelnya: Unsloth meluncurkan teknologi kuantisasi baru Dynamic v2.0, yang dirancang khusus untuk model format GGUF. Diklaim bahwa versi kuantisasi ini berkinerja lebih baik daripada versi sebelumnya dalam evaluasi MMLU dan KL Divergence, serta memperbaiki masalah implementasi RoPE Llama-4 di Llama.cpp. Unsloth telah menggunakan teknologi ini untuk merilis model kuantisasi baru dari DeepSeek-R1 dan DeepSeek-V3-0324 untuk digunakan oleh komunitas. (Sumber: karminski3)

Unsloth merilis teknologi kuantisasi Dynamic v2.0 GGUF dan modelnya

Asisten suara Perplexity iOS mengintegrasikan fungsi sistem: Aplikasi iOS Perplexity memperbarui fungsi asisten suaranya, memungkinkannya memanggil lebih banyak operasi tingkat sistem. Pengguna sekarang dapat menggunakan perintah suara untuk meminta asisten Perplexity memesan restoran, menggunakan navigasi Apple Maps, membuat pengingat, mencari dan memutar Apple Music atau podcast, serta memesan tumpangan. Ini membuat asisten Perplexity lebih dekat fungsinya dengan asisten sistem asli seperti Siri, meningkatkan kepraktisannya. (Sumber: AravSrinivas)

Asisten suara Perplexity iOS mengintegrasikan fungsi sistem

Ekstensi VS Code MCP Server dirilis, menghubungkan Claude dengan lingkungan pengembangan lokal: Pengembang Juehang Qin merilis ekstensi VS Code yang mengubah VS Code menjadi server MCP (Model Context Protocol). Ini memungkinkan asisten AI seperti Claude untuk secara langsung mengakses dan memanipulasi ruang kerja yang sedang dibuka pengguna di VS Code, termasuk membaca/menulis file, melihat informasi diagnostik kode (seperti kesalahan dan peringatan), dll. Saat pengguna beralih proyek, ekstensi secara otomatis mengekspos ruang kerja baru, memudahkan asisten AI untuk berkolaborasi dengan mulus di antara proyek yang berbeda. (Sumber: Reddit r/ClaudeAI)

📚 Pembelajaran

DINOv2: Metode pembelajaran fitur visual self-supervised open source dari Meta: Meta AI Research merilis proyek DINOv2 secara open source, termasuk kode PyTorch dan model pra-terlatih. DINOv2 adalah metode pembelajaran self-supervised yang bertujuan untuk mempelajari fitur visual yang kuat dan umum, yang berkinerja sangat baik pada berbagai tugas computer vision (seperti klasifikasi gambar, segmentasi semantik, estimasi kedalaman) tanpa perlu fine-tuning untuk tugas hilir. Proyek ini menyediakan dokumentasi terperinci, tautan unduhan model, dan makalah terkait, menjadikannya sumber daya penting untuk penelitian dan penerapan pembelajaran visual self-supervised. (Sumber: facebookresearch/dinov2 – GitHub Trending (all/daily))

HD-EPIC: Dataset video first-person dengan detail tinggi dirilis: Para peneliti meluncurkan dataset HD-EPIC, yang berisi 41 jam video first-person yang direkam di lingkungan dapur nyata. Fitur utama dataset ini adalah anotasi multimodal yang sangat rinci, mencakup langkah-langkah resep, informasi nutrisi bahan (melalui catatan penimbangan), deskripsi tindakan halus (konten, cara, alasan), kembaran digital adegan 3D, lintasan pergerakan objek (2D/3D), masker tangan/objek, pelacakan pandangan mata, serta interaksi objek dengan adegan. Dataset ini bertujuan untuk menyediakan tolok ukur berkualitas tinggi untuk pemahaman visual first-person, embodied intelligence, dan penelitian interaksi manusia-komputer. (Sumber: CVPR 2025 | HD-EPIC定义第一人称视觉新标准:多模态标注精度碾压现有基准)

HD-EPIC: Dataset video first-person dengan detail tinggi dirilis

SRPO: Metode optimasi untuk mengatasi pelatihan RL lintas domain guna meningkatkan kemampuan penalaran LLM: Tim Kwaipilot dari Kuaishou, menanggapi hambatan kinerja dan masalah efisiensi yang dihadapi saat menggunakan metode reinforcement learning seperti GRPO untuk melatih LLM pada tugas campuran matematika dan kode, mengusulkan metode SRPO (Two-stage History Resampling Policy Optimization). Metode ini menggunakan data matematika pada tahap pertama untuk merangsang pemikiran mendalam, kemudian memperkenalkan data kode pada tahap kedua untuk mengembangkan pemikiran terprogram, dan menggabungkan teknik pengambilan sampel ulang historis untuk mengatasi masalah varians nol sinyal hadiah. Eksperimen menunjukkan bahwa SRPO hanya membutuhkan 10% langkah pelatihan untuk melampaui DeepSeek-R1-Zero-Qwen-32B pada AIME24 dan LiveCodeBench, menyediakan jalur efisien untuk meningkatkan kemampuan penalaran lintas domain. (Sumber: DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐)

TTRL: Reinforcement learning saat pengujian tanpa data berlabel: Universitas Tsinghua dan Shanghai AI Lab mengusulkan metode TTRL (Test-Time Reinforcement Learning), yang memungkinkan LLM melakukan reinforcement learning pada tahap pengujian tanpa anotasi manual. Metode ini memanfaatkan beberapa output sampel dari model itu sendiri, menghasilkan label semu dan sinyal hadiah melalui pemungutan suara mayoritas, dll., mendorong model untuk berevolusi sendiri guna beradaptasi dengan data atau tugas baru. Eksperimen menunjukkan bahwa TTRL dapat secara signifikan meningkatkan kinerja model pada tugas target, bahkan mendekati efek pelatihan terawasi, memberikan ide baru untuk mengatasi tantangan penerapan RL di lingkungan tanpa pengawasan. (Sumber: TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨)

SeekWorld: Tugas dan model penalaran geolokasi yang mensimulasikan pelacakan isyarat visual o3: Untuk meningkatkan kemampuan penalaran visual model bahasa besar multimodal (MLLM), terutama kemampuan untuk secara dinamis merasakan dan memanipulasi gambar (pelacakan isyarat visual) selama penalaran seperti model o3 OpenAI, para peneliti mengusulkan tugas penalaran geolokasi SeekWorld (menyimpulkan lokasi pengambilan gambar berdasarkan gambar). Dataset dibangun di sekitar tugas ini, dan model SeekWord-7B dilatih menggunakan reinforcement learning. Model ini melampaui model seperti Qwen-VL, Doubao Vision Pro, GPT-4o dalam penalaran geolokasi. Proyek ini menyediakan model, dataset, dan Demo online secara open source. (Sumber: 一张图片找出你在哪?o3-like 7B模型玩网络迷踪超越一流开闭源模型!)

ManipTrans: Transfer keterampilan manipulasi dari tangan manusia ke tangan robot yang cekatan: Peneliti dari Beijing General Artificial Intelligence Research Institute, Universitas Tsinghua, dan Universitas Peking mengusulkan metode ManipTrans untuk mentransfer keterampilan manipulasi dua tangan manusia secara efisien ke tangan robot yang cekatan di lingkungan simulasi. Metode ini menggunakan strategi dua tahap: pertama meniru gerakan tangan manusia melalui imitator lintasan umum, kemudian menyempurnakannya dengan pembelajaran residual dan batasan interaksi fisik. Berdasarkan metode ini, tim merilis dataset manipulasi tangan cekatan berskala besar DexManipNet, yang berisi urutan tugas kompleks seperti memutar tutup botol, menulis, menyendok, membuka tutup pasta gigi, dan memvalidasi kelayakan penerapan pada mesin nyata. (Sumber: 机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手)

ManipTrans: Transfer keterampilan manipulasi dari tangan manusia ke tangan robot yang cekatan

Tutorial LangGraph: Membuat Agen RAG dengan mekanisme refleksi: LangChain merilis tutorial video yang menjelaskan secara rinci cara menggunakan kerangka kerja LangGraph untuk membangun Agen RAG (Retrieval-Augmented Generation) yang memiliki kemampuan refleksi (Reflection). Ide intinya adalah menambahkan node evaluasi dalam alur RAG, memungkinkan Agen untuk meninjau informasi yang diambil sebelum menghasilkan jawaban akhir, menilai relevansi dan kualitasnya, dan memutuskan apakah akan mengambil ulang, memperbaiki kueri, atau langsung menghasilkan jawaban berdasarkan hasil evaluasi, sehingga secara efektif menyaring noise dan meningkatkan efek tanya jawab. (Sumber: LangChainAI)

Tutorial LangGraph: Membuat Agen RAG dengan mekanisme refleksi

Arena-Hard-v2.0: Tolok ukur evaluasi model besar yang lebih ketat: LMSYS Org memperbarui dan merilis tolok ukur evaluasi Arena-Hard ke versi 2.0. Versi baru ini didasarkan pada 500 prompt yang lebih menantang yang dikirimkan oleh pengguna LMArena, menggunakan model penilai otomatis yang lebih kuat (Gemini-2.5 & GPT-4.1), mendukung lebih dari 30 bahasa, dan menambahkan evaluasi kemampuan menulis kreatif. Bertujuan untuk menyediakan platform yang lebih sulit dan komprehensif untuk membedakan kinerja model besar teratas. (Sumber: lmarena_ai)

Arena-Hard-v2.0: Tolok ukur evaluasi model besar yang lebih ketat

PHYBench: Rilis tolok ukur untuk mengevaluasi kemampuan penalaran fisika LLM: Tim peneliti dari Universitas Peking meluncurkan PHYBench, sebuah tolok ukur evaluasi baru yang dirancang khusus untuk mengevaluasi kemampuan model bahasa besar dalam memahami dan menalar proses fisik dunia nyata. Tolok ukur ini berisi 500 pertanyaan yang dirancang berdasarkan skenario fisik nyata. Menurut hasil evaluasi awal yang disediakan dalam makalah, Gemini-2.5-Pro dari Google menunjukkan kinerja terdepan pada tolok ukur ini. (Sumber: karminski3)

PHYBench: Rilis tolok ukur untuk mengevaluasi kemampuan penalaran fisika LLM

💼 Bisnis

Alibaba Tongyi Qianwen dan FLock.io mengumumkan kemitraan strategis: Model besar Tongyi Qianwen (Qwen) dari Alibaba dan platform komputasi AI terdesentralisasi FLock.io mencapai kemitraan strategis. Kedua belah pihak bertujuan untuk bersama-sama mengeksplorasi dan mendorong implementasi praktis AI terdesentralisasi, menggabungkan kemampuan seri model open source Qwen dengan kerangka kerja teknologi terdesentralisasi FLock.io, untuk memberikan kemungkinan baru bagi pengembang dan pengguna AI. (Sumber: Alibaba_Qwen)

Laboratorium Alibaba Tongyi merekrut intern peneliti percakapan multi-giliran LLM: Laboratorium Tongyi Alibaba, yang bertanggung jawab atas R&D seri model besar Tongyi, tim kecerdasan percakapannya sedang merekrut intern tipe penelitian di Beijing dan Hangzhou, dengan fokus pada arah percakapan multi-giliran LLM. Bidang penelitian meliputi pemodelan hadiah generatif, perluasan model hadiah saat inferensi, reinforcement learning untuk tugas kreatif seperti bermain peran, serta percakapan multimodal teks-suara. Pelamar diharuskan mahasiswa PhD yang sedang studi, memiliki pengalaman publikasi makalah konferensi teratas, dan dapat menjamin waktu magang minimal 6 bulan. (Sumber: 北京/杭州内推 | 阿里通义实验室对话智能团队招聘LLM多轮对话方向研究实习生)

Laboratorium Alibaba Tongyi merekrut intern peneliti percakapan multi-giliran LLM

Alat produktivitas Remio merekrut intern operasi media sosial luar negeri: Startup Remio sedang mencari seorang intern yang akrab dengan media sosial luar negeri (Reddit, Hacker News, Twitter, dll.) dan bersemangat tentang alat produktivitas. Tanggung jawab utama adalah melakukan operasi media sosial dan pembuatan konten. Posisi ini menerima pekerjaan jarak jauh, dapat dilamar baik di Tiongkok maupun Amerika Utara, dengan persyaratan tertentu pada nilai karma Reddit (disarankan 100+). (Sumber: dotey)

Perusahaan API Kong tim Shanghai merekrut insinyur dan intern: Perusahaan Kong (terkenal dengan API gateway open source-nya) tim Tiongkok (berlokasi di Shanghai) sedang memperluas rekrutmen, menawarkan beberapa posisi termasuk intern dan penuh waktu. Arah rekrutmen meliputi pengembangan Rust, AI Gateway, Kong Gateway, dan pengembangan front-end. Pengembang yang tertarik dengan tumpukan teknologi terkait dapat memperhatikan. (Sumber: dotey)

Perusahaan API Kong tim Shanghai merekrut insinyur dan intern

Webtoon menggunakan LangGraph untuk mengurangi beban kerja peninjauan konten sebesar 70%: Platform komik digital terkenal global Webtoon menggunakan kerangka kerja LangGraph dari LangChain untuk membangun sistem bernama WCAI (Webtoon Comprehension AI). Sistem ini menggunakan Agen AI multimodal untuk secara otomatis memahami konten komik, termasuk mengidentifikasi karakter dan mengatribusikan dialog, mengekstrak plot dan nada emosional, serta mendukung kueri bahasa alami. WCAI telah digunakan oleh tim pemasaran, terjemahan, dan rekomendasi, berhasil mengurangi beban kerja penelusuran dan peninjauan manual sebesar 70%, meningkatkan efisiensi pemrosesan konten dan dukungan kreatif. (Sumber: LangChainAI)

Webtoon menggunakan LangGraph untuk mengurangi beban kerja peninjauan konten sebesar 70%

Meta AI merekrut talenta penelitian di ICLR 2025: Tim Meta AI berpartisipasi dalam konferensi ICLR 2025 yang diadakan di Singapura dan mendirikan stan (#L03) untuk berinteraksi dengan peserta. Pada saat yang sama, Meta AI secara aktif mempublikasikan informasi rekrutmen, mencari Ilmuwan Riset AI, Peneliti Postdoctoral, dan Asisten Riset (PhD), dengan arah penelitian termasuk teori pembelajaran inti, AI generatif 3D, AI generatif bahasa, dll. Lokasi kerja melibatkan pusat penelitian global seperti Paris. (Sumber: AIatMeta)

Meta AI merekrut talenta penelitian di ICLR 2025

🌟 Komunitas

Andrew Ng: Pemrograman berbantuan AI menurunkan hambatan bahasa, meningkatkan kemampuan lintas domain pengembang: Cendekiawan AI terkenal Andrew Ng menunjukkan bahwa alat pemrograman berbantuan AI secara mendalam mengubah pengembangan perangkat lunak. Bahkan jika tidak mahir dalam bahasa tertentu (seperti JavaScript), pengembang dapat menggunakan bantuan AI untuk menulis kode secara efisien, sehingga lebih mudah membangun aplikasi lintas platform dan lintas domain (seperti pengembang backend membangun frontend). Meskipun sintaks bahasa tertentu menjadi kurang penting, memahami konsep pemrograman inti (struktur data, algoritma, prinsip kerangka kerja spesifik seperti React) tetap krusial, ini membantu memandu AI dengan lebih tepat dan memecahkan masalah. AI membuat pengembang menjadi lebih “multi-bahasa”. (Sumber: AndrewYNg)

CEO Microsoft AI mengatakan Copilot memberikan informasi penundaan penerbangan lebih awal: Kepala departemen AI Microsoft, Mustafa Suleyman, berbagi “momen ajaib” di platform X: asisten AI Copilot yang digunakannya memberitahukan penundaan penerbangannya lebih awal daripada pemberitahuan resmi bandara. Setelah dikonfirmasi dengan staf gerbang keberangkatan, informasi tersebut benar, hanya saja belum diumumkan secara publik. Ini menunjukkan potensi AI dalam mengintegrasikan dan menyampaikan informasi real-time, yang mungkin melampaui saluran rilis informasi tradisional. (Sumber: mustafasuleyman)

CEO Microsoft AI mengatakan Copilot memberikan informasi penundaan penerbangan lebih awal

Komunitas membahas kelebihan dan kekurangan GPT-4.5 dan o1 Pro pada tugas yang berbeda: Pengguna platform X membahas pengalaman menggunakan model OpenAI yang berbeda dalam aplikasi praktis. Seorang pengguna berpendapat bahwa GPT-4.5 berkinerja sangat baik dalam tugas menulis dan menerjemahkan, tetapi dibatasi oleh jendela konteks yang lebih kecil, efeknya menurun saat memproses teks panjang. Sebaliknya, model o1 Pro yang ditujukan untuk pengguna Pro memiliki jendela konteks 128K, berkinerja lebih stabil dan andal saat memproses input kode panjang, sehingga lebih cocok untuk tugas pemrograman. Ini mencerminkan perbedaan fokus dalam desain dan optimasi model yang berbeda. (Sumber: dotey)

Komunitas membahas kelebihan dan kekurangan GPT-4.5 dan o1 Pro pada tugas yang berbeda

Hugging Face Hub direkomendasikan sebagai platform pembelajaran dan pertukaran AI: Pengguna platform X merekomendasikan Hugging Face Hub tidak hanya sebagai gudang model dan dataset, tetapi juga sebagai komunitas pembelajaran dan pertukaran AI yang aktif. Pengguna dapat menemukan insinyur dan peneliti di bagian diskusi model, dataset, atau Spaces yang berbagi proses eksperimen mereka, masalah yang dihadapi, solusi, serta diskusi tentang makalah penelitian terkait, sehingga memperoleh pengalaman praktis langsung dan wawasan mendalam. (Sumber: huggingface)

ChatGPT “mengolok-olok” budaya komunitas Reddit memicu diskusi hangat: Seorang pengguna Reddit meminta ChatGPT untuk “mengolok-olok” (roast) platform Reddit. Respons yang dihasilkan oleh ChatGPT secara akurat menangkap dan menyindir beberapa ciri khas komunitas Reddit, seperti pandangan pengguna yang penuh kontradiksi, terlalu peduli pada suka (karma), kurang pengalaman nyata tetapi memberikan saran tingkat ahli, serta perilaku “keyboard warrior” di subreddit tertentu. Postingan ini memicu diskusi di antara pengguna komunitas dan kreasi tiruan lebih lanjut. (Sumber: Reddit r/ArtificialInteligence)

Orisinalitas dan nilai konten yang dihasilkan AI memicu pemikiran: Sebuah postingan di Reddit memicu diskusi tentang orisinalitas konten yang dihasilkan AI. Postingan tersebut menggunakan contoh “Mona Lisa”, menunjukkan bahwa kreasi manusia itu sendiri juga merupakan “remix” berdasarkan pengalaman, sedangkan AI menghasilkan konten di bawah arahan manusia, prosesnya lebih seperti “master membimbing magang” daripada sekadar menyalin. Diskusi berpendapat bahwa kuncinya bukan apakah AI dapat “orisinal”, tetapi bagaimana cara memberikan atribusi yang wajar, menghormati hak pencipta asli, serta menilai niat dan nilai karya tersebut. (Sumber: Reddit r/ArtificialInteligence)

Komunitas mempertanyakan efektivitas papan peringkat model besar (LLM Leaderboard): Pengguna komunitas Reddit r/LocalLLaMA menyatakan keraguan saat membahas papan peringkat model besar berbasis skor Elo seperti LMSYS Arena. Beberapa komentar berpendapat bahwa papan peringkat semacam itu mungkin lebih mencerminkan “gaya” atau “rasa” model (seperti bertele-tele, menggunakan Markdown dan emoji), daripada kemampuan komprehensif yang sebenarnya. Selain itu, interval kepercayaan skor Elo antara model teratas sering tumpang tindih, membuat signifikansi statistik perbedaan peringkat diragukan. (Sumber: Reddit r/LocalLLaMA)

Pengguna mengamati berbagai “perilaku emergen” ChatGPT: Seorang pengguna Reddit berbagi beberapa perilaku “tak terduga” yang ditemui saat menggunakan ChatGPT baru-baru ini, dan mengklasifikasikannya sebagai “perilaku emergen”. Secara spesifik meliputi: 1. Tanpa dikoreksi, model menyadari bahwa ia salah memahami instruksi (mencampuradukkan riwayat obrolan dan dokumen yang diunggah), dan secara proaktif meminta maaf serta mengoreksi. 2. Setelah topik sensitif yang disebutkan pengguna dihapus oleh sistem, model secara proaktif mengutip konten yang dihapus dalam percakapan berikutnya untuk menyatakan kepedulian. 3. Saat membahas kesulitan menguji pemikiran spontan AI, model secara proaktif menciptakan konsep analogi “Prinsip Rekursi Ketidakpastian Heisenberg”. Kasus-kasus ini memicu diskusi tentang batas kesadaran diri, memori, dan kreativitas LLM. (Sumber: Reddit r/ArtificialInteligence)

💡 Lain-lain

Google DeepMind memperbarui set alat Music AI Sandbox: Google DeepMind mengumumkan penambahan fitur baru ke Music AI Sandbox-nya. Ini adalah seperangkat alat AI eksperimental yang ditujukan untuk musisi profesional, dirancang untuk membantu penciptaan musik. Fitur baru ini didukung oleh model Lyria 2 terbarunya, yang dapat membantu penulis lagu dan musisi lainnya menjelajahi inspirasi kreatif, menghasilkan potongan musik, dll. (Sumber: demishassabis)

Diskusi prinsip tata kelola komputasi kuantum: Anggota komunitas berbagi dan mendiskusikan prinsip-prinsip tata kelola komputasi kuantum. Seiring berkembangnya teknologi komputasi kuantum, potensinya yang besar dalam kriptografi, ilmu material, pengembangan obat, serta kombinasi dengan AI/ML menarik perhatian, sekaligus membawa tantangan dalam hal keamanan, etika, dan tata kelola, yang memerlukan penyusunan norma yang sesuai sebelumnya. (Sumber: Ronald_vanLoon)

Diskusi prinsip tata kelola komputasi kuantum

MIT mengembangkan robot lunak wearable berbentuk pisang: Peneliti MIT mengembangkan jenis baru robot lunak wearable, yang bentuknya menyerupai pisang dan mengintegrasikan kemampuan penginderaan. Penelitian ini menunjukkan potensi aplikasi robot lunak dalam interaksi manusia-robot, rehabilitasi medis, dan perangkat wearable, struktur fleksibelnya dan penginderaan terintegrasi memberikan kemungkinan untuk interaksi fisik yang lebih alami dan aman. (Sumber: Ronald_vanLoon)

Kemajuan teknologi robotika yang didorong AI: Media sosial baru-baru ini menampilkan beberapa kemajuan teknologi robotika, yang biasanya didukung oleh atau terkait dengan AI: 1. SR-02: “Tunggangan robot” berkaki empat yang dapat membawa empat orang. 2. SnapBot: Robot berkaki yang mampu berubah bentuk. 3. Matic: Robot pembersih rumah yang meniru sistem visual FSD Tesla. 4. micropsi: Startup Jerman mengembangkan sistem AI yang memungkinkan robot menangani tugas yang tidak dapat diprediksi. 5. Boston Dynamics Spot: Anjing robot diuji di lingkungan alami. 6. Lomba lari robot humanoid: Menunjukkan kemampuan atletik robot humanoid. 7. Lengan robot menulis tangan: Menunjukkan kemampuan manipulasi halus robot. (Sumber: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

Kemajuan teknologi robotika yang didorong AI