Kata Kunci:OpenAI GDPval benchmark, Claude Opus 4.1, GPT-5, Evaluasi AI, Kinerja tugas ekonomi, Penilaian dampak ekonomi model AI, Claude Opus 4.1 vs GPT-5, Pengujian benchmark GDPval, Kemampuan aplikasi praktis AI, Perbandingan kinerja AI multi-industri
🔥 Fokus
OpenAI Merilis Benchmark GDPval: Claude Opus 4.1 Mengungguli GPT-5 : OpenAI telah merilis benchmark GDPval baru untuk mengevaluasi kinerja model AI dalam tugas-tugas ekonomi dunia nyata di 9 industri dan 44 profesi. Hasil awal menunjukkan bahwa Claude Opus 4.1 dari Anthropic mencapai atau melampaui tingkat ahli manusia di hampir setengah tugas, mengungguli GPT-5. OpenAI mengakui keunggulan Claude dalam estetika, sementara GPT-5 memimpin dalam akurasi. Ini menandai pergeseran dalam evaluasi AI untuk mengukur dampak ekonomi praktis dan mengungkapkan kemajuan pesat dalam kemampuan AI. (Sumber: OpenAI, menhguin, MillionInt, _sholtodouglas, polynoamial, menhguin, aidan_mclau, sammcallister, menhguin, andy_l_jones, tokenbender, scaling01, scaling01, scaling01, scaling01, scaling01, scaling01, alexwei_, scaling01, scaling01, scaling01, gdb, teortaxesTex, snsf, dilipkay, scaling01, scaling01, jachiam0, jachiam0, sama, ClementDelangue, AymericRoucher, shxf0072, Reddit r/artificial, 36氪, 36氪, 36氪)

AI dan “Lingkaran Setan” Wikipedia untuk Bahasa Rentan : Model AI mempelajari bahasa dengan mengambil teks dari internet, dan Wikipedia sering menjadi sumber data online terbesar untuk bahasa-bahasa yang rentan. Namun, sejumlah besar konten berkualitas rendah yang diterjemahkan oleh AI membanjiri versi Wikipedia kecil ini, menyebabkan kesalahan yang meluas. Ini menciptakan lingkaran setan “sampah masuk, sampah keluar” yang dapat membuat terjemahan AI untuk bahasa-bahasa ini menjadi kurang dapat diandalkan, sehingga mempercepat kemunduran bahasa-bahasa yang rentan. Wikipedia bahasa Greenland telah diusulkan untuk ditutup karena masalah “omong kosong” yang disebabkan oleh alat AI. Ini menyoroti potensi dampak negatif AI terhadap keragaman budaya dan pelestarian bahasa. (Sumber: MIT Technology Review, MIT Technology Review)

Peneliti Top OpenAI, Song Yang, Pindah ke Meta : Song Yang, kepala tim eksplorasi strategis OpenAI dan kontributor kunci model difusi, telah pindah ke tim MSL Meta, melapor kepada Chief Scientist Zhao Shengjia. Song Yang adalah seorang jenius muda yang masuk Universitas Tsinghua pada usia 16 tahun dan dikenal atas pencapaiannya seperti Consistency Models selama di OpenAI, dianggap sebagai salah satu “otak terkuat” di industri. Perpindahan ini adalah peristiwa besar lainnya dalam upaya Meta untuk merekrut talenta dari OpenAI, memicu perhatian industri terhadap persaingan talenta AI dan arah penelitian. (Sumber: 36氪, dotey, jeremyphoward, teortaxesTex)

China Telecom Tianyi AI Merilis Dataset Berkualitas Tinggi Lebih dari 10 Triliun Tokens : China Telecom Tianyi AI telah merilis data korpus model besar umum dengan total penyimpanan 350TB dan lebih dari 10 triliun tokens, serta dataset profesional yang mencakup 14 industri utama. Dataset ini telah dianotasi dan dioptimalkan dengan cermat, mencakup data industri multimodal, yang bertujuan untuk meningkatkan kinerja model AI dan kemampuan generalisasi. China Telecom menekankan bahwa dataset berkualitas tinggi adalah bahan bakar inti untuk pengembangan AI, dan mengandalkan platform Xingchen MaaS untuk membangun lingkaran tertutup “data-model-layanan”, berkomitmen untuk mempromosikan pengembangan AI yang inklusif dan inovasi lokalisasi, serta telah berhasil melatih model besar dengan triliunan parameter. (Sumber: 量子位)

**Guoxing Yuhang China Mencapai Kom