Anahtar Kelimeler:OpenAI, LLM çıkarımı, Uluslararası Matematik Olimpiyatı, AI eğitim veri seti, kişisel veri gizliliği, ChatGPT Ajanı, AI modeli politik tarafsızlık, Kimi K2, IMO altın madalya seviyesi başarı, DataComp CommonPool veri seti, LLM ajan zekası, Beyaz Saray AI yürütme emri, MoE mimarisi
🔥 Odak Noktası
OpenAI’nin deneysel çıkarım LLM’si Uluslararası Matematik Olimpiyatları’nda altın madalya kazandı: OpenAI’nin en yeni deneysel çıkarım LLM’si, 2025 Uluslararası Matematik Olimpiyatları’nda (IMO) 6 sorudan 5’ini çözerek altın madalya seviyesinde bir performans sergiledi. Model, her biri 4,5 saatlik süre sınırlaması dahil olmak üzere insanlarla aynı kurallar altında çalıştı ve herhangi bir araç kullanmadan doğal dilde ispat süreci üretti. Bu, AI’nin matematiksel çıkarım alanında önemli bir atılımı işaret ediyor ve AI’nin bilimsel keşiflerdeki potansiyelini gösteriyor. (Kaynak: gdb, scaling01, dmdohan, SebastienBubeck, markchen90, npew, MillionInt, cloneofsimo, bookwormengr, tokenbender)
AI eğitim veri kümesi CommonPool milyonlarca kişisel veri içeriyor: Araştırmalar, büyük açık kaynaklı AI eğitim veri kümesi DataComp CommonPool’un milyonlarca pasaport, kredi kartı, doğum belgesi ve diğer kişisel olarak tanımlanabilir bilgileri içeren belge görüntüsü içerdiğini ortaya koydu. Araştırmacılar, CommonPool’un %0,1’ini denetleyerek binlerce tanımlanabilir bilgi içeren görüntü buldu ve veri kümesindeki bu tür görüntülerin sayısının yüz milyonlarca olabileceğini tahmin etti. Bu, AI eğitim verilerinin gizliliği konusunda endişelere yol açtı ve makine öğrenimi topluluğunun ayrım gözetmeyen web kazıma uygulamalarını yeniden düşünmesi çağrısında bulunuldu. (Kaynak: MIT Technology Review)

🎯 Gelişmeler
OpenAI, kişisel asistan ChatGPT Agent’ı piyasaya sürdü: OpenAI, kullanıcı adına görevleri yerine getirmek için kendi “sanal bilgisayarını” oluşturabilen kişisel asistan ChatGPT Agent’ı piyasaya sürdü. Bu, LLM ajan zekasında önemli bir adımı temsil ediyor, ancak özellik hala erken aşamada ve görevleri tamamlamak biraz zaman alabilir. (Kaynak: MIT Technology Review, The Verge, Wired)
Beyaz Saray, AI modellerinin “politik olarak tarafsız ve önyargısız” olmasını gerektiren bir yürütme emri hazırlıyor: Beyaz Saray, AI modellerinin “politik olarak tarafsız ve önyargısız” olmasını gerektiren bir yürütme emri hazırlıyor. Uyumluluk, federal sözleşmelere hak kazanıp kazanmayacağını belirleyecek ve bu, tüm AI laboratuvarları için büyük bir mesele. Yürütme emrinin önümüzdeki hafta yayınlanması bekleniyor. (Kaynak: WSJ, MIT Technology Review, natolambert)

Kimi K2: Araç kullanma yeteneğine sahip ajan zekası modeli: Kimi_Moonshot tarafından yayınlanan Kimi K2, araç kullanma yeteneğine sahip bir ajan zekası modelidir. Araç kullanımı, matematik, kodlama ve çok adımlı görevlerde mükemmel performans gösterir ve şu anda Arena’da birinci sıradaki açık kaynaklı model ve genel olarak beşinci sıradadır. Kimi K2, DeepSeek-V3’e benzer büyük ölçekli uzman karışımı (MoE) mimarisini benimser ve 1 trilyon toplam parametreye ve 32 milyar aktif parametreye sahiptir. (Kaynak: TheTuringPost)
🧰 Araçlar
GitHub MCP sunucusu, AI araçlarını GitHub platformuna bağlıyor: GitHub MCP sunucusu, AI araçlarının doğrudan GitHub platformuna bağlanmasına olanak tanır ve AI ajanlarının, yardımcılarının ve sohbet robotlarının depoları ve kod dosyalarını okumasına, sorunları ve PR’leri yönetmesine, kodu analiz etmesine ve iş akışlarını otomatikleştirmesine olanak tanır; tüm bunlar doğal dil etkileşimi yoluyla gerçekleştirilir. (Kaynak: GitHub Trending)
ik_llama.cpp: Daha iyi CPU performansına sahip llama.cpp çatalı: ik_llama.cpp, daha iyi CPU ve karma GPU/CPU performansı, yeni SOTA niceleme türleri, birinci sınıf Bitnet desteği, MLA, FlashMLA, kaynaşmış MoE işlemleri ve tensör kaplaması yoluyla geliştirilmiş DeepSeek performansı ve karma GPU/CPU çıkarımı için satır aralıklı niceleme paketlemesi gibi özelliklere sahip bir llama.cpp çatalıdır. (Kaynak: GitHub Trending)
📚 Öğrenme
PyTorch derin öğrenme kursu materyalleri: mrdbourke/pytorch-deep-learning, “PyTorch Derin Öğrenmeyi Sıfırdan Öğrenin” kursu için çevrimiçi kitap sürümü, YouTube’daki ilk beş bölümün videoları, alıştırmalar ve ek dersler dahil olmak üzere materyaller sağlar. Kurs, kod uygulamasına ve deneylere odaklanır ve PyTorch temellerini, iş akışlarını, sinir ağı sınıflandırmasını, bilgisayarlı görmeyi, özel veri kümelerini, transfer öğrenmeyi, deney izlemeyi ve model dağıtımını kapsar. (Kaynak: GitHub Trending)

MIT Press, algoritmalar ve makine öğrenimi üzerine üç kitabı ücretsiz olarak sunuyor: MIT Press, algoritma teorisi ve temel makine öğrenimi algoritmaları üzerine üç kitap sunuyor: Optimizasyon Algoritmaları, Karar Algoritmaları ve Doğrulama Algoritmaları. Bu kitaplar, algoritmalar ve makine öğrenimi hakkında derinlemesine bilgi edinmek için mükemmeldir. (Kaynak: TheTuringPost, TheTuringPost)
Enerji tabanlı Transformer’lar ölçeklenebilir öğrenenler ve düşünenlerdir: Bir makale, girdi ve aday tahminler arasındaki uyumluluğu açıkça doğrulayarak ve tahmin problemini bu doğrulayıcı hakkında bir optimizasyon olarak yeniden tanımlayarak yalnızca denetimsiz öğrenmeden “düşünmeyi” öğrenmeyi sağlayan yeni bir enerji tabanlı model (EBM) türü olan enerji tabanlı Transformer’ları (EBT’ler) araştırıyor. (Kaynak: )

🌟 Topluluk
LLM’ler için bağlam mühendisliği hakkında dersler: ManusAI ekibi, AI ajanları için bağlam mühendisliği oluşturmadaki deneyimlerinden dersler paylaştı ve KV önbelleğinin, dosya sisteminin, hata izlemenin ve diğerlerinin ajan tasarımındaki önemini vurguladı. (Kaynak: dotey, AymericRoucher, vllm_project)
Kimi K2 ile Gemini’nin gerçek dünya performans karşılaştırması: ClementDelangue ve jeremyphoward, pash’ın Kimi K2’nin gerçek dünya görevlerinde Gemini’den daha iyi performans gösterdiğini belirten ve ilgili grafik verilerini sağlayan tweet’ini retweetledi. (Kaynak: ClementDelangue, jeremyphoward)
OpenAI’nin IMO altın madalyası sürpriz oldu: OpenAI’nin LLM’sinin IMO’da altın madalya kazanması birçok kişi için beklenmedikti ve toplulukta geniş bir tartışmaya yol açtı. (Kaynak: kylebrussell, VictorTaelin)
💼 İş Dünyası
Anthropic, Claude Code kullanımını kısıtlıyor: Anthropic, Claude Code kullanımını kullanıcılara bildirmeden kısıtladı ve bu da kullanıcı şikayetlerine ve kapalı ürünler konusundaki endişelere yol açtı. (Kaynak: jeremyphoward, HamelHusain)
Meta, Avrupa AI anlaşmasını imzalamayı reddetti: Meta, aşırı müdahaleci olduğunu ve AI gelişimini engelleyeceğini iddia ederek Avrupa AI anlaşmasını imzalamayı reddetti. (Kaynak: Reddit r/artificial, Reddit r/ArtificialInteligence)
💡 Diğer
Dizüstü bilgisayarınızda bir LLM nasıl çalıştırılır: MIT Technology Review, gizlilik konusunda endişeli, büyük LLM şirketlerinin kontrolünden kurtulmak isteyen veya yeni şeyler denemeyi seven kullanıcılar için bir dizüstü bilgisayarda büyük dil modellerini (LLM’ler) çalıştırma konusunda bir kılavuz yayınladı ve LLM’leri yerel olarak çalıştırmak için adımlar ve öneriler sundu. (Kaynak: MIT Technology Review, MIT Technology Review)
“Üç ebeveynli bebeklerin” kısa tarihi: MIT Technology Review, “üç ebeveynli bebeklerin” tarihini gözden geçirdi ve tekniğin farklı yaklaşımlarını, tartışmalarını ve en son araştırmalardaki gelişmeleri, Birleşik Krallık’ta bir denemede sekiz bebeğin doğumunu da içeren bir şekilde ele aldı. (Kaynak: MIT Technology Review, MIT Technology Review)
İlk günden itibaren AI ajanlarından nasıl değer elde edilir: Bu makale, işletmelerin AI ajanlarından nasıl değer elde edebileceğini araştırıyor ve işletmelere yinelemeli bir yaklaşım benimsemelerini, “kolay kazançlar” ve artımlı kullanım durumlarıyla başlamalarını ve gelecekteki çok ajanlı sistemler için birlikte çalışabilirliği önceliklendirmelerini öneriyor. (Kaynak: MIT Technology Review)