Anahtar Kelimeler:Çıkarım modeli, Yapay Zeka Ajanı, Pekiştirmeli Öğrenme, Büyük Dil Modeli, DeepSeek-R1, Görsel-Dil-Navigasyon (VLN), DINOv2 kendi kendine denetimli öğrenme, LangGraph RAG Ajanı, Yerli Yapay Zeka Çipleri, SRPO optimizasyon yöntemi, Somutlaştırılmış yapay zeka operasyon becerisi transferi, Kuantum hesaplama yönetişimi
🔥 Odak Noktası
Çıkarım Modelleri Yapay Zekanın Yeni Odağı Haline Geldi, DeepSeek-R1 Sektörde Sarsıntı Yarattı: OpenAI’nin yapılandırılmış çıkarıma odaklanan o serisi modellerini yayınlamasının ardından, DeepSeek-R1’in açık kaynaklı olması ve üstün performansı (özellikle matematik ve kodlama alanlarında) büyük model rekabetinin yeni bir aşamaya girdiğini gösteriyor. Sektörün odak noktası, ön eğitim parametre ölçeğinden pekiştirmeli öğrenme yoluyla çıkarım yeteneğini artırmaya kayıyor. Baidu (Wenxin X1), Alibaba (Tongyi Qianwen Qwen-QwQ-32B), Tencent (Hunyuan T1), ByteDance (Doubao 1.5), iFlytek (Xinghuo X1) gibi yerli büyük şirketler hızla bu akıma katılarak kendi çıkarım modellerini yayınladı ve yerli çıkarım modellerinin OpenAI’ye karşı yeni bir rekabet ortamı oluşturdu. Bu değişim, modellerin derin düşünme, planlama, analiz ve araç çağırma yeteneklerinin önemini vurguluyor ve Agent gibi uygulamaların hayata geçirilmesinin daha güçlü çıkarım temel modellerine dayanacağını gösteriyor. (Kaynak: 国产六大推理模型激战OpenAI?, “AI寒武纪”爆发至今,五类新物种登上历史舞台)

AI Alışveriş Uygulaması Nate’in Dolandırıcılık Yaptığı Ortaya Çıktı, Kurucusu 40 Milyon Dolarlık Yatırımı Dolandırmakla Suçlanıyor: ABD Adalet Bakanlığı, AI alışveriş uygulaması Nate’in kurucusu Albert Saniger’ı, AI teknolojisi hakkında yanlış beyanlarda bulunarak yatırımcıları dolandırmakla suçladı. Nate, AI teknolojisini kullanarak platformlar arası alışveriş sürecini basitleştirdiğini ve tek tıkla sipariş imkanı sunduğunu iddia ediyordu, ancak aslında Filipinler’de yüzlerce çalışanı işe alarak siparişleri manuel olarak işlediği ve “yapay” yerine “insan” gücü kullandığı iddia ediliyor. Bu olay, AI girişimciliği furyasında var olabilecek balonları ve dolandırıcılık risklerini ortaya çıkardı, aynı zamanda Silikon Vadisi’nin “Fake it till you make it” kültürü üzerine tartışmaları alevlendirdi ve abartılı tanıtım ile aldatma arasındaki çizgiyi vurguladı. Bu dava aynı zamanda AI teknolojisi (özellikle büyük modeller) olgunlaşmadan önce bazı AI uygulama konseptlerinin teknik fizibilite zorluklarını da yansıtıyor. (Kaynak: AI购物竟是人工驱动,硅谷创投圈又玩出新花活)

AI İş Akışlarına Entegre Oluyor, İşyeri Değerini ve Yönetim Modellerini Yeniden Yapılandırıyor: AI, konsept aşamasından uygulamaya geçerek kurumsal operasyonlara ve çalışanların günlük işlerine derinlemesine entegre oluyor. Alibaba Cloud, büyük modelleri ve veri yönetimini kullanarak “kurumsal operasyon yönetim kokpiti” oluşturuyor ve OKR/CRD süreçlerini optimize ediyor; Deloitte China, bilgi yoğun organizasyon ihtiyaçlarına uyum sağlamak için on binlerce AI uzmanı yetiştirmeyi hedefliyor; Yum China, AI araçlarını restoran müdürü seviyesine kadar dağıtıyor. Bu durum, AI’ın sadece bir verimlilik aracı olmadığını, aynı zamanda işin doğasını, organizasyon yapısını ve yetenek taleplerini yeniden şekillendirdiğini gösteriyor. Tekrarlayan, standartlaştırılmış işler AI tarafından devralınırken, çalışanların yaratıcılık, eleştirel düşünme, karar verme ve AI işbirliği yeteneklerine (AI uyumluluğu) daha yüksek bir talep ortaya çıkıyor. Kurumsal yönetim, denetimden yetkilendirmeye doğru kaymalı, insan ve AI işbirliğine dayalı yeni bir paradigma ve güven mekanizması oluşturmalıdır. (Kaynak: 当AI来和我做同事:重构职场价值坐标系, 重塑工作:AI时代的组织进化与管理革命)

🎯 Eğilimler
DINOv2 Kendi Kendine Denetimli Görsel Modeli Kayıt Mekanizmasını Tanıttı: Meta AI Research, DINOv2 kendi kendine denetimli öğrenme yöntemini ve modelini güncelledi. “Vision Transformers Need Registers” adlı makaleye göre, yeni sürüme “kayıtlar” (registers) mekanizması eklendi. DINOv2, denetimsiz olarak sağlam görsel özellikler öğrenmeyi hedefler; bu özellikler, sınıflandırma, segmentasyon, derinlik tahmini gibi çeşitli bilgisayarlı görü görevlerinde doğrudan kullanılabilir ve alanlar arası performansı iyidir, ince ayar gerektirmez. Bu güncelleme, modelin performansını ve özellik kalitesini daha da artırabilir. (Kaynak: facebookresearch/dinov2 – GitHub Trending (all/daily))
Pekiştirmeli Öğrenme (RL), LLM Sonrası Eğitim ve Yetenek Geliştirmenin Anahtar Yolu Haline Geliyor: David Silver ve Richard Sutton gibi akademisyenler, AI’ın “Deneyim Çağı”na girdiğini ve RL’nin LLM sonrası eğitim aşamasında merkezi bir rol oynadığını belirtiyor. İnsan geri bildiriminden (RLHF), gösterimlerden veya kurallardan öğrenen ödül modelleri (Inverse RL) aracılığıyla RL, LLM’lere SFT gibi taklit öğrenmenin ötesinde sürekli optimizasyon, keşif ve genelleme yeteneği kazandırıyor. Özellikle çıkarım görevlerinde (matematik, kodlama gibi), RL, modellerin daha etkili çözüm kalıpları (uzun düşünce zincirleri gibi) keşfetmesine yardımcı olarak veri odaklı yöntemlerin sınırlamalarını aşıyor. Bu, LLM gelişiminin statik verilere dayanmaktan etkileşim ve geri bildirim yoluyla dinamik öğrenmeye doğru kaydığını gösteriyor. (Kaynak: 被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路)

Görsel-Dil-Navigasyon (VLN) Hala Somutlaşmış Zeka İçin Önemli Bir Zorluk: Adelaide Üniversitesi’nden Doç. Dr. Wu Qi, somutlaşmış zeka alanında Manipülasyon görevleri popüler olsa da, Görsel-Dil-Eylem’in (VLA) kritik bir bileşeni olan Görsel-Dil-Navigasyon’un (VLN), yapılandırılmamış, dinamik ortamlarda (özellikle ev sahnelerinde) hala birçok zorlukla karşı karşıya olduğunu ve tamamen çözülmekten uzak olduğunu belirtiyor. Navigasyon, robotların sonraki görevleri yerine getirmesinin temelidir. Mevcut VLN’nin ana darboğazları arasında yüksek kaliteli verilerin (simülatörler, 3D ortamlar, görev verileri) eksikliği, Sim2Real transfer boşluğu ve uç cihazlarda verimli dağıtımın mühendislik zorlukları yer alıyor. (Kaynak: 阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈)

AI, Reklamcılık ve Pazarlama Alanında Net Ticarileşme Yolu Gösteriyor: Diğer AI uygulama senaryolarıyla karşılaştırıldığında, AI teknolojisinin reklamcılık ve pazarlama alanındaki ticarileşmesi daha belirgin ve hızlı görünüyor. Applovin Corp ve Zeta Global gibi şirketler, veri analizi, kullanıcı profilleme, hassas hedefleme ve otomatik pazarlama için AI kullanarak reklam ekosistemini başarıyla değiştirdi, verimliliği ve yatırım getirisini artırdı. Bu, AI dalgasında hızla ticari değer üretebilen uygulamaların piyasada daha kolay kabul gördüğünü ve reklamcılık/pazarlamanın bunun tipik bir örneği olduğunu gösteriyor. (Kaynak: “AI寒武纪”爆发至今,五类新物种登上历史舞台)

AI Çip Tedarik Zinciri Sıkıntısı ve Yerelleşme Eğilimi: ABD-Çin teknoloji rekabeti kızışırken, ABD’nin Çin’e yönelik AI çip (özellikle Nvidia H20 gibi üst düzey modeller) ihracat kontrolleri sıkılaşmaya devam ediyor. Raporlara göre, birçok Çinli teknoloji şirketi (ByteDance, Alibaba, Tencent gibi), yasak yürürlüğe girmeden önce AI Ar-Ge ve dağıtım yeteneklerini sürdürmek için büyük miktarda Nvidia çipi stokladı. Aynı zamanda, tedarik zinciri risklerine ve “darboğaz” sorunlarına yanıt olarak, tam yığın yerelleştirilmiş AI teknoloji yolu daha fazla önem kazanıyor. Örneğin, iFlytek’in Xinghuo büyük modelini Huawei Ascend gibi yerli hesaplama gücüne dayalı olarak eğitmesi ve dağıtması, gelecekte yerli AI gelişiminin önemli bir eğilimi olabilir. (Kaynak: 国产六大推理模型激战OpenAI?, Reddit r/artificial, Reddit r/ArtificialInteligence)

🧰 Araçlar
Suna: Açık Kaynaklı Genel Amaçlı AI Agent Platformu: Kortix AI, açık kaynaklı bir genel amaçlı AI Agent olan Suna’yı tanıttı. Kullanıcılar, doğal dil konuşması yoluyla Suna’nın web araştırması, veri analizi, tarayıcı otomasyonu (web navigasyonu, veri çıkarma), dosya yönetimi (belge oluşturma/düzenleme), web tarama, genişletilmiş arama, komut satırı yürütme, web sitesi dağıtımı ve çeşitli API ve hizmetlerin entegrasyonu dahil olmak üzere çeşitli gerçek dünya görevlerini tamamlamasına yardımcı olmasını sağlayabilir. Suna, kullanıcıların dijital arkadaşı olmayı ve karmaşık iş akışlarını otomatikleştirmeyi hedefliyor. (Kaynak: kortix-ai/suna – GitHub Trending (all/daily))

Leaked System Prompts Deposu Büyük Modellerin Dahili İstemlerini Topluyor: GitHub’da leaked-system-prompts
adlı popüler bir depo ortaya çıktı. Bu depo, birçok ana akım AI modelinden sızdırılan dahili sistem istemlerini (System Prompts) topluyor ve kamuya açıklıyor. Bu istemler, modellerin uyması için tasarlanan talimatları, kuralları, rol ayarlarını ve güvenlik kısıtlamalarını ortaya koyuyor. Depo, Anthropic Claude serisi (2.0, 2.1, 3 Haiku/Opus/Sonnet, 3.5 Sonnet, 3.7 Sonnet), Google Gemini 1.5, OpenAI ChatGPT (4o dahil çeşitli sürümler), DALL-E 3, Microsoft Copilot, xAI Grok (çeşitli sürümler) gibi birçok modelin sızdırılmış istemlerini içeriyor ve araştırmacılara ve geliştiricilere bu modellerin dahili çalışma mekanizmalarını derinlemesine anlama fırsatı sunuyor. (Kaynak: jujumilk3/leaked-system-prompts – GitHub Trending (all/daily))
WAN Video Üretim Platformu Ücretli Hızlandırma Hizmetini Başlattı: AI video üretim platformu WAN (WAN.Video)’ın denizaşırı sürümü ticarileşme aşamasına girdiğini ve ücretli seçenekler sunduğunu duyurdu. Tüm kullanıcılar hala sınırsız ücretsiz video üretimi (Relax mode) keyfini çıkarabilir, ancak sıra beklemeleri gerekiyor. Ücretli kullanıcılar ise sıra beklemeden öncelikli üretim hizmeti alarak video sonuçlarını daha hızlı elde edebilecekler. Bu, yüksek verimliliğe veya ticari kullanıma ihtiyaç duyan kullanıcılar için bir hızlandırma kanalı sağlıyor. (Kaynak: op7418)

Dia TTS Modeli Hugging Face API’sine Geldi: Kullanıcılar artık Hugging Face platformu üzerinden doğrudan Dia 1.6B Metin Okuma (Text-to-Speech) modeli API’sini çağırabilirler. Bu hizmet FAL AI tarafından desteklenmektedir. Geliştiriciler, yüksek kaliteli konuşma sentezi işlevini gerçekleştirmek için yalnızca birkaç satır kodla entegre edebilirler. Bu entegrasyon, gelişmiş TTS modellerini kullanma engelini azaltarak geliştiricilerin uygulamalarına hızlı bir şekilde konuşma yetenekleri eklemesini kolaylaştırıyor. (Kaynak: huggingface)
ModernBERT Sınıflandırıcı Modeli Hızlı Çıkarım İçin vLLM ile Entegre Edildi: ModernBERT modeli artık vLLM çerçevesinde çalıştırılabiliyor ve çıkarım hızını önemli ölçüde artırıyor. İddiaya göre hızı, 200.000’den fazla arXiv makalesini birkaç dakika içinde işlemek için yeterli. Bu entegrasyon, Hugging Face Hub’da barındırılan yüzlerce ModernBERT modelinin metin sınıflandırma görevlerinde daha hızlı dağıtılmasını ve uygulanmasını sağlıyor. (Kaynak: huggingface)
Trackers: Yüksek Performanslı Python Nesne Takip Kütüphanesi: Roboflow, nesne takip görevlerine odaklanan Trackers adlı bir Python kütüphanesini açık kaynak olarak yayınladı. Kütüphane modüler olarak tasarlanmış, çeşitli takip algoritmalarını destekliyor ve Ultralytics, Transformers gibi popüler makine öğrenimi kütüphaneleriyle kolayca entegre olabiliyor. Performansı güçlü, aynı anda çok sayıda nesneyi takip edebiliyor ve demo videosunda 269’dan fazla yumurtayı başarıyla takip etti. (Kaynak: karminski3)
Unsloth, Dynamic v2.0 GGUF Kuantalama Teknolojisini ve Modellerini Yayınladı: Unsloth, özellikle GGUF formatındaki modeller için tasarlanmış yeni Dynamic v2.0 kuantalama teknolojisini tanıttı. İddiaya göre, bu kuantalanmış sürüm MMLU ve KL Divergence değerlendirmelerinde önceki sürümlerden daha iyi performans gösteriyor ve Llama.cpp’deki Llama-4’ün RoPE uygulama sorununu düzeltiyor. Unsloth, bu teknolojiyi kullanarak DeepSeek-R1 ve DeepSeek-V3-0324’ün yeni kuantalanmış modellerini topluluğun kullanımına sundu. (Kaynak: karminski3)

Perplexity iOS Sesli Asistanı Sistem İşlevlerini Entegre Etti: Perplexity’nin iOS uygulaması, sesli asistan işlevini güncelleyerek daha fazla sistem düzeyinde işlemi çağırmasını sağladı. Kullanıcılar artık sesli komutlarla Perplexity asistanına restoran rezervasyonu yaptırabilir, Apple Haritalar ile navigasyon kullanabilir, hatırlatıcılar oluşturabilir, Apple Music veya Podcast’leri arayıp çalabilir ve araç çağırabilir. Bu, Perplexity asistanını işlevsellik açısından Siri gibi yerel sistem asistanlarına yaklaştırarak kullanışlılığını artırıyor. (Kaynak: AravSrinivas)

VS Code MCP Server Uzantısı Yayınlandı, Claude’u Yerel Geliştirme Ortamına Bağlıyor: Geliştirici Juehang Qin, VS Code’u bir MCP (Model Context Protocol) sunucusuna dönüştüren bir VS Code uzantısı yayınladı. Bu, Claude gibi AI asistanlarının, kullanıcının o anda VS Code’da açık olan çalışma alanına doğrudan erişmesini ve üzerinde işlem yapmasını (dosya okuma/yazma, kod tanılama bilgilerini (hatalar ve uyarılar gibi) görüntüleme dahil) sağlıyor. Kullanıcı proje değiştirdiğinde, uzantı otomatik olarak yeni çalışma alanını ortaya çıkararak AI asistanının farklı projeler arasında sorunsuz bir şekilde işbirliği yapmasını kolaylaştırıyor. (Kaynak: Reddit r/ClaudeAI)
📚 Öğrenme
DINOv2: Meta Açık Kaynaklı Kendi Kendine Denetimli Görsel Özellik Öğrenme Yöntemi: Meta AI Research, PyTorch kodunu ve önceden eğitilmiş modelleri içeren DINOv2 projesini açık kaynak olarak yayınladı. DINOv2, güçlü, genel amaçlı görsel özellikler öğrenmeyi amaçlayan kendi kendine denetimli bir öğrenme yöntemidir. Bu özellikler, görüntü sınıflandırma, anlamsal bölütleme, derinlik tahmini gibi çeşitli bilgisayarlı görü görevlerinde mükemmel performans gösterir ve alt görevler için ince ayar gerektirmez. Proje, ayrıntılı belgeler, model indirme bağlantıları ve ilgili makaleler sunarak kendi kendine denetimli görsel öğrenmeyi araştırmak ve uygulamak için önemli bir kaynak oluşturuyor. (Kaynak: facebookresearch/dinov2 – GitHub Trending (all/daily))
HD-EPIC: Yüksek Detaylı Birinci Şahıs Video Veri Seti Yayınlandı: Araştırmacılar, gerçek mutfak ortamlarında kaydedilmiş 41 saatlik birinci şahıs videosu içeren HD-EPIC veri setini tanıttı. Bu veri setinin temel özelliği, tarif adımlarını, malzeme besin bilgilerini (tartım kayıtları aracılığıyla), ince taneli eylem açıklamalarını (içerik, şekil, neden), 3D sahne dijital ikizini, nesne hareket yörüngelerini (2D/3D), el/nesne maskelerini, bakış takibini ve nesne ile sahne etkileşimlerini kapsayan son derece ayrıntılı çok modlu etiketlemesidir. Bu veri seti, birinci şahıs görsel anlama, somutlaşmış zeka ve insan-bilgisayar etkileşimi araştırmaları için yüksek kaliteli bir referans noktası sağlamayı amaçlamaktadır. (Kaynak: CVPR 2025 | HD-EPIC定义第一人称视觉新标准:多模态标注精度碾压现有基准)

SRPO: Alanlar Arası RL ile LLM Çıkarım Yeteneklerini Eğitme Optimizasyon Yöntemi: Kuaishou Kwaipilot ekibi, GRPO gibi pekiştirmeli öğrenme yöntemlerini kullanarak LLM’leri karma matematik ve kodlama görevlerinde eğitirken karşılaşılan performans darboğazları ve verimlilik sorunlarına yönelik SRPO (İki Aşamalı Geçmiş Yeniden Örnekleme Politika Optimizasyonu) yöntemini önerdi. Bu yöntem, ilk aşamada matematik verilerini kullanarak derin düşünmeyi teşvik eder, ikinci aşamada kod verilerini tanıtarak programatik düşünceyi geliştirir ve ödül sinyali sıfır varyans sorununu çözmek için geçmiş yeniden örnekleme tekniğini birleştirir. Deneyler, SRPO’nun eğitim adımlarının yalnızca %10’u ile AIME24 ve LiveCodeBench’te DeepSeek-R1-Zero-Qwen-32B’yi geride bıraktığını göstererek, alanlar arası çıkarım yeteneği gelişimi için verimli bir yol sunuyor. (Kaynak: DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐)
TTRL: Etiketlenmiş Veri Olmadan Test Zamanı Pekiştirmeli Öğrenme: Tsinghua Üniversitesi ve Shanghai AI Lab, LLM’lerin test aşamasında, manuel etiketleme olmadan pekiştirmeli öğrenme yapmasını sağlayan TTRL (Test-Time Reinforcement Learning) yöntemini önerdi. Bu yöntem, modelin kendi çoklu örnekleme çıktılarını kullanarak, çoğunluk oylaması gibi yöntemlerle sahte etiketler ve ödül sinyalleri üretir ve modelin yeni verilere veya görevlere uyum sağlamak için kendi kendine evrimleşmesini sağlar. Deneyler, TTRL’nin modelin hedef görevlerdeki performansını önemli ölçüde artırabildiğini, hatta denetimli eğitim etkisine yaklaştığını göstererek, RL’nin denetimsiz ortamlardaki uygulama zorluklarını çözmek için yeni bir yaklaşım sunuyor. (Kaynak: TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨)
SeekWorld: o3 Görsel İpucu Takibini Simüle Eden Coğrafi Konumlandırma Çıkarım Görevi ve Modeli: Çok modlu büyük dil modellerinin (MLLM) görsel çıkarım yeteneklerini, özellikle OpenAI o3 modelinin çıkarım sırasında görüntüleri dinamik olarak algılama ve işleme (görsel ipucu takibi) yeteneğini simüle etmek amacıyla, araştırmacılar SeekWorld coğrafi konumlandırma çıkarım görevini (resme göre çekim yerini tahmin etme) önerdi. Bu görev etrafında bir veri seti oluşturuldu ve pekiştirmeli öğrenme ile SeekWord-7B modeli eğitildi. Bu model, coğrafi konumlandırma çıkarımında Qwen-VL, Doubao Vision Pro, GPT-4o gibi modelleri geride bıraktı. Proje, modeli, veri setini ve çevrimiçi Demo’yu açık kaynak olarak yayınladı. (Kaynak: 一张图片找出你在哪?o3-like 7B模型玩网络迷踪超越一流开闭源模型!)
ManipTrans: İnsan Çift Elinden Becerikli Ellere Operasyon Becerisi Transferi: Beijing General Artificial Intelligence Research Institute, Tsinghua Üniversitesi ve Pekin Üniversitesi’nden araştırmacılar, insan çift el operasyon becerilerini simülasyon ortamındaki robotik becerikli ellere verimli bir şekilde aktarmak için ManipTrans yöntemini önerdi. Bu yöntem iki aşamalı bir strateji kullanır: önce genel yörünge taklitçisi ile insan eli hareketlerini taklit eder, ardından kalıntı öğrenme ve fiziksel etkileşim kısıtlamaları ile ince ayar yapar. Bu yönteme dayanarak ekip, şişe kapağı açma, yazı yazma, kaşıklama, diş macunu kapağı açma gibi karmaşık görev dizilerini içeren büyük ölçekli becerikli el operasyon veri seti DexManipNet’i yayınladı ve gerçek makine dağıtımının fizibilitesini doğruladı. (Kaynak: 机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手)

LangGraph Eğitimi: Yansıtma Mekanizmalı RAG Agent Oluşturma: LangChain, LangGraph çerçevesini kullanarak yansıtma (Reflection) yeteneğine sahip bir RAG (Retrieval-Augmented Generation) Agent’ın nasıl oluşturulacağını ayrıntılı olarak açıklayan bir video eğitimi yayınladı. Temel fikir, RAG sürecine bir değerlendirme düğümü eklemektir, böylece Agent nihai cevabı üretmeden önce alınan bilgileri inceleyebilir, ilgililiğini ve kalitesini değerlendirebilir ve değerlendirme sonucuna göre yeniden alım yapmaya, sorguyu düzeltmeye veya doğrudan cevap üretmeye karar verebilir, böylece gürültüyü etkili bir şekilde filtreleyebilir ve soru-cevap etkinliğini artırabilir. (Kaynak: LangChainAI)

Arena-Hard-v2.0: Daha Sıkı Büyük Model Değerlendirme Ölçütü: LMSYS Org, Arena-Hard değerlendirme ölçütünü 2.0 sürümüne güncelledi. Yeni sürüm, LMArena kullanıcıları tarafından gönderilen daha zorlu 500 prompt’a dayanıyor, daha güçlü otomatik değerlendirme modelleri (Gemini-2.5 & GPT-4.1) kullanıyor, 30’dan fazla dili destekliyor ve yaratıcı yazma yeteneklerinin değerlendirilmesini ekliyor. En iyi büyük modellerin performansını ayırt etmek için daha zorlu ve daha kapsamlı bir platform sağlamayı amaçlıyor. (Kaynak: lmarena_ai)

PHYBench: LLM’lerin Fiziksel Çıkarım Yeteneklerini Değerlendiren Ölçüt Yayınlandı: Pekin Üniversitesi araştırma ekibi, büyük dil modellerinin gerçek dünya fiziksel süreçlerini anlama ve bunlar hakkında çıkarım yapma yeteneğini özel olarak değerlendirmek için yeni bir ölçüt olan PHYBench’i tanıttı. Bu ölçüt, gerçek fiziksel senaryolara dayalı olarak tasarlanmış 500 soru içermektedir. Makalede sunulan ilk değerlendirme sonuçlarına göre, Google’ın Gemini-2.5-Pro modeli bu ölçütte lider performans sergiliyor. (Kaynak: karminski3)

💼 Ticari
Alibaba Tongyi Qianwen ve FLock.io Stratejik İşbirliğini Duyurdu: Alibaba’nın Tongyi Qianwen büyük modeli (Qwen) ve merkezi olmayan AI hesaplama platformu FLock.io stratejik bir işbirliğine gitti. Taraflar, Qwen açık kaynak model serisinin yeteneklerini FLock.io’nun merkezi olmayan teknoloji çerçevesiyle birleştirerek, merkezi olmayan AI’ın pratik uygulamalarını birlikte keşfetmeyi ve teşvik etmeyi, AI geliştiricileri ve kullanıcıları için yeni olanaklar sunmayı amaçlıyor. (Kaynak: Alibaba_Qwen)
Alibaba Tongyi Laboratuvarı LLM Çok Turlu Diyalog Araştırma Stajyeri Arıyor: Alibaba’nın Tongyi serisi büyük modellerinin Ar-Ge’sinden sorumlu olan Tongyi Laboratuvarı’nın Diyalog Zekası ekibi, Pekin ve Hangzhou’da LLM çok turlu diyalog alanına odaklanan araştırma stajyerleri arıyor. Araştırma alanları arasında üretken ödül modelleme, ödül modellerinin çıkarım zamanı genişletilmesi, rol yapma gibi yaratıcı görevler için pekiştirmeli öğrenme ve metin-konuşma çok modlu diyalog yer alıyor. Başvuranların doktora öğrencisi olması, en iyi konferanslarda yayın deneyimine sahip olması ve en az 6 ay staj yapabilmesi gerekiyor. (Kaynak: 北京/杭州内推 | 阿里通义实验室对话智能团队招聘LLM多轮对话方向研究实习生)

Verimlilik Aracı Remio Yurtdışı Sosyal Medya Operasyon Stajyeri Arıyor: Girişim şirketi Remio, yurtdışı sosyal medyaya (Reddit, Hacker News, Twitter vb.) aşina olan ve verimlilik araçlarına tutkuyla bağlı bir stajyer arıyor. Ana sorumluluklar sosyal medya operasyonları ve içerik oluşturmadır. Pozisyon uzaktan çalışmaya açıktır, hem Çin’de hem de Kuzey Amerika’da başvurulabilir, Reddit karma puanı için belirli bir gereklilik vardır (100’ün üzerinde önerilir). (Kaynak: dotey)
API Şirketi Kong Şanghay Ekibi Mühendis ve Stajyer Arıyor: Kong şirketi (açık kaynaklı API Gateway’i ile tanınır) Çin ekibi (Şanghay’da bulunmaktadır) işe alımlarını genişletiyor ve stajyerler ile tam zamanlı pozisyonlar dahil olmak üzere birden fazla pozisyon sunuyor. İşe alım yönleri arasında Rust geliştirme, AI Gateway, Kong Gateway ve ön uç geliştirme bulunmaktadır. İlgili teknoloji yığınlarına ilgi duyan geliştiriciler takip edebilir. (Kaynak: dotey)

Webtoon, LangGraph Kullanarak İçerik İnceleme İş Yükünü %70 Azalttı: Dünyaca ünlü dijital çizgi roman platformu Webtoon, LangChain’in LangGraph çerçevesini kullanarak WCAI (Webtoon Comprehension AI) adlı bir sistem kurdu. Bu sistem, karakterleri tanıma ve diyalogları atfetme, olay örgüsünü ve duygusal tonu çıkarma ve doğal dil sorgularını destekleme dahil olmak üzere çizgi roman içeriğini otomatik olarak anlamak için çok modlu AI Agent’ları kullanıyor. WCAI, pazarlama, çeviri ve öneri ekipleri tarafından kullanılarak manuel gezinme ve inceleme iş yükünü %70 oranında başarıyla azalttı, içerik işleme verimliliğini ve yaratıcı desteği artırdı. (Kaynak: LangChainAI)

Meta AI, ICLR 2025’te Araştırma Yetenekleri Arıyor: Meta AI ekibi, Singapur’da düzenlenen ICLR 2025 konferansına katıldı ve katılımcılarla iletişim kurmak için bir stant (#L03) kurdu. Aynı zamanda Meta AI, temel öğrenme teorisi, 3D üretken AI, dil üretken AI gibi araştırma yönlerinde AI Araştırma Bilimcileri, Doktora Sonrası Araştırmacılar ve Araştırma Asistanları (Doktora) arayan iş ilanlarını aktif olarak yayınlıyor. Çalışma yerleri arasında Paris gibi küresel araştırma merkezleri bulunmaktadır. (Kaynak: AIatMeta)

🌟 Topluluk
Andrew Ng: AI Destekli Programlama Dil Engelini Düşürüyor, Geliştiricilerin Alanlar Arası Yeteneklerini Artırıyor: Ünlü AI akademisyeni Andrew Ng, AI destekli programlama araçlarının yazılım geliştirmeyi derinden değiştirdiğini belirtiyor. Bir dile (örneğin JavaScript) hakim olmasa bile, geliştiriciler AI yardımıyla verimli bir şekilde kod yazabilir, böylece platformlar arası, alanlar arası uygulamalar (örneğin arka uç geliştiricilerinin ön uç oluşturması) oluşturmak daha kolay hale gelir. Belirli bir dilin sözdizimi daha az önemli hale gelse de, temel programlama kavramlarını (veri yapıları, algoritmalar, React gibi belirli çerçevelerin prensipleri) anlamak hala kritiktir, bu da AI’yı daha hassas bir şekilde yönlendirmeye ve sorunları çözmeye yardımcı olur. AI, geliştiricileri daha “çok dilli” hale getiriyor. (Kaynak: AndrewYNg)
Microsoft AI CEO’su Copilot’un Uçuş Gecikme Bilgisini Önceden Verdiğini Söyledi: Microsoft AI bölümü başkanı Mustafa Suleyman, X platformunda bir “sihirli an” paylaştı: kullandığı Copilot AI asistanı, uçuşunun gecikme bilgisini havaalanı resmi duyurusundan daha önce kendisine bildirdi. Biniş kapısı personeli ile teyit edildiğinde bilginin doğru olduğu, ancak henüz kamuya açıklanmadığı anlaşıldı. Bu, AI’ın gerçek zamanlı bilgileri entegre etme ve iletme potansiyelini gösteriyor ve geleneksel bilgi yayın kanallarını aşabilir. (Kaynak: mustafasuleyman)

Topluluk GPT-4.5 ve o1 Pro’nun Farklı Görevlerdeki Artılarını ve Eksilerini Tartışıyor: X platformu kullanıcıları, OpenAI’nin farklı modellerinin pratik uygulamalardaki deneyimlerini tartıştı. Bir kullanıcı, GPT-4.5’in yazma ve çeviri görevlerinde mükemmel performans gösterdiğini ancak daha küçük bağlam penceresiyle sınırlı olduğunu ve uzun metinleri işlemede etkinliğinin düştüğünü belirtti. Buna karşılık, Pro kullanıcılarına yönelik o1 Pro modelinin 128K bağlam penceresine sahip olduğu ve uzun kod girdilerini işlemede daha kararlı ve güvenilir olduğu, bu nedenle programlama görevleri için daha uygun olduğu ifade edildi. Bu, farklı modellerin tasarım ve optimizasyonundaki odak noktası farklılıklarını yansıtıyor. (Kaynak: dotey)

Hugging Face Hub, AI Öğrenme ve İletişim Platformu Olarak Öneriliyor: X platformu kullanıcıları, Hugging Face Hub’ın sadece model ve veri seti deposu olmadığını, aynı zamanda aktif bir AI öğrenme ve iletişim topluluğu olduğunu önerdi. Kullanıcılar, modellerin, veri setlerinin veya Spaces’in tartışma bölümlerinde mühendislerin ve araştırmacıların deney süreçlerini, karşılaştıkları sorunları, çözümleri ve ilgili araştırma makaleleri hakkındaki tartışmalarını paylaşarak birinci elden pratik deneyim ve derinlemesine içgörüler elde edebilirler. (Kaynak: huggingface)
ChatGPT’nin Reddit Topluluk Kültürünü “Tiye Alması” Tartışma Yarattı: Bir Reddit kullanıcısı, ChatGPT’den Reddit platformunu “tiye almasını” (roast) istedi. ChatGPT’nin ürettiği yanıt, Reddit topluluğunun bazı tipik özelliklerini (örneğin kullanıcı görüşlerinin çelişkili olması, beğenilere (karma) aşırı önem verilmesi, gerçek dünya deneyimi eksikliğine rağmen uzman tavsiyesi verilmesi ve belirli alt dizinlerdeki (subreddit) “klavye savaşçısı” davranışları gibi) isabetli bir şekilde yakaladı ve hicvetti. Bu gönderi, topluluk kullanıcıları arasında tartışmalara ve daha fazla taklit yaratıma yol açtı. (Kaynak: Reddit r/ArtificialInteligence)
AI Tarafından Üretilen İçeriğin Orijinalliği ve Değeri Üzerine Düşünceler: Reddit’teki bir gönderi, AI tarafından üretilen içeriğin orijinalliği hakkında bir tartışma başlattı. Gönderi, Mona Lisa örneğini kullanarak, insan yaratıcılığının kendisinin de deneyime dayalı bir “remix” olduğunu ve AI’ın insan rehberliğinde içerik üretme sürecinin saf kopyalamadan ziyade “usta-çırak ilişkisine” benzediğini belirtti. Tartışma, anahtar noktanın AI’ın “orijinal” olup olamayacağı değil, nasıl makul bir şekilde atıfta bulunulacağı, orijinal yaratıcıların haklarına nasıl saygı gösterileceği ve eserin niyetinin ve değerinin nasıl yargılanacağı olduğu sonucuna vardı. (Kaynak: Reddit r/ArtificialInteligence)
Topluluk Büyük Model Sıralamalarının (LLM Leaderboard) Geçerliliğini Sorguluyor: Reddit r/LocalLLaMA topluluğu kullanıcıları, LMSYS Arena gibi Elo derecelendirmesine dayalı büyük model sıralamalarını tartışırken şüphelerini dile getirdi. Bazı yorumcular, bu tür sıralamaların gerçek genel yetenekten ziyade modellerin “tarzını” veya “hissiyatını” (örneğin gereksiz uzunluk, Markdown ve emoji kullanımı gibi) daha fazla yansıtabileceğini savundu. Ayrıca, en iyi modeller arasındaki Elo puanı güven aralıklarının genellikle örtüştüğü ve bu durumun sıralama farklılıklarının istatistiksel anlamlılığını şüpheli hale getirdiği belirtildi. (Kaynak: Reddit r/LocalLLaMA)
Kullanıcı ChatGPT’nin Çeşitli “Beliren Davranışlarını” Gözlemledi: Bir Reddit kullanıcısı, yakın zamanda ChatGPT kullanırken karşılaştığı birkaç “beklenmedik” davranışı paylaştı ve bunları “beliren davranışlar” olarak sınıflandırdı. Spesifik olarak şunları içeriyor: 1. Düzeltilmeden, modelin talimatı yanlış anladığını (sohbet geçmişini ve yüklenen belgeyi karıştırdığını) fark etmesi ve proaktif olarak özür dileyip düzeltmesi. 2. Kullanıcının bahsettiği hassas bir konu sistem tarafından silindikten sonra, modelin sonraki konuşmada silinen içeriğe proaktif olarak atıfta bulunarak ilgi göstermesi. 3. AI’ın kendiliğinden düşünmesini test etmenin zorluklarını tartışırken, modelin proaktif olarak “Heisenberg Belirsizlik Özyineleme Prensibi” gibi bir analojik kavram yaratması. Bu vakalar, LLM’lerin öz farkındalık, hafıza ve yaratıcılık sınırları hakkında tartışmalara yol açtı. (Kaynak: Reddit r/ArtificialInteligence)
💡 Diğer
Google DeepMind, Music AI Sandbox Araç Setini Güncelledi: Google DeepMind, Music AI Sandbox’ına yeni özellikler eklediğini duyurdu. Bu, profesyonel müzisyenlere yönelik, müzik yaratımına yardımcı olmayı amaçlayan deneysel bir AI araç setidir. Yeni özellikler, en son Lyria 2 modeli tarafından desteklenmektedir ve şarkı yazarları gibi müzisyenlerin yaratıcı ilhamı keşfetmelerine, müzik parçaları oluşturmalarına vb. yardımcı olabilir. (Kaynak: demishassabis)
Kuantum Hesaplama Yönetişim İlkeleri Tartışılıyor: Topluluk üyeleri, kuantum hesaplama yönetişimi ile ilgili ilkeleri paylaştı ve tartıştı. Kuantum hesaplama teknolojisinin gelişmesiyle birlikte, kriptografi, malzeme bilimi, ilaç geliştirme ve AI/ML ile entegrasyon gibi alanlardaki muazzam potansiyeli dikkat çekiyor, aynı zamanda güvenlik, etik ve yönetişim zorluklarını da beraberinde getiriyor ve önceden ilgili düzenlemelerin yapılması gerekiyor. (Kaynak: Ronald_vanLoon)

MIT Muz Şeklinde Giyilebilir Yumuşak Robot Geliştirdi: MIT araştırmacıları, muzu andıran ve algılama yetenekleri entegre edilmiş yeni bir tür giyilebilir yumuşak robot geliştirdi. Bu araştırma, yumuşak robotların insan-robot etkileşimi, tıbbi rehabilitasyon ve giyilebilir cihazlar alanındaki uygulama potansiyelini gösteriyor; esnek yapısı ve entegre algılaması daha doğal ve daha güvenli fiziksel etkileşim için olanaklar sunuyor. (Kaynak: Ronald_vanLoon)
AI Destekli Robotik Teknolojisindeki Gelişmeler: Son zamanlarda sosyal medyada, genellikle AI tarafından desteklenen veya bununla ilgili olan birçok robotik teknolojisi ilerlemesi sergilendi: 1. SR-02: Dört kişiyi taşıyabilen dört ayaklı bir “robot binek”. 2. SnapBot: Şekil değiştirebilen ayaklı bir robot. 3. Matic: Ev temizliği için Tesla FSD görsel sistemini taklit eden bir robot. 4. micropsi: Alman startup’ı, robotların öngörülemeyen görevleri yerine getirmesini sağlayan AI sistemi geliştirdi. 5. Boston Dynamics Spot: Robot köpek doğal ortamlarda test ediliyor. 6. İnsansı Robot Yarışı: İnsansı robotların hareket kabiliyetini gösteriyor. 7. Robot Kolu El Yazısı: Robotların hassas manipülasyon yeteneğini gösteriyor. (Kaynak: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)
