AI Daily – 2025-04-17(Morning)

Anahtar Kelimeler:AI, OpenAI, o3/o4-mini model, Gemini 2.5 Pro, AI programlama araçları, çok modlu AI teknolojisi, AI ajanları, AI nedir, OpenAI kullanım alanları, o3/o4-mini model özellikleri, Gemini 2.5 Pro avantajları, AI programlama araçları karşılaştırması, çok modlu AI teknolojisi uygulamaları, akıllı AI ajanları nasıl çalışır

🔥 Odak Noktası

OpenAI, etkileyici o3 ve o4-mini modellerini duyurdu, ‘görsel düşünme’de yeni bir çağ başlattı: OpenAI, en yeni “reasoning” amiral gemisi modeli o3’ü ve daha küçük versiyonu o4-mini’yi resmi olarak duyurdu. Bu iki model ilk kez “görüntülerle düşünme” yeteneğini sunuyor; reasoning zincirine görüntüleri yerleştirip işleyebiliyor (örneğin büyütme, döndürme) ve metinle birlikte analiz yapabiliyorlar. Ayrıca, karmaşık sorunları çözmek için ChatGPT içindeki tüm araçları (web araması, Python kod yürütme, dosya ayrıştırma, görüntü oluşturma) ilk kez otonom olarak birleştirebiliyorlar. o3, Codeforces, SWE-bench, MMMU gibi birçok benchmark testinde SOTA’yı yeniledi, özellikle görsel reasoning ve çok adımlı görevlerde öne çıktı ve kritik hata oranını o1’e göre %20 azalttı. o4-mini ise daha düşük latency ve maliyetle matematik, programlama ve görsel görevlerde o3-mini’yi geride bırakıyor. Aynı zamanda OpenAI, hafif terminal programlama AI agent’ı Codex CLI’yi open source yaptı ve milyon dolarlık bir hibe programı başlattı. Yeni modeller ChatGPT Plus/Pro/Team kullanıcılarına ve API geliştiricilerine sunuldu, bu da AI’ın daha güçlü multimodal ve agent yeteneklerine doğru ilerlediğini gösteriyor. (kaynak: OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰,首用图像思考,十倍算力爆表openaisamakarminski3karminski3samagdbkarminski3samadoteyopenaikarminski3op7418gdb

)

OpenAI, etkileyici o3/o4-mini modellerini duyurdu, görsel çıkarım zirvesine yaklaştı, ilk kez görüntülerle düşünüyor, on kat işlem gücü patlaması

Google, Gemini 2.5 Pro Experimental’ı yayınladı, Chatbot Arena’da zirveye yerleşti: Google, Gemini 2.5 ailesinin ilk modeli olan Gemini 2.5 Pro Experimental’ı tanıttı ve düşük latency versiyonu Gemini 2.5 Flash’ın yakında geleceğini duyurdu. Model metin, ses, görüntü, video girdilerini (1 milyon token’a kadar, gelecekte 2 milyon planlanıyor) ve metin çıktısını (65 bin token’a kadar) destekliyor. Dikkat çeken özelliği, yanıt vermeden önce gizli reasoning token’ları (düşünce zinciri) üreterek elde ettiği güçlü reasoning yeteneğidir. Chatbot Arena’da Gemini 2.5 Pro Experimental, 1437 Elo puanıyla GPT-4o ve Grok 3 Preview’ı geçerek zirveye yerleşti. 12 benchmark testinin 7’sinde o3-mini, GPT-4.5, Claude 3.7 Sonnet dahil olmak üzere en iyi modellerden daha iyi performans gösterdi. Bu, AI modellerinin, özellikle reasoning modellerinin hızla gelişmeye devam ettiğini gösteriyor. Google, gelecekteki tüm yeni modellerinin reasoning yeteneğine sahip olmasını planlıyor. (kaynak: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings

🎯 Gelişmeler

OpenAI, düşük maliyet ve yüksek verimliliğe odaklanan GPT-4.1 serisi modellerini yayınladı: OpenAI, GPT-4.1, GPT-4.1 Mini ve GPT-4.1 Nano’yu içeren GPT-4.1 serisini tanıttı. Temel özellikler maliyeti düşürmek ve hızı artırmak. GPT-4.1 Mini, çoklu benchmark testlerinde GPT-4o’dan daha iyi performans gösteriyor, latency önemli ölçüde düşük ve maliyeti %83 daha az. GPT-4.1 Nano, 1 milyon token context’i destekleyen ilk ultra küçük model olup düşük latency görevleri için uygundur. Üç modelin de context window’u 128K’dan 1 milyon token’a yükseltildi. Fiyatlandırma açısından, GPT-4.1 girdi/çıktı için milyon token başına $2/$8 olup, GPT-4o’dan %26 daha ucuzdur; Nano girdi/çıktı için $0.1/$0.4’tür. Bu hamle, DeepSeek gibi rakiplerin fiyat savaşına bir yanıt olarak görülüyor. Aynı zamanda, yüksek maliyetli GPT-4.5 projesi durduruldu. (kaynak: 压力给到梁文锋

)
Model Context Protocol (MCP), OpenAI desteğiyle ekosistem entegrasyonunu hızlandırıyor: OpenAI, Agents SDK, ChatGPT masaüstü uygulaması ve Responses API’sinde Model Context Protocol’ü (MCP) destekleyeceğini duyurdu. MCP, geçen yılın sonunda Anthropic tarafından AI modellerinin araçlara ve veri kaynaklarına bağlanması için açık bir standart sağlamak amacıyla başlatıldı. MCP aracılığıyla modeller, 6000’den fazla topluluk tarafından oluşturulmuş sunucu ve bağlayıcı (örneğin web araması, dosya sistemi işlemleri) dahil olmak üzere büyüyen bir kaynak ekosistemine erişebilir. Daha önce Microsoft, MCP’yi CoPilot Studio’ya entegre etmiş, Cloudflare uzak MCP sunucularının dağıtımını desteklemiş ve Cursor kod editörü de destek eklemişti. OpenAI’nin katılımı, MCP’nin AI Agent uygulamaları oluşturmak için fiili standart haline gelmesini büyük ölçüde teşvik edecek ve geliştiricilerin çeşitli üçüncü taraf araçları ve veri kaynaklarını entegre etme sürecini basitleştirecektir. (kaynak: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

Model Context Protocol (MCP), OpenAI desteğiyle ekosistem entegrasyonunu hızlandırıyor

ByteDance, video oluşturma efektlerini iyileştiren Kling 2.0’ı yayınladı: Kling 2.0, ByteDance tarafından sunulan en son video oluşturma modelidir. Kullanıcı geri bildirimlerine ve demolara göre, Kling 2.0, pürüzsüz ve gerçekçi video sahneleri oluşturmada önceki sürümlere ve Sora gibi rakip ürünlere kıyasla, özellikle görüntüden videoya dönüştürmede daha iyi performans gösteriyor. Kullanıcılar önce ChatGPT gibi araçları kullanarak iyi metin doğruluğuna sahip görüntüler oluşturabilir, ardından Kling 2.0’ı kullanarak bunları dinamik videolara dönüştürebilirler. Bu, video oluşturma teknolojisinin sahne tutarlılığı ve gerçekçilik açısından sürekli ilerlediğini gösteriyor. (kaynak:

)
Google, yunus iletişiminin gizemini keşfetmek için DolphinGemma’yı yayınladı: Google AI, yunusların iletişim yöntemlerini AI teknolojisi kullanarak çözmeyi amaçlayan DolphinGemma projesini duyurdu. Proje, devasa bir yunus sesi veri kümesi biriktirdi ve bu sesleri analiz etmek, dil olabileceğini gösteren kalıpları ve kuralları aramak için (Pixel 9 telefonda çalışabilen) 400 milyon parametreli bir model eğitti. Araştırma şu anda keşif aşamasında olup, yunusların insanlar gibi karmaşık bir dile sahip olup olmadığı henüz kesin değil, ancak belirli davranışlarla (adlandırma, kavga etme, kur yapma gibi) ilişkili ses türleri tanımlandı. Nihai hedef, yunus seslerinin yapısını ve potansiyel anlamlarını anlamak ve belirli sesler üreterek yunuslarla basit iki yönlü iletişim kurmaya çalışmaktır. (kaynak:

)
IBM, ses tanıma içeren Granite 3.3 serisi modellerini yayınladı: IBM, 8 milyar parametreli bir ses tanıma modeli (Granite Speech 3.3) içeren Granite 3.3 serisi modellerini tanıttı. Model, temel LLM yeteneklerini düşürmeden sesi işlemek için iki aşamalı bir yaklaşım benimsiyor. Yeni model ailesi, daha rafine reasoning yetenekleri ve geliştirilmiş RAG (Retrieval-Augmented Generation) performansı sunmayı ve LoRA fine-tuning’i desteklemeyi amaçlıyor. Bu modeller, çeşitli alanlardaki AI asistanlarına entegre edilebilir. (kaynak: Reddit r/LocalLLaMA)

IBM, ses tanıma içeren Granite 3.3 serisi modellerini yayınladı

AI, hava durumu tahmin devrimini tetikliyor, tahmin verimliliği büyük ölçüde artıyor: Yapay zeka, hava durumu tahmini alanını sessizce değiştiriyor. Geleneksel olarak devasa uzman ekipleri ve süper bilgisayarlar gerektiren tahmin görevleri, şimdi AI modelleri aracılığıyla bir dizüstü bilgisayarda gerçekleştirilebiliyor. AI, devasa miktarda meteorolojik veriyi işleyip analiz edebiliyor, karmaşık kalıpları tanımlayabiliyor ve böylece daha hızlı, muhtemelen daha doğru hava durumu tahminleri üretebiliyor. Bu, AI’ın bilimsel hesaplama ve tahmin alanlarındaki önemli bir uygulamasını işaret ediyor ve tahminlerin güncelliğini ve kapsamını artırma potansiyeli taşıyor. (kaynak: Reddit r/ArtificialInteligence)
Google Gemini App, LaTeX desteği ekledi: Google Gemini App güncellenerek LaTeX desteği eklendi. Kullanıcılar artık Gemini App’te matematiksel formülleri, bilimsel sembolleri vb. göstermek için LaTeX sözdizimini kullanabilirler. Bu güncelleme Gemini 2.0 Flash ve 2.5 Pro modellerini kapsıyor ve Gemini’nin akademik ve teknik iletişim senaryolarındaki kullanışlılığını artırıyor. (kaynak: JeffDean)
Meta, LLM’lerin gürültülü girdilere karşı dayanıklılığını artırmak için Byte Latent Transformer’ı (BLT) önerdi: Meta ve diğer kurumlardan araştırmacılar, geleneksel tokenizer’ların yerini almayı amaçlayan Byte Latent Transformer’ı (BLT) tanıttı. BLT, doğrudan byte (karakter) dizilerini işler, küçük bir byte seviyesi Transformer aracılığıyla bir sonraki byte’ın olasılığını tahmin eder ve entropiyi kullanarak byte’ları dinamik olarak gruplandırır: düşük entropi (yüksek öngörülebilirlik) mevcut gruba eklenir, yüksek entropi (düşük öngörülebilirlik) yeni bir grup başlatır. Sistem bir encoder, latent Transformer ve decoder içerir ve toplam 8 milyar parametreye sahiptir. Deneyler, BLT’nin genel dil ve kodlama benchmark’larında eşdeğer boyuttaki Llama 3’ten biraz daha iyi performans gösterdiğini ve yazım hataları, nadir diller gibi gürültülü girdilere karşı karakter düzeyindeki benzerlikleri daha iyi anlayabildiği için önemli ölçüde daha güçlü bir dayanıklılık sergilediğini göstermiştir. (kaynak: Google Unveils Gemini 2.5, MCP Gains Momentum, Behind Sam Altman’s Fall and Rise, LLMs That Understand Misspellings)

Meta, LLM'lerin gürültülü girdilere karşı dayanıklılığını artırmak için Byte Latent Transformer'ı (BLT) önerdi

Yeni araştırma, çoklu agent işbirlikçi reasoning’in test zamanı ölçeklenmesini araştırıyor: “Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning” başlıklı bir makale arXiv’e gönderildi. Araştırma, test (inference) sırasında birden fazla AI agent’ının işbirliği yapmasını sağlayarak karmaşık reasoning görevlerinin performansını nasıl artırılacağına odaklanıyor ve eğitim maliyetini artırmadan model yeteneklerini geliştirmenin bir ölçeklendirme yolunu araştırıyor. (kaynak: Reddit r/MachineLearning)
AI agent yönetişimi yeni bir odak noktası haline geliyor: AI agent’larının (Agentic AI) yetenekleri arttıkça, bunların nasıl etkili bir şekilde yönetileceği önemli bir konu haline geliyor. Bu, agent davranışlarının beklentilere uygun, güvenli, kontrol edilebilir ve etik normlara uygun olmasını sağlamayı içeriyor. Otonom olarak hareket edebilen ve karar verebilen bu “sentetik zihinleri” yönetmek için ilgili çerçeveler, standartlar ve düzenleyici mekanizmalar oluşturulması gerekiyor. (kaynak: Ronald_vanLoon)

Agentic #AI: Governance for the Synthetic Mind

AI, mevcut SOTA yöntemlerinden daha hızlı yüksek kaliteli görüntüler üretiyor: Massachusetts Institute of Technology (MIT) araştırmacıları, yüksek kaliteli görüntüler üretmede mevcut en gelişmiş (SOTA) yöntemleri geride bırakan ve bunu daha hızlı yapan yeni bir yapay zeka aracı geliştirdi. Bu, görüntü oluşturma alanında verimlilik ve kalitenin sürekli olarak aşıldığını gösteriyor. (kaynak: Ronald_vanLoon)

#AI tool generates high-quality images faster than state-of-the-art approaches

xAI, Grok AI için Canvas benzeri bir özellik sunuyor: xAI, sohbet botu Grok AI’ye ChatGPT Canvas benzeri bir özellik ekledi. Canvas benzeri özellikler genellikle kullanıcıların metin, kod, görüntü vb. öğeleri birleştirerek bilgileri daha serbest ve görsel bir şekilde organize etmelerine ve etkileşimde bulunmalarına olanak tanıyan sonsuz bir tuval arayüzü sunar. Bu hamle, Grok’u kullanıcı etkileşim deneyimi açısından ChatGPT’ye yaklaştırıyor ve bu özellik ücretsiz olarak sunuluyor. (kaynak: Reddit r/ArtificialInteligence)

xAI, Grok AI için Canvas benzeri bir özellik sunuyor

🧰 Araçlar

Anx Reader: Çoklu AI motoru entegreli platformlar arası e-kitap okuyucu: Anx Reader, EPUB, MOBI, AZW3, FB2, TXT gibi birçok formatı destekleyen ve iOS/macOS/Windows/Android üzerinde kullanılabilen bir e-kitap okuyucudur. Özelliği, içerik özetleme, soru sorma, hızlı bilgi alma gibi işlevler için OpenAI, Claude, Gemini, DeepSeek gibi çeşitli AI yeteneklerini entegre etmesidir. Uygulama, WebDAV aracılığıyla okuma ilerlemesini, kitap dosyalarını ve notları senkronize etmeyi destekler, yüksek düzeyde özelleştirilebilir okuma stilleri (satır aralığı, yazı tipi, renk şeması vb.) sunar ve TTS okuma, çeviri, arama, fikir kaydetme gibi özellikler içerir. Akıllı, odaklanmış ve kişiselleştirilmiş bir okuma deneyimi sunmayı hedefler. (kaynak: Anxcye/anx-reader – GitHub Trending (all/daily))

Anx Reader: Çoklu AI motoru entegreli platformlar arası e-kitap okuyucu

OpenAI, Codex CLI’yi open source yaptı: Yerel olarak çalışan hafif programlama AI agent’ı: o3/o4-mini’nin duyurulmasıyla birlikte OpenAI, terminalde çalışabilen bir programlama AI agent’ı olan Codex CLI’yi open source yaptı. Geliştiricilerin doğal dil komutları aracılığıyla AI’ın doğrudan yerel bilgisayarda kod yazma, bağımlılıkları yükleme, ortamı yapılandırma, hataları düzeltme gibi kodlama görevlerini gerçekleştirmesine olanak tanır. Codex CLI, o3/o4-mini gibi modellerin güçlü reasoning yeteneklerinden tam olarak yararlanmayı hedefler ve multimodal girdileri (ekran görüntüleri gibi) yerel kod erişim izinleriyle birleştirebilir. Araç, geliştirme süreçlerini basitleştirmeyi, özellikle yeni başlayanlar için kolaylaştırmayı amaçlamaktadır. OpenAI ayrıca bu araca dayalı projeleri desteklemek için 1 milyon dolarlık bir hibe programı başlattı. (kaynak: OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰,首用图像思考,十倍算力爆表samakarminski3doteysamadotey)

OpenAI, Codex CLI'yi open source yaptı: Yerel olarak çalışan hafif programlama AI agent'ı

Cohere modelleri Hugging Face Hub’a geldi, inference hizmeti sunuyor: Cohere, modellerinin Hugging Face Hub’da desteklenen ilk üçüncü taraf inference sağlayıcısı olduğunu duyurdu. Kullanıcılar artık Hub üzerinden Cohere’in open source modellerine (Aya serisi gibi) ve kurumsal modellerine (Command serisi gibi) doğrudan erişebilir ve hızlı inference yapabilirler. Bu modeller özellikle araç kullanımı ve çok dilli yetenekler konusunda başarılıdır ve geliştiricilerin entegrasyonunu ve uygulama oluşturmasını kolaylaştırmak için OpenAI uyumlu arayüzler sunar. (kaynak: huggingfacehuggingfacehuggingface)

Cohere modelleri Hugging Face Hub'a geldi, inference hizmeti sunuyor

LocalAI v2.28.0 yayınlandı ve yerel AI agent platformu LocalAGI tanıtıldı: Yerel olarak LLM çalıştırmak ve OpenAI uyumlu API sağlamak için bir sunucu olan LocalAI, v2.28.0’a güncellendi. Aynı zamanda yepyeni LocalAGI platformu tanıtıldı. LocalAGI, WebUI’ye sahip, kendi kendine barındırılan bir AI agent orkestrasyon platformudur ve kullanıcıların karmaşık, çok adımlı AI agent iş akışları (AutoGPT benzeri) oluşturmasına olanak tanır. Anahtar nokta, bu agent’ların LocalAI veya diğer uyumlu API’ler (llama-cpp-python gibi) aracılığıyla sağlanan yerel LLM’ler tarafından yönlendirilebilmesidir. Yerel bellek deposu LocalRecall ile birlikte kullanıcılar, araştırma, kodlama, içerik işleme gibi görevleri yürütmek için tamamen yerelleştirilmiş bir ortamda otonom AI agent’ları çalıştırabilirler. (kaynak: Reddit r/LocalLLaMA)

LocalAI v2.28.0 yayınlandı ve yerel AI agent platformu LocalAGI tanıtıldı

Droidrun framework’ü open source: AI ile Android telefonları kontrol edin: Droidrun, kullanıcıların AI (büyük dil modelleri gibi) aracılığıyla Android telefonlarda görevleri yürütmek üzere kontrol etmelerini sağlayan bir framework’tür ve şimdi GitHub’da open source olarak yayınlanmıştır. Kullanıcılar doğal dil komutları aracılığıyla AI’ın telefonda uygulama açma, düğmelere tıklama, metin girme gibi işlemleri tamamlamasını sağlayabilirler. Bu, ADB (Android Debug Bridge) aracının yüklenmesini gerektirir. Bu framework, AI’ın mobil cihaz otomasyonu ve etkileşimi konusundaki yeni olasılıkları göstermektedir. (kaynak: karminski3)

Droidrun framework'ü open source: AI ile Android telefonları kontrol edin

LLManager yayınlandı: Bellek tabanlı otomatik onay iş akışı: LLManager, onay görevlerini bellek yeteneklerine sahip AI agent’ları aracılığıyla otomatikleştirmeyi amaçlayan, LangGraph kullanılarak oluşturulmuş open source bir iş akışıdır. Sistem, insan-döngüde işbirliği (human-in-the-loop) yoluyla bellek üretebilir, böylece zamanla onay kararlarını öğrenebilir ve iyileştirebilir. Mimari tasarımı, tekrarlayan onay süreçlerini ele almasına ve verimliliği artırmasına olanak tanır. (kaynak: LangChainAI)

LLManager yayınlandı: Bellek tabanlı otomatik onay iş akışı

LangGraph.js, Hono ile entegre oldu, özel HTTP yönlendirmeleri ve middleware desteği: LangGraph.js (LangChain’in durum bilgili çoklu agent uygulamaları oluşturmak için kullanılan kütüphanesinin JS versiyonu) artık Hono (hafif bir web framework’ü) ile entegre olabiliyor. Bu, geliştiricilerin LangGraph.js uygulamalarına özel HTTP yönlendirmeleri ve middleware eklemelerine olanak tanır, böylece webhook işleme, tam API uygulamaları oluşturma gibi daha karmaşık arka uç hizmetleri oluşturabilir ve LangGraph.js’nin uygulama senaryolarını genişletebilirler. (kaynak: LangChainAI)

LangGraph.js, Hono ile entegre oldu, özel HTTP yönlendirmeleri ve middleware desteği

Open source insansı robot Reachy 2 satışa sunuldu: Hugging Face kurucu ortağı Clem Delangue, ekibinin katıldığı ilk open source insansı robot Reachy 2’nin bu hafta satışa sunulduğunu duyurdu. Robot 70.000 dolara satılıyor ve araştırma ve eğitim pazarına yönelik olup, Cornell Üniversitesi, Carnegie Mellon Üniversitesi ve önde gelen AI laboratuvarlarında kullanılıyor. İnsan benzeri bir forma, çok yönlü hareketli bir tabana, zengin sensörlere (kameralar, mikrofonlar, LiDAR vb.) sahip, ROS 2 ve LeRobotHF tabanlı, Python SDK’yı destekliyor ve modüler tasarımı özelleştirmeye olanak tanıyor. (kaynak: huggingface)

Open source insansı robot Reachy 2 satışa sunuldu

Perplexity, AI-native tarama deneyimini keşfetmek için Comet tarayıcısını sunuyor: Perplexity CEO’su Arav Srinivas, Comet adında bir tarayıcı geliştiriyor ve ürün büyümesi ve özellikleri konusunda fikir arıyor. Comet, tarayıcı aracılığıyla web uygulamalarını ve verileri kontrol ederek, soruları yanıtlamak ve görevleri yürütmek için AI’ı kullanarak bir “agentic OS” (agent tabanlı işletim sistemi) olmayı hedefliyor. Fikir, çoğu uygulamanın Web’de olduğu için tarayıcıyı kontrol eden AI’ın dijital yaşamın çoğunu kontrol edebileceği yönünde. Proje, küçükten başlamayı ve genel yetenekler konusunda aşırı vaatlerden kaçınmayı vurguluyor. (kaynak: AravSrinivasAravSrinivasAravSrinivasAravSrinivasAravSrinivas)

cool query on my comet browser for handling my X addiction.

Claude App, MCP isteklerini otomatik onaylama betiğini destekliyor: Topluluk kullanıcıları, Claude App geliştirici araçları konsolunda çalışan ve önceden tanımlanmış güvenilir araçlar listesinden gelen MCP (Model Context Protocol) isteklerini otomatik olarak onaylayabilen bir JavaScript betiği paylaştı. Bu, belirli yerel veya uzak araçları sık kullanan kullanıcılar için her seferinde manuel olarak “İzin Ver” tıklama zahmetinden kurtararak iş akışı verimliliğini artırabilir. Ancak kullanıcıların güvenlik risklerine dikkat etmesi ve yalnızca tamamen güvendikleri araçlar için etkinleştirmesi gerekir. (kaynak: Reddit r/ClaudeAI)

Claude App, MCP isteklerini otomatik onaylama betiğini destekliyor

Olmazsa olmaz MCP sunucuları önerisi, kodlama ve iş akışı otomasyonuna yardımcı oluyor: Topluluk kullanıcıları, MCP destekli AI modelleri (Claude gibi) veya Agent framework’leri ile entegre edilebilen, kodlama verimliliğini ve otomasyon yeteneklerini artıran bir dizi önerilen MCP (Model Context Protocol) sunucusunu paylaştı. Öneri listesi şunları içerir: yapılandırılmış düşünme için Sequential Thinking MCP, web etkileşimi için Puppeteer MCP, proje bilgi yönetimi için Memory Bank MCP, tarayıcılar arası test için Playwright MCP, GitHub işlemleri için GitHub MCP, kalıcı bellek için Knowledge Graph Memory MCP, API anahtarı olmadan arama için DuckDuckGo MCP ve daha fazla MCP aracı keşfetmek için MCP Compass. (kaynak: Reddit r/ClaudeAI)

Olmazsa olmaz MCP sunucuları önerisi, kodlama ve iş akışı otomasyonuna yardımcı oluyor

📚 Öğrenme Kaynakları

GitHub deposu: Gelişmiş RAG teknikleri kapsamlı kılavuzu: Nir Diamant tarafından oluşturulan RAG_Techniques GitHub deposu, şu anda mevcut olan en kapsamlı gelişmiş Retrieval-Augmented Generation (RAG) teknikleri eğitim koleksiyonunu sunmaktadır. Depo, RAG sistemlerinin doğruluğunu, verimliliğini ve bağlam zenginliğini artırmayı amaçlamakta ve temel uygulamalardan (LangChain/LlamaIndex), metin parçalama optimizasyonuna (sabit boyut, önerme parçalama, anlamsal parçalama), sorgu geliştirmeye (dönüşüm, HyDE, HyPE), bağlam zenginleştirmeye (blok başlığı, ilgili bölüm çıkarma, pencere genişletme, belge geliştirme), gelişmiş retrieval’a (füzyon, yeniden sıralama, çok yönlü filtreleme, hiyerarşik indeksleme, entegrasyon, multimodal), iteratif tekniklere (geri bildirim döngüsü, adaptif, iteratif retrieval), değerlendirmeye (DeepEval, GroUSE), yorumlanabilirliğe ve gelişmiş mimarilere (Graph RAG, RAPTOR, Self-RAG, CRAG) kadar 30’dan fazla tekniği kapsamakta ve Jupyter Notebook veya Python betiği uygulamaları sunmaktadır. Proje topluluk odaklıdır ve katkıları teşvik etmektedir. (kaynak: NirDiamant/RAG_Techniques – GitHub Trending (all/daily))

GitHub deposu: Gelişmiş RAG teknikleri kapsamlı kılavuzu

DeepLearning.AI yeni bir kurs başlattı: AI Tarayıcı Agent’ları Oluşturma: Andrew Ng, AGI Inc. ile işbirliği içinde yeni bir kısa kurs olan “Building AI Browser Agents”ı duyurdu. Kurs, AGI Inc. kurucu ortakları Div Garg ve Naman Garg tarafından veriliyor ve web siteleriyle etkileşime girebilen ve görevleri (bilgi toplama, form doldurma, tıklama, sipariş verme gibi) yerine getirebilen AI agent’larının nasıl oluşturulacağını öğretmeyi amaçlıyor. Kurs içeriği şunları kapsıyor: Web Agent’larının çalışma prensipleri, mimarisi, sınırlamaları, karar verme stratejileri; DeepLearning.AI kurslarını tarayan ve yapılandırılmış çıktı veren bir Web Agent’ı uygulamalı olarak oluşturma; çoklu görevleri (web sayfalarını bulup özetleme, form doldurma, abone olma) tamamlayan otonom bir Agent oluşturma; AgentQ framework’ünü (Monte Carlo Tree Search MCTS ve Direct Preference Optimization DPO’yu birleştirerek kendi kendini düzeltmeyi sağlayan) keşfetme; MCTS prensiplerini derinlemesine inceleme; ve AI Agent’larının mevcut durumu ve geleceği üzerine tartışma. (kaynak: AndrewYNg)
Hugging Face, kavramsal kılavuzlar ve seçim benchmark’ları sunan quantization belgelerini güncelledi: Hugging Face, model quantization konusundaki belgelerini önemli ölçüde güncelledi. Yeni belgeler, kullanıcıların quantization kavramlarını daha iyi anlamalarına ve ihtiyaçlarına göre uygun teknolojiyi seçmelerine yardımcı olmayı amaçlıyor. Güncellenen içerikler şunları içeriyor: quantization temellerinin açıklaması (örneğin şemalar, int4, FP8), yeni bir seçim kılavuzu (ihtiyaçlara ve donanıma göre bnb, AWQ, GPTQ, HQQ gibi teknolojiler arasında seçim yapmaya yardımcı olan) ve Llama 3.1 8B ve 70B modelleri için popüler quantization yöntemlerinin doğruluğu ve performansına ilişkin benchmark karşılaştırma verileri. Bu, modelleri sıkıştırmak ve inference verimliliğini artırmak isteyen geliştiriciler için değerli bir referans sağlıyor. (kaynak: huggingface)

Hugging Face, kavramsal kılavuzlar ve seçim benchmark'ları sunan quantization belgelerini güncelledi

Yeni yöntem MODE: Hafif, yorumlanabilir RAG alternatifi: Bağımsız araştırmacı Rahul Anand, geleneksel RAG süreçlerine hafif bir alternatif olarak MODE (Mixture of Document Experts) adlı yeni bir yöntem önerdi. MODE, vektör veritabanlarına ve yeniden sıralayıcılara dayanmaz, bunun yerine belgeleri kümeleyerek ve bilgi çıkarmak için merkezcil tabanlı bir retrieval yöntemi kullanarak çalışır. Bu yöntemin, özellikle orta ve küçük ölçekli veri kümeleri için verimli ve yorumlanabilir olduğu iddia ediliyor. Yazar, makaleyi yayınlamak için arXiv’den (cs.AI alanı) onay bekliyor. (kaynak: Reddit r/MachineLearning)

Yeni yöntem MODE: Hafif, yorumlanabilir RAG alternatifi

GitHub deposu Beyond-NanoGPT: LLM acemisinden AI araştırmacısına ilerleme kaynağı: Tanishq Kumar, beyond-nanoGPT adlı bir GitHub deposunu open source yaptı. Proje, nanoGPT seviyesinde LLM temel bilgilerine hakim olan öğrenicilerin, derin öğrenme araştırmalarının ön saflarına yakın karmaşık fikirleri daha fazla anlamalarına ve uygulamalarına yardımcı olmayı amaçlıyor. Depo, spekülatif kod çözme (speculative decoding), görsel/difüzyon Transformer’lar, lineer/seyrek dikkat mekanizmaları dahil olmak üzere çeşitli modern ML araştırma ilerlemelerini sıfırdan uygulayan binlerce satır açıklamalı PyTorch kodu içeriyor. Projenin amacı, daha fazla insanın AI araştırma alanına geçiş yapmasına yardımcı olmaktır. (kaynak: Reddit r/MachineLearning)
Eğitim: AI Scraper ve LLM kullanarak GitHub deposu tabanlı bir sohbet botu eğitme: Stackademic blogunda yayınlanan bir makale, belirli bir GitHub deposu hakkındaki soruları yanıtlayabilen bir sohbet botunu eğitmek için AI Scraper (web kazıma aracı) ve büyük dil modellerinin (LLM) nasıl kullanılacağını tanıtıyor. Bu yöntem genellikle depodaki kodları, belgeleri (README gibi), Issues gibi bilgileri kazımayı, bunları LLM’nin anlayabileceği bir formata işlemeyi ve ardından RAG (Retrieval-Augmented Generation) veya fine-tuning yoluyla sohbet botunun bu bilgilere dayanarak soru-cevap yapmasını sağlamayı içerir. (kaynak: Reddit r/ArtificialInteligence)

Eğitim: AI Scraper ve LLM kullanarak GitHub deposu tabanlı bir sohbet botu eğitme

Makale yorumu: Katmanlı İlişki Yayılımı (LRP) kullanarak tablosal veriler için yorumlanabilir AI (XAI) gerçekleştirme: Bir blog yazısı, derin öğrenme modellerinin tablosal verileri işlerken karar verme süreçlerini açıklamak için Katmanlı İlişki Yayılımı (Layer-Wise Relevance Propagation, LRP) tekniğinin nasıl kullanılacağını ele alıyor. LRP, modelin çıktı tahminini girdi özelliklerine ayrıştırmayı amaçlayan bir atıf yöntemidir, böylece hangi özelliklerin nihai karara en fazla katkıda bulunduğunu ortaya çıkarır. Bunu tablosal verilere uygulamak, model davranışını anlamaya, şeffaflığı ve güvenilirliği artırmaya yardımcı olur. (kaynak: Reddit r/deeplearning)

XAI in Action: Unlocking Explainability with Layer-Wise Relevance Propagation for Tabular Data

💼 İş Dünyası

Zhipu AI, halka arz için danışmanlık sürecini başlattı, yıl içinde tamamlanması planlanıyor: Çinli AI şirketi Zhipu AI, CICC’nin danışman kurum olarak görev yaptığı halka arz için danışmanlık kaydını resmi olarak başlattı. Kayıt raporuna göre, Zhipu AI, IPO danışmanlığını 2025 Ağustos ile Ekim ayları arasında tamamlamayı planlıyor. Daha önce şirket CEO’su Zhang Peng, AGI’ye ulaşma yolunun uzun olduğunu, elde edilen finansmanın sadece “yol harçlığı” olduğunu ve gelecekte daha fazla fon desteğine ihtiyaç duyulacağını belirtmişti. Bu IPO, “daha fazla yol harçlığı” elde etmek için kritik bir adım olarak görülüyor. Zhipu AI, Çin’in büyük model alanındaki önemli oyunculardan biridir ve IPO süreci yakından takip edilmektedir. (kaynak: 压力给到梁文锋)
2 kişilik startup Gumloop, AI kullanarak 100 milyon yuan’dan fazla finansman sağladı: Sadece iki kurucusu resmi çalışanı olan kodsuz platform Gumloop, yakın zamanda 17 milyon ABD Doları (yaklaşık 124 milyon RMB) tutarında A Serisi finansman turunu tamamladı. Şirket, Auto-GPT için kullanımı kolay bir UI sağlamak amacıyla kuruldu, daha sonra teknik olmayan kişiler için AI iş akışı oluşturma platformu AgentHub’a dönüştü; GitHub, Gmail gibi araçları entegre edebiliyor, belge işleme, web kazıma, SEO, CRM, e-posta pazarlaması gibi görevleri otomatikleştirebiliyor. Gumloop, şirket işlerini yürütmek için büyük ölçüde AI Agent’ları kullanıyor ve kurucuların hedefi, 10 kişiden az bir ekiple 1 milyar dolarlık bir değerlemeye sahip bir şirket kurmak. Bu, AI çağında küçük ekiplerin AI araçlarını kullanarak yüksek verimlilik ve değer elde etme potansiyelini ve AI uygulamalarının hayata geçirilmesindeki “son mil” sorununu çözme girişimcilik fırsatını yansıtıyor. (kaynak: 把AI当成“牛马”,2人创业团队,拿下了超1亿元融资)
Söylenti: OpenAI, AI programlama aracı şirketi Windsurf’ü (eski adıyla Codeium) 3 milyar dolara satın almayı planlıyor: Bloomberg’in konuya yakın kaynaklara dayandırdığı haberine göre, OpenAI, AI destekli programlama aracı şirketi Windsurf’ü (eski adıyla Codeium) yaklaşık 3 milyar dolara satın almak için görüşmeler yapıyor. Anlaşma gerçekleşirse, bu OpenAI tarihindeki en büyük satın alma olacak ve şirketin AI programlama asistanı pazarındaki rekabet gücünü artırarak Anthropic, GitHub Copilot, Anysphere (Cursor) gibi rakiplerle doğrudan rekabet etmesini sağlayacak. Windsurf 2021’de kuruldu, daha önceki değerlemesi 1.25 milyar dolara ulaşmıştı ve 200 milyon dolardan fazla finansman almıştı. Bu satın alma söylentisi aynı zamanda AI programlama araçları alanında konsolidasyonun artabileceğini gösteriyor. (kaynak: dotey)
Ilya Sutskever’in Safe Superintelligence şirketinin değerlemesinin 32 milyar dolar olduğu bildiriliyor: TechCrunch’a göre, OpenAI kurucu ortağı Ilya Sutskever tarafından kurulan yeni şirket Safe Superintelligence (SSI), son finansman turunda 32 milyar dolarlık bir değerlemeye ulaştı. Şirketin 2 milyar dolar yatırım aldığı iddia ediliyor. SSI’nin hedefi süper zekayı güvenli bir şekilde inşa etmek ve yüksek değerlemesi, şirketin henüz herhangi bir ürün yayınlamamış olmasına rağmen piyasanın en iyi AI yeteneklerine ve AGI vizyonuna olan yüksek beklentisini yansıtıyor. (kaynak:

)
ABD-Çin ticaret savaşı AI gelişimini etkileyebilir, çip tedariki odak noktası: Bazı analizlere göre, ABD’nin Çin’e yönelik ticaret savaşı, özellikle üst düzey AI çipleri (NVIDIA H100/B200 serisi gibi) üzerindeki ihracat kısıtlamaları ve Çin’in nadir toprak mineralleri ihracatını sınırlama potansiyeli taşıyan olası misillemeleri, küresel AI gelişimi için zorluklar yaratıyor. Haberde, AI şirketlerinin (OpenAI gibi) GPU tedarikindeki kısıtlamaları hissettiği belirtiliyor. Aynı zamanda, Çin’in çip üretiminde ilerleme kaydettiği (3nm, 1nm teknoloji atılımları gibi) ve önümüzdeki birkaç yıl içinde yüksek kaliteli AI çipleri üretebileceği ifade ediliyor. Makalenin görüşüne göre, mevcut ticaret kısıtlamaları ABD’nin AI gelişim hızını yavaşlatabilir, hatta Çin’in AI alanında öne geçmesine neden olabilir ve serbest ticaret yoluyla AI gelişiminin teşvik edilmesi çağrısında bulunuluyor. (kaynak: Reddit r/ArtificialInteligence)
TPU’ların üretim ortamlarındaki pratik uygulamalarını tartışma: Google kısa süre önce inference için optimize edilmiş yeni nesil TPU’ları (Tensor Processing Unit) yayınladı. Ancak topluluk tartışmaları, TPU’ların yıllardır var olmasına ve Google’ın cömert araştırmacı kaynak programı (TRC) sunmasına rağmen, endüstriyel üretim ortamlarında TPU uygulamasının NVIDIA GPU kadar yaygın görünmediğini belirtiyor. Nedenleri arasında kurulum karmaşıklığı, performans avantajlarının belirgin olmaması, GCP platformuyla ilgili özelliklerin (sabit IP, gözlemlenebilirlik araçları gibi) yetersizliği, hata ayıklama zorlukları (XLA) ve yalnızca GCP üzerinden kiralanabilmesinin getirdiği tedarikçi kilidi endişeleri olabilir. Tartışma, gerçek üretim deneyimi olan kullanıcıları TPU kullanım durumlarını ve zorluklarını paylaşmaya çağırıyor. (kaynak: Reddit r/MachineLearning)

TPU'ların üretim ortamlarındaki pratik uygulamalarını tartışma

AI, sigorta sektöründe güven açığı yaratıyor: Swiss Re’nin araştırma raporu, üretken AI’ın sigorta sektöründeki uygulamasının güven zorluklarıyla karşı karşıya olduğunu belirtiyor. AI potansiyeli büyük olsa da, veri gizliliği, siber güvenlik, karar şeffaflığı gibi konularda endişeler bulunuyor ve bu da sigorta şirketleri ile müşteriler arasında bir güven açığına neden olabiliyor. Rapor, AI avantajlarından yararlanırken ilgili riskleri ve etik sorunları çözerek kullanıcı güvenini nasıl oluşturulacağını ve sürdürüleceğini tartışıyor. (kaynak: Ronald_vanLoon)

🌟 Topluluk

OpenAI o3/o4-mini hararetli tartışmalara yol açtı, yetenek ve abartı bir arada: OpenAI’nin o3 ve o4-mini’yi yayınlamasının ardından topluluktan yoğun tepkiler geldi. İlk test edenler (Dan Shipper gibi) hızını, zekasını ve agent yeteneklerini övdü, tercih edilen model haline geldiğini, kod benchmark testlerini tamamlayabildiğini, kişiselleştirilmiş dersler oluşturabildiğini, bulanık görüntüleri tanıyabildiğini, yazıları analiz edebildiğini belirtti. Sam Altman bunu retweetleyerek “dahi seviyesine yakın veya ulaşmış” olduğunu vurguladı. Ancak, bazı yorumlar (AI Explained videosu gibi) modellerin güçlü olmasına rağmen “AGI”, “halüsinasyonsuz” gibi ifadelerin abartılı olduğunu, modellerin bazı sağduyu ve fiziksel reasoning konularında hala hatalar yaptığını ve fiyat/performans oranının Gemini 2.5 Pro kadar iyi olmayabileceğini belirtti. Topluluk genel olarak ilerlemeyi, özellikle kodlama ve araç kullanımı alanlarında takdir ediyor, ancak gerçek yetenekleri ve sınırlamaları konusunda temkinli yaklaşıyor. (kaynak:

samasamakarminski3gdbnatolambert)

o3 is out and it is absolutely amazing!! i've been playing with it for a week or so and it's already my go-to model. it's fast, a...

Topluluk tartışması: AI, AGI’ye ulaşmak için esas olarak işlem gücü ilerlemesine mi dayanıyor?: Reddit kullanıcıları, AGI’ye (Genel Yapay Zeka) ulaşmanın esas olarak ham hesaplama gücünün artmasına mı bağlı olduğunu tartışmaya açtı. Görüşe göre, mevcut LLM’lerin sınırlamaları olsa bile, hesaplama gücünün bir kat daha artması, “gerçek” AGI olmasa bile AGI’ye yakın bir fayda sağlayabilir. Anahtar nokta, AGI sorununun özünde “ele alınabilir” (tractable) olup olmadığıdır; eğer öyleyse, kaba kuvvet hesaplaması (brute force) yeterli olabilir. Ancak bazı yorumlar, yalnızca işlem gücünün LLM’lerin temel sınırlamalarını aşamayacağını, AGI’nin daha fazla paradigma atılımı gerektirdiğini savunarak buna karşı çıkıyor. (kaynak: Reddit r/ArtificialInteligence)
Topluluk tartışması: Hangi sektörler AI tarafından ilk önce altüst edilecek?: Reddit kullanıcıları, hangi sektörlerin AI etkisiyle ilk önce “çökeceğini” tahmin etmek üzere bir tartışma başlattı. Aday gösterilen sektörler şunlar: çeviri/metin yazarlığı, müşteri desteği, dil öğretimi, portföy yönetimi, illüstrasyon/ticari fotoğrafçılık. Yorum bölümünde ulaşım, tasarım (arayüz, marka, logo), halkla ilişkiler/pazarlama/sosyal medya yönetimi, öğretim (özellikle özel ders), blog/podcast (içerik oluşturma şekli değişiyor), etkinlik organizasyonu yönetimi gibi alanlar eklendi. Bazı yorumlar, yüksek düzeyde uzmanlaşmış çeviri veya insan yaratıcılığının çekirdeğini gerektiren illüstrasyon gibi tüm alanların tamamen ortadan kalkmayacağını da belirtti. (kaynak: Reddit r/ArtificialInteligence)
Kullanıcı deneyimi: AI tarafından oluşturulan kodun hata ayıklaması zorluklarla dolu: Bir geliştirici, LLM tarafından (SAS’tan SQL/Python’a geçiş) oluşturulan kodun hata ayıklama deneyimini paylaştı. AI kodu “düzgün” görünse de, aslında hatalarla doluydu: tanımlanmamış fonksiyonları çağırdı, benzer ancak aynı olmayan kod mantığını karıştırdı, formatı kötü ama doğru olan SQL’i atladı, kritik sayısal değerleri rastgele değiştirdi ve birden çok çalıştırmada tutarsız sonuçlar üretti. Nihai sonuç, kodun tamamen kullanılamaz olduğu, yeniden yazılması gerektiği ve onarmanın yeniden yazmaktan daha riskli olduğuydu. Bu, mevcut AI kod oluşturma yeteneklerinin sınırlamalarını vurguluyor ve manuel inceleme ve doğrulamanın gerekliliğini vurguluyor. (kaynak: Reddit r/ArtificialInteligence)
AI ve işçi ilişkileri: Sendikalar nasıl yanıt vermeli?: Tartışma, AI’ın çeşitli sektörlerdeki otomasyon yetenekleri arttıkça, sendikaların işçiler üzerindeki potansiyel etkilerine daha aktif bir şekilde yanıt vermesi gerektiğini belirtiyor. Makale, geçmişte AI içeren grev ve protesto olaylarına atıfta bulunuyor: lisansüstü öğrenciler greve gittikten sonra okulun AI ile ikame önermesi, öğrenci protestolarını izlemek için AI kullanılması, otomatikleştirilmiş ruh sağlığı hizmetleri konusundaki endişeler, öğretmenlerin okullarda AI uygulaması nedeniyle greve gitme olasılığı gibi. Görüşe göre, işçiler (ve temsilci örgütleri) beklememeli, AI’ın getirdiği değişimlere karşı proaktif stratejiler geliştirmelidir. (kaynak: Reddit r/artificial)

AI ve işçi ilişkileri: Sendikalar nasıl yanıt vermeli?

RealHarm veri kümesi yayınlandı: Gerçek dünyadaki AI Agent başarısızlık vakalarını topluyor: Giskard ekibi, AI Agent’larının (özellikle LLM tabanlı olanların) gerçek uygulamalarda sorun yaşadığı kamuya açık olarak bildirilen gerçek vakaları içeren RealHarm veri kümesini yayınladı. Bu vakaları analiz ederek ekip, itibar zararının en yaygın kurumsal zarar olduğunu, yanlış bilgi ve halüsinasyonların en yaygın risk türleri olduğunu ve mevcut güvenlik önlemlerinin birçok olayı etkili bir şekilde engelleyemediğini buldu. Veri kümesi, araştırmacıların ve geliştiricilerin AI’ın gerçek dünyadaki risklerini daha iyi anlamalarına ve önlemelerine yardımcı olmayı amaçlıyor. (kaynak: Reddit r/LocalLLaMA)

RealHarm veri kümesi yayınlandı: Gerçek dünyadaki AI Agent başarısızlık vakalarını topluyor

Rapor, halka açık Ollama sunucularının güvenlik risklerini ortaya koyuyor: freeollama.com web sitesi, internete açık çok sayıda Ollama sunucusu örneğini gösteriyor. Bu, birçok kullanıcının yerel LLM hizmetlerini dağıtırken güvenlik önlemlerini (dinleme adresini 0.0.0.0 olarak ayarlamak ancak kimlik doğrulama eklememek gibi) doğru şekilde yapılandırmadığını ve bunun sonucunda modellerinin ve potansiyel verilerinin yetkisiz erişim ve kötüye kullanım riskine maruz kaldığını gösteriyor. Kullanıcılara yerel AI hizmetlerini dağıtırken ağ güvenliği yapılandırmasına dikkat etmeleri hatırlatılıyor. (kaynak: Reddit r/LocalLLaMA)

Rapor, halka açık Ollama sunucularının güvenlik risklerini ortaya koyuyor

Görüş: Reasoning modelleri ile non-reasoning modelleri kesin olarak ayrılmamalı: AI araştırmacısı Nathan Lambert, modellerin kesin olarak “reasoning” ve “non-reasoning” olarak iki kategoriye ayrılmaması gerektiğini, bunun yerine tüm modellerin tüm alanlarda değerlendirilmesi gerektiğini öne sürüyor. “Reasoning modelleri” genellikle non-reasoning benchmark’larında da üstün performans gösterirken, tersi geçerli değildir. Bu, reasoning yeteneğine sahip modellerin daha genel amaçlı olabileceğini ima ediyor. Aynı zamanda, farklı yetenekleri ve maliyetleri yansıtacak daha iyi fiyatlandırma modellerine ihtiyaç olduğunu belirtiyor. (kaynak: natolambert)
DeepMind kurucu ortağı Demis Hassabis, TIME100’e seçildi, AI güvenliği işbirliğini vurguladı: Google DeepMind CEO’su Demis Hassabis, TIME dergisinin 2025 yılı 100 Etkili Kişi listesine seçildi. Röportajında, rakip ülkelerin ve şirketlerin farklılıklarını bir kenara bırakıp AI güvenliği konusunda işbirliği yapmalarını umduğunu, çünkü AI’ın iyiye doğru gelişmesini sağlamanın herkesin kendi çıkarına olduğunu vurguladı. (kaynak: demishassabis)

DeepMind kurucu ortağı Demis Hassabis, TIME100'e seçildi, AI güvenliği işbirliğini vurguladı

Google DeepMind yöneticisi: Reinforcement learning, insan bilgisini aşmalı: Google DeepMind Reinforcement Learning Başkan Yardımcısı David Silver, AI araştırmasının bilinen insan bilgisini aşması ve kendi kendine öğrenebilen, hatta yeni bilimsel bilgiler keşfedebilen sistemlere doğru ilerlemesi gerektiğini savunuyor. Bu, reinforcement learning’in AI’ın otonom keşif ve keşif potansiyelini vurguluyor. (kaynak: GoogleDeepMind)
Görüş: AI gelişimindeki darboğaz işlem gücünden veri ve değerlendirmeye kaydı: Kling 2.0, GPT-4.1, o3 gibi model ilerlemelerini analiz eden bir videoda, AI Explained kanalı sunucusu, OpenAI yöneticilerinin görüşlerine atıfta bulunarak, mevcut AI gelişimindeki sınırlayıcı faktörlerin artık işlem gücünden çok veriye, özellikle yüksek kaliteli, alana özgü verilere ve etkili değerlendirme yöntemlerine (Evals) kaydığını belirtiyor. Model performansının artırılması giderek daha iyi veriler bulmaya ve ilerlemeyi ölçmenin daha iyi yollarına bağlı hale geliyor. (kaynak:

)
Non-reasoning modellerinin fiyat ve performans karşılaştırma grafiği: Reddit topluluğu, farklı non-reasoning LLM’lerin fiyatlarını (muhtemelen API maliyeti) LiveBench (gerçek zamanlı bir benchmark platformu) üzerindeki performans puanlarıyla karşılaştıran bir grafik paylaştı. Grafik, çeşitli modellerin belirli bir benchmark üzerindeki fiyat/performans oranını görsel olarak gösteriyor, örneğin Gemma/Gemini serisinin fiyat/performans açısından öne çıktığını gösteriyor. (kaynak: Reddit r/LocalLLaMA)

Non-reasoning modellerinin fiyat ve performans karşılaştırma grafiği

💡 Diğer

Beyin-bilgisayar arayüzünde yeni gelişme: Beyin dalgalarını doğrudan konuşmaya dönüştürme: Yeni bir araştırma, felçli kişilerin beyin dalgalarını gerçek zamanlı olarak çözüp doğal konuşmaya sentezleyebilen bir beyin-bilgisayar arayüzü (BCI) implantını gösteriyor. Bu teknoloji, sinir hasarı veya hastalık nedeniyle konuşma yeteneğini kaybeden kişiler için yeni iletişim olanakları sunuyor ve AI’ın yardımcı teknoloji ve sinirbilim kesişimindeki önemli bir atılımıdır. (kaynak: Ronald_vanLoonRonald_vanLoon)

Brain-to-Voice #AI Streams Natural Speech for People with Paralysis

miHoYo kurucusu Cai Haoyu’nun AI oyun keşfi: Eski miHoYo CEO’su Cai Haoyu’nun kurduğu AI şirketi Anuttacon, deneysel AI oyunu “Whispers From The Star”ın fragmanını ve oynanışını yayınladı. Oyun, AI güdümlü gerçek zamanlı diyalogları merkeze alıyor; oyuncular metin, ses veya video aracılığıyla AI karakteri Stella ile etkileşime girerek hayatta kalmasına rehberlik ediyor. Oyun, multimodal AI teknolojisini kullanıyor; Stella’nın duyguları, tepkileri ve hareketleri AI tarafından gerçek zamanlı olarak üretiliyor, yüz ifadeleri ve hareketleri doğal görünüyor. Bu, Cai Haoyu’nun AIGC’nin oyun geliştirmeyi değiştirme konusundaki keşfini yansıtıyor, ancak teknoloji olgunluğu, iş modeli ve oyuncu kabulü gibi zorluklarla karşı karşıya. Makale ayrıca Tencent, NetEase gibi büyük şirketlerin oyunlarda AI uygulama stratejilerini de karşılaştırıyor. (kaynak: 原神之后,蔡浩宇的 AIGC 游戏野望)

原神之后,蔡浩宇的 AIGC 游戏野望

Unitree Technology, endüstriyel tekerlekli robot B2-W’yi yükseltti: Unitree Robotics, endüstriyel sınıf tekerlekli robotu B2-W’nin yükseltilmiş yeteneklerini sergiledi. Belirli yükseltme içerikleri detaylandırılmamış olsa da, genellikle bu tür robotlar navigasyon, engellerden kaçınma, görev yürütme vb. için AI teknolojisini entegre eder; bu yükseltme daha güçlü otonomi, yük kapasitesi veya belirli endüstriyel senaryo uygulamalarını içerebilir. (kaynak: Ronald_vanLoon)
Robotlar insan becerilerini öğreniyor: Circuit Robotics, robotların insan becerilerini nasıl öğrendiğini gösteriyor. Bu genellikle taklit öğrenme (imitation learning), reinforcement learning gibi AI yöntemlerini içerir; robotların gösterimleri izleyerek veya deneme yanılma yoluyla karmaşık operasyon görevlerini öğrenmesini sağlar ve robotik ile AI’ın birleştiği önemli bir araştırma yönüdür. (kaynak: Ronald_vanLoon)
Alışveriş robotları gerçeğe dönüşüyor: Fabrizio Bustamante tarafından paylaşılan video veya bilgi, alışveriş yapmak için robot kullanmanın gerçeğe dönüştüğünü gösteriyor. Bu, depolardaki otomatik ayıklama robotlarını veya tüketicilere yönelik teslimat robotlarını, mağaza içi rehber robotlarını vb. ifade edebilir; bunlar genellikle yol planlaması, nesne tanıma ve insan-makine etkileşimi için AI gerektirir. (kaynak: Ronald_vanLoon)
Tarımda AI ve robotların uygulamaları: JC Niyomugabo, AI ve robotların tarımda (AgriTech) uygulamalarını tartışıyor. Bu, mahsul izleme, hastalık ve zararlı teşhisi, hassas sulama ve gübreleme kararları için AI kullanımını ve otomatik ekim, yabani ot temizleme, hasat vb. için robot kullanımını içerir. Tarımsal verimliliği, verimi ve sürdürülebilirliği artırmayı amaçlar. (kaynak: Ronald_vanLoon)
“Gizli silah” taşıyan nanorobotlar kanser hücrelerini öldürebilir: Khulood Almani tarafından paylaşılan araştırma, “gizli silahlarla” (belirli mekanizma detaylandırılmamış) donatılmış bir nanorobotun kanser hücrelerini hedefleyip öldürebildiğini gösteriyor. Nanorobotların navigasyon ve hedefleme mekanizmaları genellikle karmaşık biyolojik ortamlarda hedefi tanımak ve görevleri yürütmek için AI algoritmalarını içerir ve sağlık alanında öncü bir uygulamadır. (kaynak: Ronald_vanLoon)
COVVI biyonik elinin geliştirilmesi: COVVI şirketi tarafından geliştirilen biyonik el, ampütelere daha esnek ve işlevsel protezler sağlamayı amaçlamaktadır. Bu tür gelişmiş biyonik eller genellikle kullanıcının kas sinyallerini (EMG gibi) veya sinir sinyallerini yorumlamak için sensörleri ve AI algoritmalarını entegre eder, böylece daha doğal düşünce kontrolü ve hassas operasyon sağlar. (kaynak: Ronald_vanLoon)
Çin insansı robotu kalite kontrol görevlerini yerine getiriyor: WevolverApp, Çin’in insansı robotlarının kalite kontrol görevlerini yerine getirmek için kullanıldığını bildirdi. Bu, robotun gelişmiş görsel tanıma yeteneklerine (muhtemelen AI güdümlü), hassas manipülasyon yeteneklerine ve ürünün uygun olup olmadığına karar vermek için belirli bir karar verme yeteneğine sahip olmasını gerektirir ve insansı robotların endüstriyel otomasyon alanındaki uygulamalarına bir örnektir. (kaynak: Ronald_vanLoon)
Dünyanın ilk robot diş hekimi tarafından gerçekleştirilen insan ameliyatı: Gigadgets, tamamen bir robot diş hekimi tarafından gerçekleştirilen dünyanın ilk insan ameliyatını bildirdi. Detaylar belirsiz olsa da, bu genellikle robot sisteminin AI destekli olarak ameliyat planlaması, konumlandırma ve operasyon gerçekleştirdiği anlamına gelir; ameliyat hassasiyetini ve tutarlılığını artırmayı amaçlar ve tıbbi robotik ile AI’ın birleştiği bir dönüm noktasıdır. (kaynak: Ronald_vanLoon)
AI, dijital ilerlemeyi yönlendiriyor, akıllı uluslar inşa ediyor: Ronald van Loon’un Huawei ile işbirliği içinde yazdığı makale, AI, Nesnelerin İnterneti (IoT), bağlantı ve veri analizi gibi dijital teknolojiler aracılığıyla ulusal ilerlemenin nasıl sağlanacağını ve daha akıllı ulusların nasıl inşa edileceğini tartışıyor. AI’ın kamu hizmetlerini optimize etme, altyapı yönetimi, ekonomik kalkınma gibi alanlardaki rolünü vurguluyor. (kaynak: Ronald_vanLoon)

Building Smarter Nations by Driving Digital Progress

Suda ve karada hareket edebilen Velox robotu: Pascal Bornet tarafından paylaşılan Velox robotu, suda ve karada hareket edebilen amfibi bir robottur. Bu çok yönlülük, arama kurtarma, çevre izleme gibi karmaşık senaryolarda kullanılmasını sağlayabilir; otonom navigasyon ve farklı ortamlara uyum sağlama yeteneği AI tarafından yönlendirilebilir. (kaynak: Ronald_vanLoon)