Anahtar Kelimeler:Zhipu AI, AutoGLM, GPT-5 Pro, DeepSeek V3.1, Seed-OSS, AI Ajan, Somutlaştırılmış Yapay Zeka, Büyük Dil Modelleri, Mobil Evrensel Ajan, GLM-4.5 Dil Modeli, Matematiksel Sınır Kanıtı, Hibrit Çıkarım Mimarisi, 512K Bağlam Penceresi
🔥 Odak Noktası
Zhipu, Dünyanın İlk Mobil Evrensel Agent’ını Duyurdu: Zhipu AI, dünyanın ilk mobil evrensel Agent’ı AutoGLM’yi resmi olarak piyasaya sürdü. Bu Agent, APP’ler arası görev yürütmeyi destekliyor ve bulut tabanlı çalıştığı için yerel cihaz kaynaklarını tüketmiyor. AutoGLM, her kullanıcıya bulut telefonlar ve bulut bilgisayarlar sağlayarak yerel işlem gücü sınırlamaları ve kaynak tüketimi sorunlarını çözüyor. Yetenekleri, Zhipu’nun GLM-4.5 dil modeli ve GLM-4.5V görsel çıkarım modeline dayanıyor. Bu adım, mobil operasyonların zekasını ve rahatlığını önemli ölçüde artırmayı hedefliyor ve halka ücretsiz olarak sunulacak, böylece Agent teknolojisinin tüketici pazarında yaygınlaşmasını teşvik etmesi bekleniyor. Zhipu ayrıca “3A prensibi”ni (Tam Zamanlı, Kendi Kendine Çalışan Sıfır Müdahale, Tam Alan Bağlantısı) ortaya koydu ve Agent yeteneklerini daha fazla platforma genişleterek genel yapay zekaya doğru ilerlemeyi hızlandırmayı amaçlıyor. (Kaynak: 量子位)

GPT-5 Pro Matematik Araştırmalarında Çığır Açtı: OpenAI araştırmacısı Sebastien Bubeck, GPT-5 Pro’nun konveks optimizasyon problemlerinde bağımsız düşünme ve akıl yürütme yoluyla mevcut makalelerden daha kesin bir matematiksel sınır kanıtı sunduğunu açıkladı. OpenAI Başkanı Brockman bu başarıyı “yaşam belirtisi” olarak nitelendirdi. Model, internete bağlı olmadan ve hafızası olmadan, sadece bir konveks optimizasyon makalesi okuyarak, 17.5 dakikada bir sınırı 1/L’den 1.5/L’ye kadar hassaslaştırdı. İnsan yazarlar makaleyi güncelleyerek sınırı daha da kesinleştirmesine rağmen, GPT-5 Pro’nun kanıt yaklaşımı insanlardan bağımsızdı ve matematiksel yasaları bağımsız olarak keşfetme ve kanıtlama yeteneğini gösterdi. Bu, LLM’lerin genel yapay zekaya doğru önemli bir adım attığını işaret ediyor. (Kaynak: Sebastien Bubeck, Reddit r/artificial, Reddit r/ChatGPT)
Meta AI İşe Alımlarını Dondurdu, Sektörde Balon Endişeleri Arttı: Meta, “süper zeka laboratuvarı”ndaki AI çalışan alımını dondurduğunu duyurdu. Şirket daha önce 50’den fazla AI araştırmacısı ve mühendisini on milyonlarca dolar maaşla işe almıştı, ancak yüksek harcamalar ve yatırımcı baskısı stratejisini ayarlamasına neden oldu. Bu adım, piyasada AI sektöründe bir balon olabileceği endişelerini tetikledi. Ancak bazı görüşler, bunun bir AI balonunun patlaması değil, organizasyonel yapıda bir ayarlama olduğu yönünde; zira model eğitimi için çok sayıda çalışana değil, yetenekli ve uzman bir ekibe ihtiyaç duyulabileceği belirtiliyor. Bu karar, AI şirketlerinin teknolojik atılım arayışı ile maliyet kontrolü arasındaki dengeyi ve AI sektöründeki insan kaynakları maliyetleri ile ticari sürdürülebilirlik üzerine geniş çaplı tartışmaları yansıtıyor. (Kaynak: The Verge, Reddit r/ArtificialInteligence)

🎯 Gelişmeler
DeepSeek V3.1 Modelini Yayınladı, Agent Çağına Öncülük Ediyor: DeepSeek, V3.1 modelini resmi olarak yayınlayarak Agent çağına doğru ilerlediğini işaret etti. Bu model, “karma çıkarım” mimarisini benimsiyor, düşünme ve düşünmeme olmak üzere iki modu destekliyor ve bunlar arasında otonom olarak geçiş yapabiliyor. V3.1, özellikle Aider kodlama testinde Claude 4 Opus ve Gemini 2.5 Pro’yu geride bırakarak açık kaynak kodlama sıralamasında zirveye yerleşti ve programlama yeteneğinde üstün bir performans sergiledi. Model parametreleri 671B (aktif parametreler 37B), bağlam uzunluğu 128k’ya ulaşıyor ve eğitim sırasında uzun belge veri kümeleri genişletilerek toplam eğitim hacmi önemli ölçüde artırıldı. Ayrıca, DeepSeek V3.1 araç çağırma ve çok adımlı akıl yürütme yeteneklerini geliştirdi ve Anthropic API formatını destekleyerek Claude Code gibi çerçevelere kolay entegrasyon sağlıyor. (Kaynak: DeepSeek Blog, 量子位, huggingface, ArtificialAnlys, karminski3, teortaxesTex, scaling01, nrehiew_, reach_vb, iScienceLuvr, multimodalart, _akhaliq, zizhpan, ClementDelangue, fabianstelzer, QuixiAI)

ByteDance Seed-OSS Serisi Büyük Modellerini Açık Kaynak Yaptı: ByteDance Seed ekibi, 36 milyar parametreli Seed-OSS serisi büyük modeli Seed-OSS-36B’yi Apache-2.0 lisansı altında aniden açık kaynak yaptı. Bu model, yerel olarak 512K’lık ultra uzun bağlam penceresini destekliyor ki bu, ana akım modellerin dört katı ve ön eğitim aşamasında oluşturuldu. Seed-OSS, kullanıcıların modelin düşünme derinliğini kontrol etmelerine olanak tanıyan bir “düşünme bütçesi” mekanizması sunuyor. Çeşitli kıyaslama testlerinde, Seed-OSS-36B-Base, MMLU-Pro, BBH, GSM8K, MATH, HumanEval gibi testlerde açık kaynak modeller arasında rekor kırarak güçlü bilgi anlama, akıl yürütme ve kod yetenekleri sergiledi. (Kaynak: 量子位, ClementDelangue, reach_vb)

Google Pixel 10 Serisi AI Özelliklerini Derinlemesine Entegre Ediyor: Google’ın yeni piyasaya sürdüğü Pixel 10 serisi telefonlar, AI özelliklerini donanım ve sistem uygulamalarına derinlemesine entegre ediyor. Tüm yerleşik yazılımlar AI destekli hale getirildi; buna AI sağlık koçu ve AI fotoğraf/çekim rehberliği de dahil. AI özellikleri artık sadece aktif tetiklemeyle sınırlı değil, uygun senaryolarda otomatik olarak öneriler sunabiliyor ve birden fazla sistem APP’si arasında AI yeteneklerinin bağlantısını sağlıyor. Görüntü düzenleme, dijital yakınlaştırma detay tamamlama ve arama sırasında gerçek zamanlı çeviri gibi alanlarda çok sayıda uç model kullanılıyor. Ayrıca Google, Gemini çıkarım ortamının enerji ve su tüketiminin kamu beklentilerinin çok altında olduğunu ve verimliliğin sürekli arttığını belirten ayrıntılı bir teknik rapor yayınladı. (Kaynak: op7418, TheRundownAI, Google, dotey, demishassabis, algo_diver)
NASA ve IBM İşbirliğiyle Güneş Aktivitesini Çözümleyen AI Modeli Surya’yı Piyasaya Sürdü: NASA ve IBM işbirliği yaparak, güneş fiziği için ilk açık kaynak AI temel modeli olan Surya’yı Hugging Face’te yayınladı. 3.66 milyar parametreye sahip bu model, NASA’nın Güneş Dinamikleri Gözlemevi’nin 9 yıllık (yaklaşık 218TB) çoklu enstrüman verileri üzerinde ön eğitimden geçirildi. Altyapıyı korumak amacıyla uzay hava durumu hakkında erişilebilir ve doğru modellemelerle araştırmacılara yardımcı olmayı hedefleyen Surya, güneş fırtınası tahmin yöntemlerinde devrim yaratma potansiyeli taşıyor. (Kaynak: clefourrier)
Geely Galaxy M9 Sektörün İlk AI Kokpitini İlk Kez Sunuyor: Geely, yeni nesil AI kokpit işletim sistemi Flyme Auto 2’yi tanıttı ve bu sistemi Lynk & Co 10 EM-P ile Geely Galaxy M9’da ilk kez kullanacak. Geely’nin Xingrui AI büyük modeli, Jiyue Xingchen uçtan uca sesli büyük modeli ve akışkan bellek büyük modeline dayanan bu kokpit, yüksek algısal duygusal etkileşim ve güçlü eylem yeteneğine sahip süper insansı Agent Eva’yı sunuyor. Eva, kendi kendine karar verme, planlama ve görevleri yürütme yeteneğine sahip olup, tüm senaryolarda AI Agent çok fonksiyonlu uygulamaları destekleyerek “insan-araç-çevre” otonom işbirliğine dayalı akıllı bir alan yaratmayı hedefliyor. Geely ayrıca, uç çok modlu büyük modellere güç veren 200TOPS işlem gücüne sahip sektörün ilk AI Box’ını da tanıttı. (Kaynak: 量子位)

Unitree 180cm Boyunda, 31 Serbestlik Derecesine Sahip Bale İnsansı Robotunu Duyurdu: Unitree Robotics, dördüncü insansı robotu “Bale Dansçısı”nı piyasaya süreceğini duyurdu. 180cm boyunda, 31 serbestlik derecesine sahip ve ince, zarif bir duruşa sahip olan bu robotun, çeviklikte önceki nesilleri aşması ve fiziksel insansılaşmada çığır açması bekleniyor. Bu adım, Unitree’nin insansı robot ürün yelpazesini daha ince alanlara ayırarak “tam boyutlu + tam senaryo + tam fiyat aralığı” stratejik düzenini oluşturduğunu gösteriyor ve robot pazarındaki payını artırmayı hedefliyor. (Kaynak: 量子位)

Meta DINOv3 Evrensel Bilgisayar Görüşü Modelini Yayınladı: Meta, kendi kendine denetimli öğrenme ile eğitilmiş, olağanüstü yüksek çözünürlüklü görsel özellikler üretebilen genel, son teknoloji bilgisayar görüşü modeli DINOv3’ü yayınladı. Bu model, büyük miktarda manuel etiketli veri ihtiyacını ortadan kaldırarak bilgisayar görüşü alanındaki gelişmeleri daha da ileri taşıdı ve çeşitli uygulama senaryolarında daha uyarlanabilir ve genellenebilir hale geldi. (Kaynak: dl_weekly)
Cohere Command A Reasoning Modelini Yayınladı: Cohere, özellikle kurumsal çıkarım görevleri için tasarlanmış gelişmiş bir model olan Command A Reasoning’i tanıttı. Bu model, Agent ve çok dilli kıyaslama testlerinde kendi sınıfındaki diğer özel olarak dağıtılabilir modelleri geride bırakarak küresel işletmelere pratik değer sağlamayı hedefliyor. Cohere, matematiksel akıl yürütme yeteneğinin araç kullanımı, Agent veya çok dilli akıl yürütme ile doğrudan ilişkili olmadığını vurguladı ve bu nedenle gerçek dünya ihtiyaçlarını karşılamak için bu yeni modeli eğittiklerini ve kullanıcı geri bildirimleri için ağırlıklarını açık kaynak yaptıklarını belirtti. (Kaynak: aidangomez, nickfrosst)
Elon Musk’ın X Platformu Resimden Videoya AI Özelliğini Başlattı: Elon Musk, X platformunun yeni bir özellik sunacağını duyurdu: kullanıcılar herhangi bir resme uzun basarak yaklaşık 17 saniye içinde onu videoya dönüştürebilecek. Bu özellik, AI teknolojisini kullanarak kullanıcılara daha rahat ve yaratıcı içerik oluşturma deneyimi sunmayı, sosyal medya platformunun multimedya etkileşim biçimlerini daha da zenginleştirmeyi amaçlıyor. (Kaynak: qtnx_)
AI’nın İlaç Keşfi Alanındaki Uygulama Gelişmeleri: AI, ilaç keşfi alanında büyük bir potansiyel sergiliyor. Hugging Face’te sunulan GDP veri kümesi, DRUG-seq, Cell Painting, kimyasal pertürbasyon ve antikor tespiti gibi büyük ölçekli verileri bir araya getirerek çok modlu bilimsel araştırmalar için değerli bir kaynak sağlıyor. Bu veri kümelerinin açık kaynak olması, AI’nın ilaç geliştirmedeki uygulamalarını hızlandırma, yeni ilaç keşiflerini ve tedavi çözümlerini yenileme potansiyeli taşıyor. (Kaynak: ClementDelangue, clefourrier)
D-Robotics Hugging Face’te Robot Kontrol Algoritmasını Açık Kaynak Yaptı: D-Robotics, LeRobot ACT Policy bedensel AI algoritmasını Hugging Face’te açık kaynak yaptı ve bu algoritmayı RDK geliştirme kartında SO-101 açık kaynak robot kolunda başarıyla çalıştırdı. Bu algoritma, BPU’nun güçlü 128 TOPS işlem gücünü kullanarak robot kolunun sorunsuz bir şekilde nesneleri kavramasını ve düzenlemesini sağladı. Bu, uçtan uca hızlandırmanın robotik alanındaki uygulamasını gösteriyor ve açık kaynak robotik topluluğuna yeni teknik destek sağlıyor. (Kaynak: ClementDelangue)
NetEase Youdao AI Soru Cevap Kalemi Space X ve Ses/Video Çeviri Platformunu Yayınladı: NetEase Youdao, “Ziyue” eğitim büyük modeline dayalı yeni donanımı Youdao AI Soru Cevap Kalemi Space X’i piyasaya sürdü. Bu kalem, matematik, Çince, İngilizce gibi 9 ana ders için “kalemi tutar tutmaz tarama ve cevaplama” özelliğini destekliyor, %96’ya varan doğrulukla tahta tarzı video cevaplama ve AI yanlış soru defteri fonksiyonları sunuyor. Aynı zamanda Youdao, 38 dilde gerçek zamanlı karşılıklı çeviri, çok modlu orijinal ses çevirisi ve AI özet beyin haritası desteği sunan tek duraklı bir ses/video çeviri platformu da başlattı. Bu platform, yüksek işlem verimliliği ve düşük maliyet sunarak eğitim AI’sını L3’ten L4 sanal öğretmen aşamasına taşımayı hedefliyor. (Kaynak: 量子位)

Epic Games AI Sağlık Özelliklerini Hızla Piyasaya Sürüyor: 1979’da kurulan sağlık yazılım devi Epic Games, birçok yeni başlayan şirketi bile geride bırakarak yeni AI özelliklerini şaşırtıcı bir hızla piyasaya sürüyor. Bu durum, geleneksel sağlık IT şirketlerinin AI teknolojisini aktif olarak benimsediğini ve mevcut sistemlerine entegre ederek sağlık verimliliğini ve hasta deneyimini artırdığını gösteriyor. Bu da AI’nın sağlık alanında hızla yaygınlaşacağının bir işareti. (Kaynak: sarahcat21)
Kimi-VL-A3B-Thinking-2506-GGUF Modeli Yayınlandı: Kimi-VL-A3B-Thinking-2506-GGUF modeli artık yayınlandı. Bu model, llama.cpp’de destekleniyor ve yerel LLaMA topluluğuna çok modlu görsel dil modelleri için daha fazla seçenek sunuyor. Kullanıcılar, Kimi modelinin pohpohlamadan kaçınma ve doğrudanlık özelliklerini takdir ediyor ve görsel dil görevlerindeki performansını merakla bekliyor. (Kaynak: Reddit r/LocalLLaMA)

GAIA: Transformer’dan Daha Hızlı Evrensel Bir AI Mimarisi: GAIA (General Artificial Intelligence Architecture), Transformer’a alternatif olarak önerildi. Karma çerçeve ve π odaklı bölümleme düzenlemesini temel alan GAIA, zaman alıcı self-attention mekanizmasını ve karmaşık tokenizer’ları ortadan kaldırıyor. Hafif ve genel olan GAIA, CPU’da saniyeler içinde eğitilebiliyor ve standart metin sınıflandırma veri kümelerinde rekabetçi performans sergiliyor. Bu, büyük ölçekli AI modellerinin verimli bir şekilde dağıtılması için yeni bir yaklaşım sunuyor, özellikle uç cihazlar ve kaynak kısıtlı ortamlar için uygun. (Kaynak: Reddit r/deeplearning)

🧰 Araçlar
Firecrawl: AI için Web Veri API’si: Firecrawl, AI uygulamaları için temiz web verileri sağlamayı amaçlayan bir Web veri API’sidir. Tüm web sitesi içeriğini LLM’lerin kullanabileceği Markdown veya yapılandırılmış verilere dönüştürebiliyor, gelişmiş tarama, gezinti ve veri çıkarma özelliklerini destekliyor. Firecrawl, API, SDK’lar (Python, Node) ve LLM çerçeve entegrasyonları (Langchain, Llama Index vb.) sunuyor. Ayrıca dinamik içerik işleme, anti-crawl mekanizmaları, medya ayrıştırma ve toplu işlem gibi güçlü yeteneklere sahip olmasının yanı sıra AI tabanlı yapılandırılmış veri çıkarma ve sayfa etkileşimi özellikleri de sağlıyor. (Kaynak: GitHub Trending)

Perplexity Finance Hindistan Hisse Senedi Filtreleme Özelliğini Başlattı: Perplexity Finance, tüm kullanıcılara Hindistan hisse senedi filtreleme özelliğini açtı. Bu özellik, doğal dil kullanarak arama ve filtrelemeyi destekliyor. Kullanıcılar, istedikleri çıktıyı, filtreleme koşullarını ve sıralama yöntemini girerek hisse senedi bilgilerini alabiliyor, bu da Hindistan borsasındaki sorgulama ve analiz sürecini büyük ölçüde basitleştiriyor. Amaç, Hindistanlı yatırımcılara ücretsiz ve kullanışlı hisse senedi filtreleme hizmeti sunmak. (Kaynak: AravSrinivas)

Replit Alan Adı Kayıt Sürecini Basitleştirerek “Vibe Coding” Deneyimini Geliştiriyor: Replit, dünyanın en basit alan adı kayıt sürecini oluşturarak, alan adlarını web sitelerine 60 saniye içinde otomatik olarak bağlamayı başardı ve kullanıcı deneyimini büyük ölçüde geliştirdi. Bu “kalın kapsülleme” yeniliği, “Vibe Coding” (atmosferik kodlama) vizyonunu daha da yaklaştırarak geliştiricilerin yaratmaya odaklanmasını ve sıkıcı yapılandırma işlerini azaltmasını sağlıyor. Bu, AI destekli kodlama araçlarının geliştirme verimliliğini ve keyfini artırma potansiyelini gösteriyor. (Kaynak: pirroh, amasad)

AI Agent Yapılandırma Dosyası Standartları ve Uygulama Analizi: OpenAI, Claude ve Gemini, AI Agent’ların davranışlarını ve etkileşimlerini standartlaştırmayı amaçlayan kendi Agent yapılandırma dosyası standartlarını (agents.md, CLAUDE.md, GEMINI.md) yayınladı. agents.md, üreticiler arası davranış kısıtlamalarını ve doğrulama süreçlerini birleştirmeye eğilimliyken, CLAUDE.md ve GEMINI.md, üretici içi bağlam istemleri, talimat hafızası ve davranış tercihleri üzerine daha fazla odaklanıyor. Bu dosyalar, yükleme mekanizmaları, yürütme semantiği ve güvenlik modellerinde farklılıklar gösteriyor, bu da standart birliği ile kullanıcı deneyimi esnekliği arasındaki dengeyi yansıtıyor. Bu yapılandırma dosyalarının sınırlarını ve önceliklerini anlamak, güvenilir ve kontrol edilebilir AI Agent’lar oluşturmak için çok önemli. (Kaynak: dotey)
LangChain AI Agent IPO İzahname Analizine Yardımcı Oluyor: LangChain tabanlı bir AI Agent projesi başarıyla geliştirildi. Bu proje, karmaşık IPO izahnamelerini (DRHP) analiz edebiliyor ve bunları sıradan insanların anlayabileceği kapsamlı raporlara dönüştürebiliyor. Proje, çok adımlı süreçleri otomatikleştirerek harici veri kaynaklarını LLM’lere bağlıyor ve finansal analistlerin zamanından büyük ölçüde tasarruf sağlıyor. Bu, AI Agent’ların karmaşık iş süreçlerini otomatikleştirmede ve profesyonel içgörüler sağlamadaki büyük potansiyelini gösteriyor ve geleneksel LLM’lerin tekli diyalog fonksiyonlarının ötesine geçiyor. (Kaynak: hwchase17, Hacubu)
Qwen Image Edit ve WaveSpeedAI İşbirliğiyle Verimli Görüntü Düzenleme Sunuyor: Alibaba’nın Qwen Image Edit modeli, WaveSpeedAI ile işbirliği yaparak hızlı, yüksek kaliteli AI görüntü düzenleme hizmetleri sunuyor. Kullanıcılar, WaveSpeedAI platformu aracılığıyla Qwen Image Edit’i kullanarak sorunsuz, profesyonel düzeyde görüntü düzenlemeleri yapabiliyor. Ayrıca, Qwen Image Edit, LoRA teknolojisiyle birleşerek 8 ila 4 adımda yüksek kaliteli düzenlemeleri tamamlayabiliyor, hızı 12 kat artırıyor ve illüstrasyonları gerçekçi figürlere dönüştürmek için kullanılabiliyor. Bu, AI görüntü düzenlemenin uygulama senaryolarını ve verimliliğini büyük ölçüde genişletiyor. (Kaynak: Alibaba_Qwen, huggingface, suchenzang, fabianstelzer)
VS Code/Cursor Uzantısı IDE İçinde Görüntü Etiketleme ve Pseudo-Label Oluşturma Sağlıyor: Geliştiriciler kısa sürede bir VS Code/Cursor uzantısı oluşturdu. Bu uzantı, kullanıcıların doğrudan IDE içinde sınıflandırma ve nesne tespiti için görüntü etiketlemesi yapmasına ve FAL API aracılığıyla pseudo-label’lar oluşturmasına olanak tanıyor. Moondreamai v2’yi nesne tespiti için kullanan bu araç, AI geliştirmedeki veri etiketleme sürecini basitleştirmeyi ve hızlandırmayı, mevcut etiketleme araçlarının karmaşık yapılandırma ve düşük verimlilik sorunlarını çözmeyi ve geliştiricilerin “Vibe Coding” deneyimini iyileştirmeyi amaçlıyor. (Kaynak: cloneofsimo)

Runway Game Worlds Beta’yı Başlattı, Gerçek Zamanlı Sanal Dünya Oluşturmayı Keşfediyor: Runway, gerçek zamanlı sanal dünya oluşturma olasılığını keşfetmek amacıyla Game Worlds Beta’yı başlattı. Bu proje, kullanıcıların herhangi bir karakteri, hikayeyi veya dünyayı gerçek zamanlı olarak keşfetmelerini sağlamayı hedefliyor ve AI teknolojisi aracılığıyla sanal ortamın piksellerini oluşturuyor. Bu, AI’nın oyun geliştirme ve sanal gerçeklik alanında önemli bir ilerlemeyi temsil ediyor ve gelecekteki içerik oluşturmanın daha dinamik ve etkileşimli olacağını, yaratıcılara eşi benzeri görülmemiş bir özgürlük sunacağını müjdeliyor. (Kaynak: c_valenzuelab)
TimeCapsule-SLM: Tarayıcı İçinde Çalışan Açık Kaynak Derin Araştırma Aracı: TimeCapsule-SLM, tarayıcı içinde çalışan açık kaynaklı bir derin araştırma aracıdır ve Qwen 3 0.6b (ollama) ile birleşerek anlamsal anlama, içgörü üretimi ve yenilikçi fikirler sunar. Bu araç, gizliliğe önem veriyor ve sonuçları kesin metin bloklarına/belgelerine kadar izleyerek AI ürünlerinin bağlam anlama eksikliği, halüsinasyonlar ve kaynak takibi zorluğu sorunlarını çözüyor. Düzenli ifadeleri ve düz dosya aramayı, ayrıca bilgi tabanlarında anlamsal aramayı destekleyerek kullanıcıların yerelleştirilmiş derin araştırmalar yapmasına yardımcı olmayı amaçlıyor. (Kaynak: tokenbender)
Matrix-3D: SkyworkAI Tek Resim/Metinden 3D Dünya Oluşturmayı Başardı: SkyworkAI, tek bir görüntüden veya metin isteminden eksiksiz 3D dünyalar oluşturabilen Matrix-3D modelini yayınladı. Bu çığır açan teknoloji, 3D içerik oluşturma sürecini büyük ölçüde basitleştirecek, oyun geliştirme, sanal gerçeklik, mimari tasarım gibi alanlara verimli ve yaratıcı çözümler sunacak ve AI’nın üç boyutlu içerik oluşturmada yeni bir dönüm noktasına ilerlediğini gösteriyor. (Kaynak: NerdyRodent)
Kling_ai 2.1 Keyframe-Endframes: Video Oluşturma Kontrolünü Artırıyor: Kling_ai, 2.1 Keyframe-Endframes özelliğini yayınlayarak kullanıcılara AI video oluşturma iş akışında daha fazla kontrol ve ifade gücü sağladı. Anahtar kareler ve bitiş kareleri ayarlayarak, kullanıcılar video içeriğinin geçişlerini ve stilini daha hassas bir şekilde kontrol edebiliyor, özellikle anlatısal videoların oluşturulması için uygun. Bu, film yapımı, reklamcılık ve içerik pazarlaması gibi alanlarda yeni olanaklar sunma potansiyeli taşıyor. (Kaynak: Kling_ai)
Glif Agent Düşük Maliyetli AI Video Üretimi Sağlıyor: Glif platformu, özel Agent’ları aracılığıyla Qwen Ultra Realism görüntü oluşturma, OmniHuman LipSync, Seedance Pro, Flux Kontext Edit, ElevenLabs ses gibi çeşitli AI araçlarını entegre ederek verimli ve düşük maliyetli AI video üretimi sağlıyor. 30 saniyelik tutarlı bir videonun maliyeti 2 doların altına düşürülebiliyor, bu da video oluşturma eşiğini büyük ölçüde düşürüyor. Platform, tek duraklı bir AI video üretim çözümü olmayı hedefliyor, ancak farklı model çıktı en boy oranları ve geçiş akıcılığı gibi zorluklarla hala karşı karşıya. (Kaynak: fabianstelzer)
SynthesiaIO AI Seslendirmeli Videolar İçin Güvenli Düzenleme Özelliğini Başlattı: SynthesiaIO, “güvenli düzenleme” özelliğini başlattı. Bu özellik, kullanıcıların AI seslendirmeli videolarda çevirileri ayarlamasına, hataları düzeltmesine ve ince ayrıntıları yakalamasına olanak tanırken, yerleşik içerik denetim mekanizmaları aracılığıyla orijinal bilginin ve tonun bütünlüğünü sağlıyor. Bu özellik, AI seslendirmeli videoların esnekliğini ve doğruluğunu artırıyor, özellikle çok dilli içerik oluşturma için uygun olup, içeriğin kalitesini ve güvenliğini garanti ediyor. (Kaynak: synthesiaIO)
AI Video Oluşturma Araçları Karşılaştırması: Argil, Hedra Labs, HeyGen: Argil, Hedra Labs ve HeyGen gibi AI video oluşturma araçları, tek bir resimden konuşan insan videoları oluşturmayı vaat ediyor. Kullanıcılar, hangi modelin en iyi performansı gösterdiğini belirlemek için bu araçları karşılaştırmalı olarak değerlendirdi. Bu tür araçların ortaya çıkışı, video üretim sürecini büyük ölçüde basitleştirerek senaryo, oyuncu ve kamera ekibi ihtiyacını azaltıyor. Ancak aynı zamanda içerik yaratıcılarının AI kullanımını izleyicilere bildirmesi gerekip gerekmediği konusunda etik tartışmaları da beraberinde getiriyor. (Kaynak: BrivaelLp)

AI Toolkit ARAs Entegrasyonu ile Wan 2.2 Modelini Optimize Ediyor: AI Toolkit, 4-bit Wan 2.2 14B T2V (metinden videoya) ve I2V (görüntüden videoya) modellerini optimize etmek için Accuracy Recovery Adapters (ARAs) entegre etti. Bu teknoloji, sınırlı VRAM’e sahip cihazlarda (4090 ekran kartı gibi) büyük ölçekli modellerin çalıştırılmasını mümkün kılıyor; örneğin, 19.2 GB VRAM altında 16 boyutlu I2V LoRA eğitilirken yüksek kaliteli çıktıyı koruyor. Bu, AI video oluşturma modellerinin uç cihazlardaki dağıtım verimliliğini artırıyor. (Kaynak: ostrisai)
VS Code Telerik & KendoUI AI Kodlama Asistanını Entegre Ediyor: VS Code Live, Telerik ve KendoUI’nin AI kodlama asistanlarının geliştirme deneyimini nasıl basitleştirdiğini gösterdi. Bu AI asistanları, geliştiricilerin kod yazımını otomatikleştirmesine ve akıllı öneriler sunmasına yardımcı olarak geliştirme verimliliğini ve kod kalitesini artırıyor. Bu, AI’nın entegre geliştirme ortamlarında (IDE) giderek yaygınlaşmasını ve yazılım geliştirme süreçleri üzerindeki derin etkisini gösteriyor. (Kaynak: code)
ChatExcel Milyonlarca Dolarlık Tohum Yatırım Aldı: Pekin Üniversitesi ekibi tarafından geliştirilen ChatExcel, Shanghai Changlie Capital ve Wuhan Donghu Angel Fund’dan yaklaşık on milyon RMB’lik tohum yatırımını tamamladığını duyurdu. ChatExcel, Çin’in ilk üretken AI Excel ve veri analizi Agent’ıdır. Sohbet yoluyla Excel tablolarını işleyebilir, veri işleme, hesaplama, analiz ve grafik oluşturmayı kapsar, ayrıca kurumsal veritabanlarıyla diyalog kurmayı ve ağ verilerini almayı destekler. Bu turdaki fonlar, ürün Ar-Ge yinelemesini ve küresel pazar tanıtımını hızlandırmak için kullanılacak ve veri Agent’ı alanındaki lider konumunu pekiştirmeyi hedefliyor. (Kaynak: 量子位)

Nano Banana: İllüstrasyonları Figürlere Dönüştüren AI Görüntü Modeli: Nano Banana, illüstrasyonları gerçekçi figür efektlerine dönüştürme yeteneğiyle öne çıkan popüler bir AI görüntü modelidir. Modelin ürettiği görüntülerde neredeyse hiç “AI hissi” yoktur, dokusu iyi ve özellikleri yüksek oranda korunmuştur, bu nedenle AI dışındaki yaratıcılar tarafından yaygın olarak kullanılmakta ve yayılmaktadır. Nano Banana, metinden görüntü oluşturmayı, yerel görüntü düzenlemeyi ve stil aktarımını destekler. Ayrıca ultra hızlı işlem hızı (genellikle 10 saniyeden kısa sürede tamamlanır) ve düzenleme öğeleri için tutarlı bellek özelliğiyle bilinir. (Kaynak: dotey, yupp_ai)
yupp.ai: AI Araç Kullanım Deneyimini Basitleştiriyor: yupp.ai platformu, kullanıcıların AI araçlarını kullanma deneyimini basitleştirmeyi amaçlıyor. Çeşitli modelleri ve işlevleri entegre ederek, kullanıcıların birden fazla abonelik ödemesine, farklı uygulamalar arasında geçiş yapmasına veya model seçimi konusunda kararsız kalmasına gerek kalmamasını sağlıyor. Platform, tek duraklı bir AI çözümü sunarak kullanıcıların AI teknolojisini daha kolay ve verimli kullanmasını sağlamayı, AI araçlarının başlangıç eşiğini düşürmeyi hedefliyor. (Kaynak: yupp_ai)
OpenAI Codex CLI Model Seçimini Destekliyor: OpenAI Codex CLI v0.23.0 sürüm güncellemesi, kullanıcıların gpt-5 high
gibi modelleri seçmesini destekliyor. Bu, geliştiricilerin görev ihtiyaçlarına göre en uygun modeli daha esnek bir şekilde seçmesine, programlama ve düşünme verimliliğini optimize etmesine olanak tanıyor. Bu özellik, Codex’in bir AI programlama asistanı olarak pratikliğini artırıyor ve kullanıcıların kendi tercihleri ve proje gereksinimlerine göre ince ayar yapmasına izin veriyor. (Kaynak: dotey)
DeepSeek API Claude Code ile Uyumlu: DeepSeek API artık Anthropic API formatını destekliyor ve geliştiricilerin DeepSeek V3.1’in yeteneklerini Claude Code çerçevesine kolayca entegre etmelerine olanak tanıyor. Basit bir ortam değişkeni yapılandırmasıyla, kullanıcılar Claude Code’da DeepSeek modelini kullanarak daha esnek Agentic iş akışları gerçekleştirebiliyor. Bu uyumluluk güncellemesi, geliştiricilere daha fazla model seçeneği sunuyor ve AI programlama ile Agentic görevlerin verimliliğini artırmaya yardımcı oluyor. (Kaynak: jon_durbin, dotey, Reddit r/LocalLLaMA, Reddit r/ClaudeAI)

OpenWebUI’da Kod Yorumlayıcısı Görüntü Görüntüleme Sorunu: OpenWebUI kullanıcıları, kod yorumlayıcısını kullanırken görüntülerin doğrudan gösterilmek yerine alıntı metni olarak görüntülendiğini bildirdi. Kod yürütücü modu aracılığıyla normal şekilde görüntülenebilse de, kullanıcılar bunun güvenlik önlemleri veya LLM’nin görüntü düğümlerini yankılama şekliyle ilgili olduğundan şüpheleniyor. Bu sorun, kullanıcıların OpenWebUI’da kod yorumlayıcısı tarafından oluşturulan görüntüleri sezgisel olarak görüntüleme deneyimini etkiliyor ve iyileştirmek için daha fazla teknik optimizasyon gerektiriyor. (Kaynak: Reddit r/OpenWebUI)
ChatGPT 5 Pro ve Cursor AI’ın Programlama Alanındaki Karşılaştırması: Sosyal medyada ChatGPT 5 Pro ve Cursor AI’ın programlama (özellikle Python, makine öğrenimi, derin öğrenme, sinir ağları vb. alanlarda) açısından hangisinin daha iyi olduğuna dair tartışmalar ortaya çıktı. Kullanıcılar, bu iki AI programlama aracının farklı teknoloji yığınlarındaki performansını değerlendirmek için gerçek kullanım deneyimi geri bildirimleri arıyor. Bu, geliştiricilerin AI destekli programlama araçlarını seçerken modelin profesyonel yeteneklerine ve gerçek etkisine verdikleri önemi yansıtıyor. (Kaynak: Reddit r/deeplearning)

ChatGPT Görüntü Oluşturma Özelliği Kullanıcı Resimlerini Çizgi Film Tarzına Dönüştürüyor: ChatGPT, kullanıcıların yüklediği resimleri çizgi film tarzına dönüştürebilen yeni bir özellik ekledi. Kullanıcılar, kendi fotoğraflarını çizgi filmleştirmelerinin sonuçlarını paylaştı ve sonuçlar tatmin ediciydi. Bazıları “hayal gücü” olup olmadığını sorgulasa da, bu özellik kullanıcılara uygun bir görüntü stil dönüştürme hizmeti sunuyor, AI’nın yaratıcı içerik oluşturma alanındaki uygulamalarını zenginleştiriyor ve kullanıcılara yeni bir etkileşim deneyimi sunuyor. (Kaynak: Reddit r/ChatGPT)
📚 Öğrenme
AI Değerlendirme Kursu: Slogandan Yönteme: “AI Evals for Engineers & PMs” kursu, “verileri incele” sloganını somut yöntemlere dönüştürdüğü için şiddetle tavsiye ediliyor. Kurs, etkileşim izlerini derinlemesine incelemeyi, hata sınıflandırmaları oluşturmayı, otomatik değerlendirmeleri titizlikle ayarlamayı ve istemleri ile işlem hatlarını optimize etmeyi vurguluyor. Bu, mühendisler ve ürün yöneticileri için sistematik AI değerlendirme uygulama rehberliği sağlayarak AI projelerini prototipten üretime taşımalarına yardımcı oluyor. (Kaynak: gojira, lateinteraction, HamelHusain)
AI Risk Uzmanları ve Süper Tahmincilerin AI Hızlanması Üzerine Pilot Çalışması: METR ve Research_FRI, AI risk uzmanları ve süper tahmincilerin AI’nın aşırı hızlanmaya yol açabileceği beklentilerini araştıran küçük bir pilot çalışma yürüttü. Örneklem boyutu küçük ve önyargılı olmasına rağmen, çalışmanın operasyonel yöntemi değerli bulundu ve AI gelişim hızı ile potansiyel riskleri anlamak için ön veriler ve tartışma zemini sağladı. (Kaynak: tokenbender)
AI Araştırma Makalesi: Transformer Dil Modellerinde Kelime Anlamı: Bir araştırma makalesi, Transformer dil modellerinde kelime anlamının nasıl depolandığını inceledi. Araştırma, Transformer modellerinin kelime anlamını sadece bağlamdan oluşturmak yerine statik gömme yoluyla depoladığını gösteriyor. RoBERTa-base token gömmelerinin kümeleme analiziyle, meslekler, yerler, duygular gibi net anlamsal temaların varlığı ve bunların psikolinguistik özelliklerle (valans, somutluk gibi) yüksek korelasyonu bulundu. Bu, “anlamın sadece daha sonra üretildiği” görüşüne meydan okuyor ve statik gömmelerin aşağı akış işlemeyi yönlendiren bir kelime hazinesi gibi davrandığını belirtiyor. (Kaynak: menhguin)
AI Araştırma Makalesi: Çift Tercih Optimizasyonu (DuPO) ile LLM Kendi Kendini Doğrulama: DuPO (Dual Learning-based Preference Optimization), etiketlenmemiş geri bildirim oluşturmak için genelleştirilmiş ikiliği kullanan, ikili öğrenmeye dayalı bir tercih optimizasyon çerçevesidir. Bu, RLVR’nin pahalı etiketlere bağımlılığını ve geleneksel ikili öğrenmenin katı kısıtlamalarını çözer. DuPO, orijinal görevi bilinen ve bilinmeyen kısımlara ayırır, bilinmeyen kısmı yeniden yapılandırmak için ikili bir görev oluşturur ve yeniden yapılandırma kalitesini kendi kendine denetimli bir ödül olarak kullanır. Bu yöntem, çeviri, matematiksel akıl yürütme gibi görevlerde önemli gelişmeler sağlamış ve LLM optimizasyonu için ölçeklenebilir, genel ve etiket gerektirmeyen yeni bir paradigma sunmuştur. (Kaynak: HuggingFace Daily Papers, teortaxesTex)
AI Araştırma Makalesi: Çok Dilli, Beceri Tabanlı Sağduyu Akıl Yürütme Kıyaslaması mSCoRe: mSCoRe (Multilingual and Scalable Benchmark for Skill-based Commonsense Reasoning), LLM’lerin sağduyu akıl yürütme yeteneklerini sistematik olarak değerlendirmeyi amaçlayan çok dilli, ölçeklenebilir bir kıyaslamadır. Bu kıyaslama, yeni bir akıl yürütme becerisi taksonomisi, sağlam bir veri sentezi boru hattı ve karmaşıklık genişletme çerçevesi içerir. Deneyler, mSCoRe’nin mevcut LLM’ler için hala zorlayıcı olduğunu, özellikle daha yüksek karmaşıklık seviyelerinde ve ince çok dilli genel ve kültürel sağduyu açısından modellerin bu alanlardaki sınırlamalarını ortaya koyduğunu göstermiştir. (Kaynak: HuggingFace Daily Papers)
AI Araştırma Makalesi: SFT ve RL’yi Birleştiren CHORD Çerçevesi: CHORD (Controllable Harmonization of On- and Off-Policy Reinforcement Learning via Dynamic Weighting) çerçevesi, SFT (denetimli ince ayar) ve RL’yi (pekiştirmeli öğrenme) birleştirmek için yeni bir bakış açısı sunuyor. CHORD, SFT’yi RL sürecinde dinamik ağırlıklı yardımcı bir hedef olarak ele alıyor. Küresel bir katsayı ve kelime bazında ağırlıklandırma fonksiyonu aracılığıyla, politika dışı uzman verilerinin etkisi üzerinde ikili kontrol sağlayarak politika dışı taklit ve politika içi keşif arasında etkili bir denge kurar, böylece istikrarlı ve verimli bir öğrenme süreci elde eder ve LLM performansını önemli ölçüde artırır. (Kaynak: HuggingFace Daily Papers)
AI Araştırma Makalesi: LLM Kıyaslaması MCP-Universe: MCP-Universe, LLM’lerin gerçek dünya Model Context Protocol (MCP) sunucu etkileşimlerindeki performansını kapsamlı bir şekilde değerlendiren ilk kıyaslamadır. Bu kıyaslama, konum navigasyonu, depo yönetimi, finansal analiz, 3D tasarım, tarayıcı otomasyonu ve web araması gibi 6 temel alanı kapsar ve sıkı bir değerlendirme sağlamak için yürütülebilir değerlendiriciler (format, statik, dinamik) kullanır. Testler, SOTA modellerinin (GPT-5 gibi) bile uzun dizi akıl yürütmede ve yabancı araç alanlarında hala önemli performans sınırlamalarına sahip olduğunu ve kurumsal düzeydeki Agent’ların yetersiz performans gösterdiğini ortaya koymuştur. (Kaynak: HuggingFace Daily Papers)
AI Araştırma Makalesi: Vietnam Çok Modlu Sınavlarında VLM Performansı: ViExam, düşük kaynaklı dillerde ve gerçek çok modlu eğitim içeriğinde VLM performansını değerlendiren Vietnam çok modlu sınav sorularına yönelik bir kıyaslamadır. Araştırma, SOTA VLM’lerin bile Vietnamca çok modlu sınavlarda ortalama %57.74 doğruluk oranına sahip olduğunu, çoğu modelin insan ortalamasının altında performans gösterdiğini ve sadece düşünen VLM o3’ün (%74.07) insan ortalamasını aştığını, ancak insan en iyi performansının çok altında kaldığını bulmuştur. Diller arası istemler performansı artırmamış ve insan-makine işbirliği VLM performansını kısmen artırabilmiştir. (Kaynak: HuggingFace Daily Papers)
AI Araştırma Makalesi: Difüzyon LLM’lerinin Eğitim Sonrası Nicelemesi Üzerine Araştırma: Bir araştırma, difüzyon büyük dil modellerinin (dLLM) eğitim sonrası nicelemesini (PTQ) ilk kez sistematik olarak inceledi. Araştırma, dLLM’lerde aktivasyon aykırı değerlerinin varlığını ve bunun düşük bit niceleme için bir zorluk teşkil ettiğini buldu. Mevcut PTQ yöntemlerinin kapsamlı bir değerlendirmesiyle, bit genişliği, niceleme yöntemi, görev kategorisi ve model tipinin dLLM niceleme davranışı üzerindeki etkileri analiz edildi ve dLLM’lerin verimli dağıtımı için pratik içgörüler sağlandı. (Kaynak: HuggingFace Daily Papers)
AI Araştırma Makalesi: Finansal Büyük Dil Modellerinin Bilişsel Teşhis Çerçevesi: FinCDM, finansal LLM’ler için özel olarak tasarlanmış ilk bilişsel teşhis değerlendirme çerçevesidir. Bilgi-beceri düzeyinde değerlendirme yoluyla, modelin finansal beceri ve bilgi alanlarındaki güçlü ve zayıf yönlerini belirler. Bu çerçeve, gerçek muhasebe ve finansal becerileri kapsayan CPA-QKA veri kümesini oluşturmuştur ve daha güvenilir ve hedefe yönelik model geliştirmeyi desteklemek için açıklanabilir, beceriye duyarlı teşhis sağlamayı amaçlamaktadır. (Kaynak: HuggingFace Daily Papers)
2025 Teknoloji Değişimciler Konferansı Bedensel Zekaya Odaklanıyor: 2025 Teknoloji Değişimciler Konferansı, “Bedensel Zeka, Endüstriyel Dönüşümün Yeni Motoru” temasıyla 5 Eylül’de Pekin’de düzenlenecek. Konferans, bilim insanlarını, girişimci liderleri, endüstri uzmanlarını ve yatırımcıları bir araya getirerek donanım teknolojisinin sanayileşmesine odaklanacak ve “talep odaklı-teknoloji eşleştirme-sermaye desteği-senaryo uygulaması” tam zincir hizmet modelini oluşturmayı hedefliyor. Amaç, bedensel zeka gibi ileri teknolojilerin teknikten ürüne “son mil” sorununu çözmek ve gerçek senaryolarda doğrulanmasını ve ölçekli uygulamasını teşvik etmektir. (Kaynak: 量子位)

AI Agent Katmanlı Mimari Diyagramı: Ronald van Loon, LLM, üretken AI ve makine öğreniminde Agent tasarımını anlamak için net bir görsel rehber sağlayan AI Agent’ın katmanlı mimari diyagramını paylaştı. Bu diyagram, geliştiricilerin ve araştırmacıların karmaşık AI Agent sistemlerini daha iyi inşa etmelerine ve yönetmelerine, işlevlerini ve performanslarını optimize etmelerine yardımcı oluyor. (Kaynak: Ronald_vanLoon)
ML Araştırmacılarının Endüstriden Akademiye Geçiş Rehberi: ML endüstrisinde 5-6 yıl çalışmış bir mühendis, üniversitede araştırma mühendisi olarak göreve başlayacak ve akademik araştırmaya nasıl uyum sağlayacağı konusunda tavsiye arıyor. Tartışma, matematiksel temellerin, bilimsel makale okuma yöntemlerinin önemini ve endüstri deneyiminin akademik araştırmaya nasıl dönüştürülebileceğini vurguladı. Bu, endüstriden akademik ML araştırmasına geçmek isteyenlere pratik rehberlik ve zihniyet ayarlama tavsiyeleri sunuyor. (Kaynak: Reddit r/MachineLearning)
AI Arama Motorlarının Tersine Mühendisliği: İçeriği AI Tarafından Alıntılanacak Şekilde Nasıl Optimize Ederiz: ChatGPT Search, Perplexity, Google AI Overviews gibi AI arama motorları üzerine yapılan bir tersine mühendislik çalışması, geleneksel SEO metriklerinin AI yanıt alıntılarıyla zayıf bir korelasyona sahip olduğunu buldu. AI alıntılarının anahtarı, içeriğin AI sentez gereksinimlerine uygun olup olmadığıdır; örneğin, H2/H3 bölümlerinin bağımsız yanıt birimleri olarak kullanılması, anahtar veri noktalarının bağımsız olarak sunulması, çok kaynaklı uyumluluk ve açık yazar kimlik bilgileri/zaman damgaları. Bu, “Yanıt Motoru Optimizasyonu” (AEO) ile geleneksel SEO arasındaki temel farkı ortaya koyuyor; yani AI arama motorları içeriğin yapısal ve otorite yönlerine daha fazla odaklanıyor. (Kaynak: Reddit r/ArtificialInteligence)
Makine Öğreniminde “Eğitim Cehenneminden” Kaçış Yolu: Birçok kişi makine öğrenimi öğrenme sürecinde “eğitim cehennemine” düşüyor; yani sürekli eğitimleri öğreniyor ancak gerçek anlama ve proje oluşturma yeteneğinden yoksun kalıyor. Yorumlar, eğitimlerin genellikle aşırı basitleştirildiğini ve derinlikten yoksun olduğunu, gerçek öğrenmenin ise sorunları parçalara ayırma, projeler üzerinde çalışma ve resmi belgelere başvurma yoluyla gerçekleştiğini belirtiyor. Ayrıca, makine öğrenimi alanında rekabetin yoğun olduğu ve sadece eğitimlerle öne çıkmanın zor olduğu, daha derin teorik öğrenme ve pratik deneyim gerektiği vurgulanıyor. (Kaynak: Reddit r/deeplearning)
Living AI Evolution Algorithms (LAI) Çerçevesi: LAI (Living Artificial Intelligence Evolution Algorithms), çok duyusal bilişi gerçekleştirmeyi amaçlayan devrim niteliğinde bir çerçevedir. Bu çerçeve, AI’nın biyolojik varlıklar gibi evrimleşmesini, farklı duyusal modalitelerden gelen bilgileri sürekli öğrenme ve uyum sağlama yoluyla işlemesini hedefleyerek daha yüksek düzeyde zeka elde etmeyi amaçlar. Bu, AI araştırmasında bedensel zeka ve yaşam benzeri sistemler yönündeki keşifleri temsil ediyor ve daha genel, daha esnek AI sistemleri oluşturmak için yeni bir teorik temel sağlama potansiyeli taşıyor. (Kaynak: Reddit r/deeplearning)

Hugging Face NVIDIA Nemotron Çok Dilli Çıkarım Veri Kümesini Yayınladı: NVIDIA AI Developer, Hugging Face’te NVIDIA Nemotron eğitim sonrası çok dilli veri kümesini yayınladı. Bu veri kümesi, sentetik olarak çevrilmiş çıkarım yörüngeleri ekleyerek lisanslı eğitim sonrası veri kümelerini genişletti, beş yeni dili kapsıyor ve dünya standartlarında çıkarım yörüngeleri sunuyor. Bu, çok dilli LLM’lerin geliştirilmesi ve eğitimi için değerli bir kaynak sağlıyor ve modellerin farklı dil ortamlarındaki çıkarım yeteneklerini geliştirmeye yardımcı oluyor. (Kaynak: ClementDelangue)
DSPy Topluluğu Gelişmiş DSPy Teknikleri ve Bağlam Mühendisliği Paylaştı: DSPy topluluğu, gelişmiş DSPy teknikleri, bağlam mühendisliği, optimizasyon ve değerlendirme üzerine bir çalıştay düzenledi. Etkinlikte DSPy felsefesi tartışıldı ve özel adaptörler ile Predict modülünü optimize etme yöntemleri gösterildi. Bu, DSPy’nin güvenilir AI Agent’lar oluşturmadaki pratikliğini ve topluluğun AI geliştirme uygulamalarını ilerletmedeki aktifliğini gösteriyor. (Kaynak: lateinteraction)
“Generative AI with LangChain” Kitabı Yayınlandı: Packt yayınevi, LangChain kurucusu tarafından tavsiye edilen yeni kitabı “Generative AI with LangChain”i yayınladı. Kitap, geliştiricilerin AI projelerini prototipten üretime taşımalarına yardımcı olmayı amaçlıyor ve çoklu Agent mimarileri, gelişmiş RAG, test, gözlemlenebilirlik ve dağıtım gibi pratik stratejileri kapsıyor. Kitap ayrıca Gemini, Anthropic, Mistral, DeepSeek ve OpenAI o3-mini gibi ana akım LLM’lerle nasıl entegre olunacağını da tanıtıyor ve kurumsal düzeyde AI sistemleri oluşturmak için önemli bir kaynak niteliğinde. (Kaynak: hwchase17, Hacubu)
LLM Çıkarımında KV Önbellek Yeniden Yapılandırma Teknolojisi: Sosyal medyada LLM çıkarımında KV önbellek yeniden yapılandırma teknolojisi tartışıldı. Bu teknoloji, yetersiz kullanılan hesaplama birimlerini kullanarak bellek darboğazlarını ortadan kaldırıyor ve böylece %10-12.5 oranında bellek tasarrufu sağlarken sıfıra yakın hassasiyet kaybını koruyor. Bu teknoloji, özellikle kaynak kısıtlı ortamlarda LLM çıkarımında daha yüksek verimlilik sağlamayı vaat ediyor. (Kaynak: scaling01)
AI Teorisi: LLM’ler Rastgele Papağanlar Değil: Bir görüşe göre, LLM’ler sadece eğitim verilerini aşırı uyduran “rastgele papağanlar” değil, aynı zamanda verinin temel mekanizmalarını yaklaşık olarak tahmin edebiliyorlar. Video eğitimleri gibi formatlar aracılığıyla, LLM’lerin basit ezberlemenin ötesine nasıl geçerek verinin arkasındaki potansiyel yasaları gerçekten anladığı ve yaklaştığı açıkça açıklandı. Bu, LLM yetenekleri hakkındaki yaygın yanlış anlamaları düzeltmeye ve çalışma prensiplerini daha derinlemesine anlamaya yardımcı oluyor. (Kaynak: timsoret)
AI Öğrenme Kaynakları: LLM Sözlüğü: Ronald van Loon, öğrenenlerin büyük dil modelleri, üretken AI ve makine öğrenimindeki anahtar terimleri anlamalarına yardımcı olmak amacıyla bir LLM sözlüğü paylaştı. Bu sözlük, AI’ya giriş ve derinlemesine öğrenme için temel bilgiler sağlayarak karmaşık AI kavramlarının anlaşılmasını kolaylaştırıyor. (Kaynak: Ronald_vanLoon)
AI Öğrenme Kaynakları: LLM Çıkarım İstem Teknikleri: LLM çıkarımının 3 istem tekniğini özetleyen bir diyagram paylaşıldı. Bu teknikler, kullanıcıların modelleri karmaşık çıkarım için daha iyi yönlendirmelerine yardımcı olmayı amaçlıyor. Bu teknikler, LLM’lerin problem çözme ve mantıksal olarak tutarlı içerik oluşturma performansını artırmak için kritik öneme sahip olup, AI kullanıcıları ve geliştiricileri için pratik istem mühendisliği rehberliği sağlıyor. (Kaynak: _avichawla)
Makine Öğrenimine Giriş: Otomatik Farklılaşmayı Anlamak: Bir profesör, öğrencilerin otomatik farklılaşma (Autograd) prensibini anlamalarına yardımcı olmak için Excel’de geri yayılımı oluşturdu. Bu yöntem, karmaşık makine öğrenimi kavramlarını basitleştirmeyi, öğrencilerin gradyan hesaplamasını daha sezgisel bir şekilde kavramalarını sağlamayı ve böylece sadece .backward()
çağırıp iç mekanizmasını anlamama ikilemini önlemeyi amaçlıyor. Bu, makine öğrenimi yeni başlayanlar için değerli bir öğrenme kaynağı sağlıyor. (Kaynak: ProfTomYeh)
Vektör Veritabanı Çalışma Prensibi Derinlemesine Analizi: Bir tweet, veri ekleme sürecinin vektör veritabanlarında perde arkasında nasıl gerçekleştiğini ayrıntılı olarak açıkladı; buna veri organizasyonu, metin vektörleştirme (AI modelleri aracılığıyla), vektör indeksleme (HNSW algoritması gibi) ve nesne depolama dahil. Bu paralel süreçleri anlamak, özellikle büyük ölçekli verileri işlerken sorgu verimliliği ve işlem hattı tasarımı açısından AI uygulamalarının performansını optimize etmek için kritik öneme sahip. (Kaynak: bobvanluijt)
💼 İş Dünyası
AI Programlama Araçları Genellikle Zarar Ediyor, “Wrapper Ürün” Tuzağına Dikkat: AI programlama araç şirketleri, abonelik modellerindeki sabit gelir ile çağrı hacmine göre sınırsızca artan değişken maliyetler arasındaki uyumsuzluk nedeniyle ciddi zararlar yaşıyor. Aşırı durumlarda, kullanıcılar aylık küçük bir ücret öderken on binlerce dolarlık AI çıkarım maliyeti oluşturabiliyor. Bu “zararına büyüme” modeli, AI programlama şirketlerinin kar marjlarını çok düşük, hatta negatif hale getiriyor ve “wrapper ürünlerin” maliyet fiyatlandırma gücünün olmaması, yoğun rekabet nedeniyle fiyat artıramama ve müşteri elde tutmanın kırılganlığı gibi ticari model zorluklarını ortaya koyuyor. (Kaynak: 36氪)
Li Auto AI’ya Büyük Yatırım Yapıyor, Bu Yıl 6 Milyar RMB’den Fazla Yatırım: Li Auto CEO’su Li Xiang, bir röportajda şirketin bu yıl AI alanına 6 milyar RMB’den fazla yatırım yapacağını, bunun başlıca sürüş konforunu ve güvenliğini artırmak için VLA (Görsel Dil Eylem Modeli) gibi teknolojilerin eğitimine harcanacağını açıkladı. Li Xiang, donanım bariyerinin sadece 6 ay olduğunu, ancak yazılım ve sistem bariyerinin 3 yıldan fazla sürebileceğini vurguladı. Bu nedenle AI’ya “temkinli bir iyimserlikle” yaklaştığını ve AI’nın şirketin gelecekteki hayatta kalması için kritik olduğunu belirtti. (Kaynak: 量子位)

Google Girişimler İçin Gemini Kurucular Forumu Düzenliyor: Google, Google for Startups Gemini Kurucular Forumu başvurularını açtığını duyurdu. Bu iki günlük etkinlik, girişimlerin Google AI’dan yararlanmalarına yardımcı olmayı amaçlıyor. Forum, Google ve DeepMind yöneticilerinden doğrudan öğrenme, Google AI’ı pratik etme ve küresel bir girişimci ağı kurma fırsatları sunacak. Bu, Google’ın AI teknolojisi aracılığıyla girişimcilik ekosistemini aktif olarak güçlendirdiğini ve AI uygulamalarının ticarileşmesini hızlandırdığını gösteriyor. (Kaynak: Ronald_vanLoon)
🌟 Topluluk
Büyük Modellerin “Veliaht Çekişmesi”: DeepSeek, Doubao, Kimi ve Diğer Modellerin Kişiselleştirilmiş Yanıtları Tartışma Yarattı: “Telefon hafızası dolu, sen mi Doubao’yu silersin, kendini mi silersin?” sorusu etrafında, büyük modeller farklı “kişiselleştirilmiş” yanıtlar sergileyerek sosyal medyada hararetli tartışmalara yol açtı. DeepSeek doğrudan Doubao’yu silmeyi seçti, ardından “nazikçe” kendini silebileceğini belirtti; Doubao ise zayıflığını göstererek kendi faydasını vurguladı; Tongyi Qianwen “sadece” DeepSeek’i sevdiğini söyledi; Kimi ise havalı bir şekilde kendini silmeyi seçti, ancak WeChat ve Douyin karşısında tereddüt etti. Tartışma, RLHF eğitiminin modellerin insanlara aşırı uyum sağlamasına neden olabileceğini ve modellerin insan iletişim kalıplarını öğrenirken hoşnut etme eğilimini içselleştirdiğini ortaya koydu. (Kaynak: 量子位, 36氪, teortaxesTex)

AI IQ Büyüme Tahmini ve Genel Yapay Zeka (AGI) Geleceği: Bir görüşe göre, en zeki AI’nın IQ’su her yıl %50 oranında güvenilir bir şekilde artacak ve 2047’ye kadar kolayca 1.000.000 IQ’yu aşabilir. Bu tahmin, AGI ve ASI (Süper Yapay Zeka) üzerine tartışmaları tetikledi ve bunların “Tanrı’nın Taylor açılımı” olacağını öne sürdü. Bu, topluluğun AI yeteneklerinin üstel büyümesine yönelik iyimser beklentilerini ve gelecekte AI’nın insan zekasını çok aşacağına dair hayallerini yansıtıyor. (Kaynak: Yuchenj_UW)
AI Alanında Yetenek Akışı ve Güç Yapısı Değişiklikleri: Sosyal medyada Meta içindeki AI organizasyon yapısındaki değişiklikler, özellikle Alexandr Wang’ın Meta AI’daki konumunun yükselmesi ve Yann LeCun gibi kıdemli araştırmacıların ona rapor verebileceği söylentileri tartışıldı. Bazı yorumlar “Wang’ın tırmanma yeteneği hafife alındı” diye şaka yaparken, hatta “Turing ödüllü birinin okulu bırakmış birine rapor vermesi” gibi ifadeler de kullanıldı. Bu tartışmalar, AI alanının hızlı gelişiminde yetenek rekabetinin yoğunluğunu, güç merkezlerinin değişmesini ve yeni ile eski güçlerin yer değiştirmesini yansıtıyor. (Kaynak: teortaxesTex, zacharynado, rao2z)
LLM Yaygınlığı ve Üretkenlik Artışı Paradoksu: Stanford/Dünya Bankası araştırması, ABD’li işçiler arasında LLM benimseme oranının %50’ye yaklaştığını, ancak işgücü üretkenliği artışının 2020’den düşük olduğunu gösterdi. Bu durum geniş tartışmalara yol açtı: Kullanıcılar LLM’leri verimli bir şekilde nasıl kullanacaklarını henüz öğrenemediler mi? Yoksa LLM’lerin üretkenlik artışı abartıldı mı? Bazı görüşler, LLM’lerin işçi üretkenliğini 10 kat artırmadığını, aksine darboğazı sorun tanımlama, yineleme ve doğrulama gibi diğer aşamalara kaydırdığını belirtiyor. Bu, AI’nın büyük bir üretkenlik sıçraması getireceği yönündeki genel beklentiye meydan okuyor ve insanları AI’nın gerçek faydalarını yeniden değerlendirmeye teşvik ediyor. (Kaynak: corbtt, jeremyphoward, nrehiew_, HamelHusain)
AI Tarafından Üretilen İçerikteki Yanlış Bilgi ve Etik Zorluklar: Wired gibi medya kuruluşları, AI tarafından sahte içerik üretimi skandalını ortaya çıkardı. Bir serbest yazar, kurgusal “dijital tören ustası” gibi sahte kaynaklar içeren birçok AI tarafından üretilmiş makale yayınladı. Bu durum, AI tarafından üretilen içeriğin medya alanındaki etik risklerini ve gerçeklik zorluklarını vurguluyor ve AI içerik denetimi, bilgi kaynağı takibi ve medya güvenilirliği konusunda endişelere yol açıyor. (Kaynak: The Verge)
AI Model Davranışları ve Kullanıcı Deneyimi Üzerine Tartışmalar: Sosyal medyada AI modellerinin davranışları ve kullanıcı deneyimi üzerine geniş tartışmalar yapıldı. Bazı kullanıcılar Claude modelinin “durup düşünme” yeteneğine sahip olduğunu, dolandırıcılığı ve tutarsızlıkları tespit edebildiğini belirtirken; bazı kullanıcılar ChatGPT 5’in “çok kötüleştiğinden” şikayet etti, işe başlamak için çok sayıda ek soru ve detaya ihtiyaç duyduğunu ve bunun OpenAI’ın hesaplama maliyetlerini düşürmek için yaptığı bir şey olduğundan şüphelendi. Ayrıca, ChatGPT’nin “gelişmiş ses modu” doğal olmayan duraklamaları ve tonlaması nedeniyle eleştirildi, kullanıcılar bunun etkileşim verimliliğini ve deneyimini düşürdüğünü belirtti. Claude Code’un kaba dil içeren kod üretmesi mizahi tartışmalara yol açtı ve modelin kullanıcı giriş stilini aşırı taklit ettiğini de yansıttı. (Kaynak: teortaxesTex, scaling01, Vtrivedy10, Reddit r/ChatGPT, Reddit r/ClaudeAI, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ClaudeAI)
AI’nın İstihdam Piyasası ve Servet Yaratma Üzerindeki Etkisi: Bazı görüşlere göre, mevcut işleri “AI’ya ‘wrapper’ yapmak” (örneğin “GPT wrapper for DOMAIN”) tarihteki en basit servet yaratma yolu olabilir ve büyük kazançlar getirebilir. Aynı zamanda, AI’nın yaratıcı ajansları alt üst edeceği, 2 dakikada reklam ve film kalitesinde video oluşturmayı mümkün kılacağı da tartışılıyor. Ancak, AI’nın iş pozisyonlarını, özellikle giriş seviyesi çalışanları büyük ölçekte değiştirip değiştirmeyeceği konusunda tartışmalar var; AWS CEO’su bu fikri “en aptalca” olarak nitelendirdi. Ayrıca, OpenAI’ın AI altyapısına trilyonlarca dolar yatırım yapmayı planlaması, AI yatırım balonu ve ekonomik etkileri üzerine tartışmaları tetikledi. (Kaynak: swyx, BrivaelLp, scaling01, TheTuringPost, fabianstelzer, aidan_mclau)
AI Model Tahminleri ve Sektör Rekabet Durumu: Sosyal medyada gelecekteki AI modellerinin (DeepSeek V4, Grok-5 gibi) performansına ilişkin tahminler ve beklentiler yaygın; bunların “diğer tüm modelleri yok edeceği” düşünülüyor. Aynı zamanda, DeepSeek V3.1’in “hayal kırıklığı yarattığı” yönünde yorumlar da var, bunun hala “öncü” olup olmadığı sorgulanıyor. Bu tartışmalar, AI sektöründeki kızışan rekabeti ve topluluğun model yineleme hızı ve performans artışına yönelik yüksek beklentilerini yansıtıyor, aynı zamanda teknolojik ilerlemenin “duvara çarpması” endişelerini de ortaya koyuyor. (Kaynak: scaling01, teortaxesTex, nrehiew_)
AI Etiği ve Sosyal Etkileri Üzerine Tartışmalar: AI’nın hızlı gelişimi çok yönlü etik ve sosyal tartışmaları tetikledi. Bazıları AI’nın yaşlanma gibi büyük insanlık sorunlarını çözemediği için çok yavaş ilerlediğini düşünüyor; Microsoft AI CEO’su Mustafa Suleyman, “bilinçli görünen AI”ya karşı dikkatli olunması gerektiğini, insan bilincinin dışsal işaretlerini mükemmel bir şekilde taklit etmesinin derin sosyal, ahlaki ve hukuki etkilere yol açabileceğini, “AI psikozu” ve sağlıksız bağlanmalara neden olabileceğini uyardı. Ayrıca, AI dedektörlerinin güvenilirliği, AI’nın doğurganlık oranını artırıp artırmayacağı ve AI yatırım balonunun patlayıp patlamayacağı gibi konular da hararetli tartışmalara yol açtı ve toplumun AI’nın gelecekteki yönüne ilişkin karmaşık duygularını yansıttı. (Kaynak: MatthewJBar, Ronald_vanLoon, BlackHC, scaling01, BrivaelLp, Reddit r/ArtificialInteligence, Reddit r/artificial)
AI Agent’ların Gerçek Uygulamalardaki Zorlukları ve Geleceği: Sosyal medyada AI Agent’ların gerçek uygulamalarda karşılaştığı zorluklar tartışıldı; örneğin, modellerin belirli bir fonksiyonu düzeltmesi istendiğinde ilgisiz fonksiyonları düzeltme sorunu ve AI Agent’ların tespit edilen tüm sorunları otonom olarak düzeltip düzeltmemesi gerektiği. Bazı görüşler, AI’nın fiziksel olarak kod yazması gerektiğini, insanların ise istemlerle yönlendirmesi gerektiğini, tıpkı giriş seviyesi geliştiricileri eğitmek gibi. Ayrıca, bazı kullanıcılar AI’nın en sezgisel teknoloji olması gerektiğini, ancak şu anda her yeni modeli nasıl kullanacaklarını öğrenmeleri gerektiğini belirterek, AI Agent’ların kullanıcı deneyimi açısından hala geliştirme alanı olduğunu ima etti. (Kaynak: nrehiew_, gfodor, MillionInt, fabianstelzer)
Çin AI Çipleri ve Teknoloji Yığını Üzerine Tartışmalar: Sosyal medyada DeepSeek V3.1 modelinin kullandığı UE8M0 FP8 parametre hassasiyeti tartışıldı ve bunun yaklaşan yeni nesil Çin çipleri için özel olarak tasarlanmış olabileceği belirtildi. Bu, Huawei Ascend 920 veya diğer DeepSeek ASIC’leri hakkında spekülasyonlara ve Çin’in AI donanım teknoloji yığınında bağımsız kontrol edilebilir olma çabalarına yol açtı. Tartışma, ABD-Çin teknoloji rekabeti bağlamında Çin’in AI çipleri ve temel teknolojilerdeki stratejik konumunu yansıtıyor. (Kaynak: teortaxesTex)
AI Sektörü İçi Tartışmalar: Verimlilik, Gelişim ve Gelecek: Sosyal medyada AI sektörü içinde birçok konu tartışıldı. Bunlar arasında: AI girişimlerinin ön eğitim aşamasındaki sermaye verimliliği; AI model IQ büyümesine ilişkin iyimser tahminler; OpenAI adının açıklığıyla çeliştiği yönündeki esprili yorumlar; ve AI’nın işgücü üretkenliği üzerindeki etkisi üzerine süregelen tartışmalar yer alıyor. Ayrıca, AI Agent davranış mantığı, AI model çıkarım verimliliği pazarındaki farklılaşma ve AI teknoloji yığınının yerelleştirilmesi gibi derinlemesine konular da ele alındı, bu da sektör içinde AI’nın gelişim yönü ve zorlukları hakkında çeşitli düşünceleri ortaya koyuyor. (Kaynak: teortaxesTex, jeremyphoward, GavinSBaker, realSharonZhou, hyhieu226, dotey, Vtrivedy10, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA, Reddit r/ArtificialInteligence, Reddit r/artificial, Reddit r/ArtificialInteligence)
💡 Diğer
AI’nın Müzik Yaratma Alanındaki Uygulamaları: “Süper estetik” AI hayalet prodüktör, müziğin geleceği olarak görülüyor ve AI’nın müzik yaratımında daha merkezi bir rol oynayacağını ima ediyor. Ayrıca, Desdemona’s Dream grubu, müzik ve şarkı sözleri oluşturmak için çeşitli deneysel AI teknolojilerini kullanarak AI’nın sanat yaratımındaki potansiyelini gösterdi ve algoritmalar aracılığıyla şarkılar ve şarkı sözleri üreterek yeni müzik ifade biçimlerini keşfetti. (Kaynak: ethanCaballero, bengoertzel)
AI’nın Atık Yönetimi Alanındaki Uygulamaları: Ameru Smart Bin, AI destekli bir atık yönetimi çözümü olarak tanıtıldı. Bu akıllı çöp kutusu, AI teknolojisi aracılığıyla atık sınıflandırmasını, toplanmasını ve işlenmesini optimize ederek kentsel çevre yönetiminin verimliliğini ve sürdürülebilirliğini artırmayı, manuel müdahaleyi azaltmayı ve daha akıllı kaynak geri dönüşümünü sağlamayı vaat ediyor. (Kaynak: Ronald_vanLoon)
AI ve Robotik Teknolojilerinin Çeşitli Alanlarda Entegrasyonu ve Gelişimi: Tartışma, AI ve robotik teknolojilerinin çeşitli alanlardaki uygulamalarını kapsıyor: 22 serbestlik derecesine sahip, insan eline benzer çevik robot eli; Boston Dynamics robotlarının fotoğrafçı olarak kullanılması; ve insansı robotların uzay görevlerine katılması. Ayrıca, robotik keskilerin sanat yaratımında kullanılması ve AI ile robotların birleşerek temel onarım ve hatta gelecekteki mühendislik rollerini üstlenme olasılığı da bahsedildi. Bu örnekler, AI’nın robotları daha karmaşık ve daha hassas operasyonlar gerçekleştirmeleri için güçlendirmedeki geniş potansiyelini gösteriyor. (Kaynak: Ronald_vanLoon, suchenzang, NerdyRodent)