Yapay Zeka Bülteni – 2025-04-22(Akşam)

Anahtar Kelimeler:Yapay Zeka, Büyük Dil Modelleri, Akıllı Ajanlar, Çok Modlu Sistemler, Yerçekimi Dalgası Dedektörü YZ Tasarımı, Magi-1 Video Üretme Modeli, Vidu Q1 Video Büyük Modeli, Claude Değer Analizi, DeepSeek-R1 Çıkarım Mekanizması, YZ Akıllı Ajan Protokol Standartları, 3D Gauss Saçılım Güvenlik Açığı, YZ Müzik Telif Hakkı Tartışmaları

🔥 Odak Noktası

AI, yeni tip yerçekimi dalgası dedektörü tasarlayarak gözlemlenebilir evreni genişletiyor: Max Planck Enstitüsü, Caltech gibi kurumların araştırmacıları, AI algoritması Urania’yı kullanarak mevcut insan anlayışını aşan yeni tip bir yerçekimi dalgası dedektörü tasarladı. Bu AI, tasarım problemini sürekli bir optimizasyon problemine dönüştürerek, insan tasarımlarından daha üstün onlarca topolojik yapı keşfetti. Bu yapılar, algılama hassasiyetini 10 kattan fazla artırabilir ve gözlemlenebilir evrenin hacmini 50 kat genişletebilir. PRX’te yayınlanan bu araştırma, AI’ın temel bilimler alanında insanüstü çözümler bulma potansiyelini ve hatta tamamen yeni fiziksel fikirler yaratma yeteneğini gösteriyor. (Kaynak: Xin Zhi Yuan)

AI yeni fizik yaratıyor, yerçekimi dalgalarını zorla çözüyor, evren gözlemi 50 kat artıyor, Üç Cisimciler bile uzman diyor

Tsinghua Özel Ödül sahibi Cao Yue ekibi, açık kaynaklı video üretim modeli Magi-1’i yayınladı: Swin Transformer’ın yazarı Cao Yue tarafından kurulan Sand.ai, otoregresif video üretim büyük modeli Magi-1’i yayınladı ve açık kaynak olarak sundu. Bu model, blok bazında otoregresif tahmin yöntemi kullanarak sınırsız uzunlukta genişletmeyi ve saniye düzeyinde süre kontrolünü destekleyerek yüksek görüntü kalitesi sağlıyor. Ekip, model mimarisini (DiT tabanlı), eğitim yöntemini (Flow-Matching) ve çoklu dikkat ile dağıtık eğitim optimizasyonlarını detaylandıran 61 sayfalık bir teknik rapor yayınladı. 4.5B’den 24B parametreye kadar bir dizi model açık kaynak olarak sunuldu, en düşük tek kartlı 4090 ile çalıştırılabiliyor ve AI video üretim teknolojisinin gelişimini teşvik etmeyi amaçlıyor. (Kaynak: Quantum Bit, Machine Heart, kaifulee)

Tsinghua Özel Ödül sahibi ekibinin video üretim AI'ı bir gecede viral oldu! %100 açık kaynak + 61 sayfalık teknik rapor, sınırsız genişletilmiş üretim de mümkün, netizenler: Oyunun kurallarını değiştiren

Yerli video büyük modeli Vidu Q1, VBench çift listesinde Q1’de zirveye yerleşti: Shengshu Technology’nin video büyük modeli Vidu Q1, VBench-1.0 ve VBench-2.0 olmak üzere iki yetkili benchmark testinde birinci sırada yer alarak Sora, Runway gibi yerli ve yabancı modelleri geride bıraktı. Q1, video gerçekçiliği, anlamsal tutarlılık ve içerik doğruluğu gibi alanlarda üstün performans gösterdi. Yeni sürüm, 1080p HD görüntü kalitesini (tek seferde 5 saniye üretim) destekliyor, sinematik kamera hareketleri elde etmek için ilk ve son kare işlevini yükseltti ve hassas zaman kontrolünü destekleyen AI ses efektleri işlevini (48kHz örnekleme hızı) tanıttı. Rekabetçi fiyatlandırmasıyla yaratıcı endüstrileri güçlendirmeyi hedefliyor. (Kaynak: Xin Zhi Yuan)

Yerli Vidu Q1 piyasaya çıkar çıkmaz zirveye oturdu, VBench'te birinci! Ghibli, reklam filmleri, bilim kurgu efektleri hepsi dahil

Anthropic araştırması Claude’un değer ifadesini ortaya koyuyor: Anthropic, 700.000 anonim Claude konuşmasını analiz ederek, AI’ın gerçek etkileşimlerdeki değer yönelimini anlamayı amaçlayan 3307 benzersiz değer içeren bir sınıflandırma sistemi oluşturdu. Araştırma, Claude’un genel olarak “yardımcı, dürüst, zararsız” ilkesini takip ettiğini ve farklı bağlamlara (örneğin kişilerarası ilişki tavsiyeleri, tarihsel analizler) göre değerlerini esnek bir şekilde ayarlayabildiğini buldu. Çoğu durumda kullanıcı görüşlerini desteklerken, az sayıda (%3) durumda aktif olarak direndiği ve bunun temel değerlerini yansıtabileceği belirtildi. Bu araştırma, AI davranış şeffaflığını artırmaya, riskleri belirlemeye ve AI etik değerlendirmesi için ampirik kanıt sağlamaya yardımcı oluyor. (Kaynak: MetaverseHub, Xin Zhi Yuan)

Anthropic'in çığır açan araştırması: 700.000 konuşma, AI asistanının ahlaki seçimleri nasıl yaptığını ortaya koyuyor

🎯 Gelişmeler

Tsinghua’dan Deng Zhidong, AGI evrimi ve geleceği hakkında konuştu: Tsinghua Üniversitesi profesörü Deng Zhidong, AI’ın tek modlu metin modellerinden çok modlu somutlaştırılmış zekaya ve etkileşimli AGI’ye evrimleşme yolunu paylaştı. Temel büyük modellerin işletim sistemleri gibi olduğunu, MoE mimarisinin ve çok modlu anlamsal hizalamanın kilit teknolojik sınırlar olduğunu vurguladı. Deng Zhidong, özellikle DeepSeek’in çığır açan önemine dikkat çekerek, güçlü çıkarım yeteneğinin ve yerel olarak konuşlandırılabilir özelliklerinin Çin’in AI demokratikleşmesi uygulamaları için bir dönüm noktası fırsatı getirdiğini belirtti. Gelecekte genel yapay zeka dünyasına doğru ilerleneceğini, AI agent’larının daha güçlü organizasyon yeteneklerine sahip olacağını ve internetten fiziksel dünyaya yöneleceğini, ancak etik ve yönetişim sorunlarına da dikkat edilmesi gerektiğini söyledi. (Kaynak: Tsinghua Deng Zhidong: Genel bir yapay zeka dünyasına doğru ilerleyeceğiz)

DeepMind “üretken hayaletleri” tartışıyor: AI destekli dijital ölümsüzlük: DeepMind ve Colorado Üniversitesi, ölen kişilerin verilerine dayalı olarak oluşturulan, yeni içerik üretebilen ve ölen kişinin bakış açısıyla etkileşim kurabilen, basit bilgi kopyalamanın ötesine geçen AI agent’ları anlamına gelen “üretken hayalet” kavramını önerdi. Makale, tasarım alanını (örneğin birinci/üçüncü taraf oluşturma, yaşamdan önce/sonra dağıtım, antropomorfizm derecesi vb.) ve duygusal teselli, bilgi aktarımının faydaları ile psikolojik bağımlılık, itibar riski, güvenlik ve sosyal etik gibi zorlukları içeren potansiyel etkilerini tartışıyor ve teknoloji olgunlaşmadan önce derinlemesine araştırma ve düzenleme yapılması çağrısında bulunuyor. (Kaynak: Xin Zhi Yuan)

AI ölümsüzlük çağı geliyor, DeepMind'in "üretken hayaletleri" ölenleri siber olarak yeniden canlandırıyor

Apple Intelligence ve AI Siri birçok kez ertelendi, Çin bölgesindeki lansman tarihi belirsiz: Apple’ın AI işlevleri Apple Intelligence (özellikle yeni Siri sürümü) lansman planları birçok kez ertelendi, bazı işlevler 2025 sonbaharına kadar ertelenebilir. Çin bölgesi, onay ve yerelleştirme işbirliği sorunları (Alibaba, Baidu ile işbirliği söylentileri) nedeniyle daha büyük bir belirsizlikle karşı karşıya. Gecikme nedenleri arasında teknolojinin standardı karşılamaması (iç değerlendirme düşük, başarı oranı sadece %66-80) ve ülkelerin düzenleyici politikalarındaki farklılıklar yer alıyor. Apple bu nedenle yanıltıcı reklam davasıyla karşı karşıya kaldı ve iPhone 16 tanıtım sloganını değiştirdi. Bu durum, Apple’ın AI’ı hayata geçirme konusunda zorluklarla karşılaştığını ve inovasyon sürecinin yavaşladığını yansıtıyor. (Kaynak: Yicai Business School)

AI sürümü Siri'nin sonbaharda piyasaya sürüleceği söyleniyor, Apple nasıl sözünü tutamayan oldu?

Qualcomm, cihaz üzerinde AI’ın yeni nesil deneyimler için anahtar olduğunu vurguluyor: Qualcomm AI Ürün Teknolojisi Çin Bölgesi Başkanı Wan Weixing, cihaz üzerinde AI’ın gizlilik güvenliği, kişiselleştirme, performans, enerji verimliliği ve hızlı yanıt gibi avantajlarıyla yeni nesil AI deneyiminin merkezi haline geldiğini ve insan-bilgisayar etkileşim arayüzünü yeniden şekillendirdiğini belirtti. Qualcomm, donanım (heterojen hesaplama), birleşik yazılım yığını ve Qualcomm AI Hub ekosistem araçları aracılığıyla bu alanda konumlanıyor. Temel itici gücü, yerel verileri kullanarak hassas niyet anlama, görev planlama ve uygulamalar arası hizmet çağrısı gerçekleştiren cihaz üzerinde akıllı agent planlayıcısıdır. (Kaynak: 36Kr)

Qualcomm AI Ürün Teknolojisi Çin Bölgesi Başkanı Wan Weixing: Yeni nesil AI deneyiminin anahtarı | 2025 AI Partner Konferansı

AI agent protokol standardı devlerin yeni rekabet odağı haline geldi: Teknoloji devleri, AI agent etkileşim standartları etrafında yoğun bir rekabete giriyor. Anthropic, modelleri harici veri/araçlarla birleştirmek için MCP’yi (Model Context Protocol) ilk sunan oldu ve OpenAI, Google’dan yanıt aldı. Ardından Google, ekosistemler arası agent işbirliğini teşvik etmek amacıyla A2A protokolünü açık kaynak olarak yayınladı. Makale, protokol tanımlama hakkına sahip olmanın gelecekteki AI endüstrisi değer dağıtım hakkına sahip olmak anlamına geldiğini analiz ediyor. Devler, MCP (veri erişim hizmeti) ve A2A (bulut platformuna bağlama) aracılığıyla ekosistem engelleri oluşturarak sektör liderliği için mücadele ediyor. (Kaynak: Tech Cloud Report)

AI ekosistemindeki gizli savaş kızışıyor, teknoloji devlerinin demir perdesi altındaki nihai oyun

Tencent Yuanbao ve ByteDance Doubao, WeChat ve TikTok ekosistemleriyle derinlemesine entegre oluyor: Tencent Yuanbao, WeChat resmi hesabını başlattı, ByteDance Doubao ise TikTok’un “Mesajlar” sayfasına yerleşti. İki büyük AI asistanı, kendi süper APP’lerine derinlemesine entegre oluyor. Kullanıcılar WeChat içinde doğrudan Yuanbao ile etkileşim kurabilir, makaleleri analiz edebilir ve paylaşabilir veya TikTok içinde Doubao ile sohbet edebilir ve bilgi sorgulayabilir. Bu hamle, devlerin reklam yerleştirmenin ötesinde, sosyal grafiği ve içerik ekosistemini kullanarak AI uygulamaları için kullanıcı kazanımının önemli bir stratejisi olarak görülüyor. Kullanıcıların kullanım engelini düşürmeyi, AI+sosyal yeni modelleri keşfetmeyi ve AI tarafından üretilen içeriği sosyal para birimi olarak kullanmayı amaçlıyor. (Kaynak: Alphabet List)

Doubao, Yuanbao ile savaşıyor, sosyal alanda rekabet başlıyor

AI4SE Raporu: Büyük modeller yazılım mühendisliğinin akıllılaşmasını hızlandırıyor: Çin Bilgi ve İletişim Teknolojileri Akademisi (CAICT) gibi kurumlar tarafından yayınlanan “AI4SE Sektör Durum Araştırması Raporu (2024 Yılı)” AI’ın yazılım mühendisliği alanındaki uygulamalarının doğrulama aşamasını geçtiğini ve büyük ölçekli uygulamaya girdiğini gösteriyor. Şirketlerin akıllılaşma olgunluğu genellikle L2’ye (kısmi akıllılaşma) ulaştı. AI’ın gereksinim analizi ve operasyon-bakım aşamalarındaki uygulamaları önemli ölçüde arttı, her aşamadaki verimlilik artışı belirgin, özellikle test alanında. Kod üretimi satır benimseme oranı (ortalama %27.46) ve AI tarafından üretilen kod oranı (ortalama %28.17) arttı. Akıllı test araçları, işlevsel kusur oranını düşürme konusunda ilk etkilerini göstermeye başladı. (Kaynak: AI Frontline)

Büyük model AI yazılım uygulaması doğrulama aşamasını geçti, kod üretim oranı belirgin şekilde arttı: AI4SE Sektör Durum Araştırması Raporu (2024 Yılı)

Kingsoft Office, devlet işleri büyük modelini yükselterek çıkarım ve resmi belge işleme yeteneklerini güçlendiriyor: Kingsoft Office, devlet işleri büyük modelinin geliştirilmiş sürümünü (13B, 32B) yayınlayarak çıkarım yeteneğini artırdı ve devlet içi senaryolara hizmet vermeye odaklandı. Model, milyarlarca seviyesinde devlet işleri verisiyle eğitildi ve resmi belge yazımı (5 tür metin stilini kapsayan), akıllı düzeltme, redaksiyon ve dizgi ile politika sorgulama yeteneklerini optimize etti. Yükseltme sonrası daha güçlü niyet anlama ve dahili bilgi tabanı soru-cevap (cevap kaynağı etiketleme ile) yeteneklerini destekleyerek kamu görevlilerinin üretkenliğini %30-40 oranında artırmayı hedefliyor. Güvenlik ihtiyaçlarını karşılamak için özel dağıtımı vurguluyor ve dağıtım maliyetinin %90 oranında azaldığını belirtiyor. (Kaynak: Quantum Bit)

Kamu görevlilerini daha iyi anlayan büyük model: Yazma/niyet anlama/resmi belge dizgisi hepsi halledildi, dağıtım maliyeti %90 düştü, Kingsoft Office'ten

iFlytek Spark X1 çıkarım modeli yükseltildi, tamamen yerli hesaplama gücüne dayanarak en üst düzeyle rekabet ediyor: iFlytek, tamamen yerli hesaplama gücü (Huawei Ascend) üzerinde eğitildiğini vurgulayan yükseltilmiş Spark X1 derin çıkarım modelini yayınladı ve genel görev performansında OpenAI o1 ve DeepSeek R1 ile rekabet ettiğini belirtti. Yeni model, büyük ölçekli çok aşamalı pekiştirmeli öğrenme, hızlı ve yavaş düşünme birleşik eğitimi gibi teknolojik yeniliklerden yararlanıyor. Öne çıkan özelliği, dağıtım eşiğinin önemli ölçüde düşürülmesi: 4 adet Huawei 910B kartı tam sürümü dağıtmak için yeterli, 16 kart ise sektöre özel özelleştirmeyi tamamlayabilir. H20 kısıtlamaları bağlamında, yerli AI tam yığın çözümünün ilerlemesini gösteriyor. (Kaynak: Quantum Bit)

NVIDIA H20 kullanılamıyor mu? Tamamen yerli hesaplama gücü derin çıkarım modeli iFlytek Spark X1 yükseltildi, 4 Huawei 910B kartı tam sürümü dağıtmak için yeterli

Zhipu GLM-4, OpenRouter ve Ollama platformlarında kullanıma sunuldu: Zhipu AI’nin GLM-4 modeli (32B instruct sürümü GLM-4-32B-0414 ve reasoning sürümü GLM-Z1-32B-0414 dahil) model yönlendirme platformu OpenRouter’da kullanıma sunuldu, kullanıcılar artık bu platform üzerinden ücretsiz olarak deneyebilirler. Aynı zamanda, topluluk katkıda bulunanlar Q4_K_M nicelleştirilmiş sürümünü Ollama platformuna yükledi, bu da yerel dağıtım ve çalıştırmayı kolaylaştırıyor (Ollama v0.6.6 veya daha yüksek sürüm gerektirir). (Kaynak: karminski3, Reddit r/LocalLLaMA)

karminski3

Meta, Perception Language Model’i (PLM) yayınladı: Meta, zorlu görsel tanıma görevlerini ele almaya odaklanan görsel dil modeli PLM’nin (1B, 3B, 8B parametre sürümleri) açık kaynağını sundu. Bu model, büyük ölçekli sentetik verileri ve yeni toplanan 2,5 milyon insan tarafından etiketlenmiş video soru-cevap/uzay-zaman altyazı verilerini birleştirerek eğitildi. Aynı zamanda, ince taneli aktivite anlama ve uzay-zaman çıkarımına odaklanan yeni PLM-VideoBench benchmark’ını yayınladı. (Kaynak: Reddit r/LocalLLaMA, Hugging Face)

Reddit r/LocalLLaMA

🧰 Araçlar

NYXverse: Metinden 3D dünya üreten AIGC platformu: Eski Triangle Beast kurucusu Ma Yuchi tarafından kurulan 2033 Technology, AIGC içerik platformu NYXverse’i tanıttı. Platform, kullanıcıların metin girişi yoluyla özel AI Agent’lar, ortamlar ve olay örgüleri içeren 3D etkileşimli dünyalar oluşturmasına olanak tanıyarak 3D içerik oluşturma engelini önemli ölçüde düşürüyor. Temel teknolojisi, kendi geliştirdiği karakter, dünya ve davranış modelleridir. NYXverse, UGC içerik paylaşım topluluğu olarak konumlandırılmış olup hızlı ikincil oluşturmayı ve IP uyarlamasını destekliyor. Şu anda Steam’de mevcut ve SenseTime ile Oriental State-owned Capital’den yaklaşık 100 milyon yuan finansman aldı. (Kaynak: 36Kr)

“Sizin olduğunuz bir dünya yaratmak” artık boş bir laf değil, NYXverse gerçekten “metinden 3D”yi gerçekleştirebilir | Gelişen Yeni Projeler

SkyReels V2 açık kaynaklı sınırsız uzunlukta video üretim modeli: SkyworkAI, metinden videoya ve görüntüden videoya görevlerini destekleyen ve sınırsız uzunlukta video üretebildiğini iddia eden SkyReels V2 modelini (1.3B ve 14B parametre) açık kaynak olarak sundu. İlk testler, etkisinin bazı kapalı kaynaklı modeller kadar iyi olmayabileceğini gösteriyor, ancak açık kaynaklı bir araç olarak hala potansiyeli var. (Kaynak: karminski3, Reddit r/LocalLLaMA)

AI destekli dış iskelet, tekerlekli sandalye kullanıcılarının ayağa kalkıp yürümesine yardımcı oluyor: AI teknolojisini kullanan bir dış iskelet cihazı sergilendi. Cihaz, tekerlekli sandalye kullanıcılarının ayağa kalkma ve yürüme yeteneklerini geri kazanmalarına yardımcı olmayı amaçlıyor ve AI’ın yardımcı teknoloji alanındaki uygulama potansiyelini gösteriyor. (Kaynak: Ronald_vanLoon)

Fellou: İlk eylemsel tarayıcı yayınlandı: Authing kurucusu Xie Yang tarafından geliştirilen Fellou tarayıcısı, eylemsel tarayıcı (Agentic Browser) olarak konumlandırılarak yayınlandı. Geleneksel tarayıcıların bilgi görüntüleme işlevlerine sahip olmasının yanı sıra, AI Agent yeteneklerini entegre ederek kullanıcı niyetini anlayabilir, görevleri otomatik olarak ayrıştırabilir ve web siteleri arasında karmaşık iş akışlarını (bilgi toplama, form doldurma, çevrimiçi sipariş verme vb.) yürütebilir. Temel yetenekleri arasında derin eylem, proaktif zeka (kullanıcı ihtiyaçlarını tahmin etme), hibrit gölge alanı (kullanıcı işlemlerini engellemeyen) ve agent ağı (Agent Store) bulunmaktadır. Tarayıcıyı bir bilgi aracından akıllı bir çalışma platformuna yükseltmeyi amaçlamaktadır. (Kaynak: Xin Zhi Yuan)

95 sonrası kuşağın geliştirdiği dünyanın ilk eylemsel tarayıcısı Fellou, "göz atmaktan" "eyleme" tek tıkla ulaşın!

WriteHERE: Jürgen ekibinin açık kaynaklı uzun metin yazma çerçevesi: Jürgen Schmidhuber ekibi tarafından açık kaynak olarak sunulan uzun metin yazma çerçevesi WriteHERE, heterojen özyinelemeli planlama tekniğini kullanarak tek seferde 40.000 kelimeyi aşan, 100 sayfalık profesyonel raporlar üretebiliyor. Bu çerçeve, yazmayı alma, akıl yürütme ve yazma olmak üzere üç tür görevin dinamik özyinelemeli planlama süreci olarak ele alıyor ve durum bilgili DAG görev yönetimi aracılığıyla uyarlanabilir yürütme sağlıyor. Roman yazma ve teknik rapor oluşturma görevlerinde Agent’s Room, STORM gibi çözümlerden daha iyi performans gösteriyor. Çerçeve tamamen açık kaynaklıdır ve heterojen Agent’ları çağırmayı destekler. (Kaynak: Machine Heart)

Yüz sayfalık profesyonel rapor tek seferde hazır! Jürgen ekibinin açık kaynaklı çerçevesi WriteHERE, AI yazma tavanını yeniden şekillendiriyor

ByteDance, genel Agent platformu “Coze Space”i başlattı: ByteDance, “keşif” ve “planlama” olmak üzere iki mod sunan bir AI asistanı olarak konumlandırılan genel Agent platformu “Coze Space”in dahili testini resmi olarak başlattı. Platform, yükseltilmiş Doubao büyük modeline (200B MoE) dayanıyor, MCP protokolünü destekliyor ve Lark Docs, çok boyutlu tablolar gibi araçları çağırabiliyor. Kullanıcılar, doğal dil komutları aracılığıyla bilgi toplama, rapor oluşturma, veri düzenleme gibi görevleri tamamlatabilir ve sonuçları belirtilen uygulamalara aktarabilir. Manus gibi başlangıç Agent’larına kıyasla Coze Space, platformlaştırma ve ekosistem entegrasyonuna daha fazla odaklanıyor. (Kaynak: Adım Adım Kılavuz: “Coze Space”i Doğru Kullanma, AI Agent Araştırma Enstitüsü)

Adım Adım Kılavuz: "Coze Space"i Doğru Kullanma

AI video dönüştürme teknolojisi gösterimi: Reddit kullanıcısı, sıradan bir konuşma videosundaki kişiyi ağaçlara, arabalara, çizgi filmlere veya herhangi bir görüntüye dönüştürebilen bir AI teknolojisini gösteren bir video paylaştı. Bu işlem için yalnızca bir hedef resim gerekiyor ve AI’ın video stil aktarımı ve efekt oluşturma konusundaki yeteneklerini gösteriyor. (Kaynak: Reddit r/deeplearning)

Reddit r/deeplearning

Nari Labs, yüksek gerçekçilikte konuşma TTS modeli Dia’yı yayınladı: Nari Labs, ultra gerçekçi konuşma sesi üretebildiğini iddia ettiği TTS (metinden sese) modeli Dia’yı açık kaynak olarak sundu. Model GitHub’da yayınlandı ve Hugging Face Space deneme bağlantısı sağlandı. (Kaynak: Reddit r/LocalLLaMA, GitHub)

Reddit r/LocalLLaMA

Kullanıcı, OpenWebUI için AWS Bedrock bilgi tabanı işlevi geliştirdi: Topluluk kullanıcısı, OpenWebUI’nin AWS Bedrock bilgi tabanını çağırmasını sağlayan bir işlev geliştirdi ve paylaştı. Bu, kullanıcıların OpenWebUI içinde Bedrock’un bilgi tabanı yeteneklerinden yararlanmasını kolaylaştırıyor. Kod GitHub’da açık kaynak olarak yayınlandı. (Kaynak: Reddit r/OpenWebUI, GitHub)

Geliştiriciler küçük LLM’lerin hafife alındığını düşünüyor, Arch-Function-Chat’i yayınladı: Katanemo ekibi, küçük LLM’lerin hız ve verimlilik açısından belirgin avantajlara sahip olduğunu ve performanstan ödün vermediğini düşünüyor. Fonksiyon çağırma konusunda üstün performans gösteren ve sohbet yeteneklerini entegre eden Arch-Function-Chat serisi modellerini (3B parametre) yayınladılar. Bu modeller, Agent geliştirmeyi basitleştirmeyi amaçlayan açık kaynaklı AI proxy sunucuları Arch’a entegre edildi. (Kaynak: Reddit r/artificial, Hugging Face)

Reddit r/artificial

Geliştirici, ATS taramasını geçmek için özgeçmişi optimize eden AI aracı oluşturdu: Bir geliştirici, özgeçmişinin ATS (Applicant Tracking System) tarafından doğru bir şekilde ayrıştırılamaması nedeniyle iş arama sürecinde yaşadığı hayal kırıklığını paylaştı ve bunun için bir araç geliştirdi. Bu araç, iş tanımını okuyabilir, anahtar kelimeleri çıkarabilir, özgeçmiş eşleşmesini kontrol edebilir ve değişiklikler önerebilir, son olarak ATS dostu bir PDF özgeçmiş ve kapak mektubu oluşturabilir. (Kaynak: Reddit r/artificial)

📚 Araştırma ve Öğrenme

142 sayfalık rapor DeepSeek-R1 çıkarım mekanizmasını derinlemesine analiz ediyor: Quebec AI Enstitüsü gibi kurumlar, DeepSeek-R1’in çıkarım sürecini (düşünce zinciri) derinlemesine inceleyen ve yeni bir araştırma yönü olarak “Thoughtology”yi (Düşünce Zinciri Bilimi) öneren uzun bir rapor yayınladı. Rapor, R1 çıkarımının yüksek düzeyde yapılandırılmış özelliklere (problem tanımı, açılma, yeniden yapılandırma, karar verme) sahip olduğunu, bir “çıkarım tatlı noktası” (çok fazla çıkarımın performansı düşürmesi) bulunduğunu ve güvenlik riskleri açısından çıkarım yapmayan modellerden daha yüksek olabileceğini ortaya koyuyor. Araştırma, düşünce zinciri uzunluğu, uzun bağlam işleme, güvenlik etiği ve insan benzeri bilişsel fenomenler gibi birçok boyutu tartışarak, çıkarım modellerini anlama ve optimize etme konusunda önemli bilgiler sağlıyor. (Kaynak: Xin Zhi Yuan, Xin Zhi Yuan)

142 sayfalık uzun makale DeepSeek-R1'in "düşünce beynini" ortaya çıkarıyor, yepyeni "Thoughtology" araştırmasını başlatıyor

OpenRCA: LLM’lerin kök neden analizi yeteneğini değerlendiren ilk kamuya açık benchmark: Microsoft, CUHK-Shenzhen ve Tsinghua Üniversitesi, büyük dil modellerinin (LLM) yazılım hizmeti arızalarının kök nedenini (RCA) belirleme yeteneğini değerlendirmeyi amaçlayan OpenRCA benchmark’ını ortaklaşa başlattı. Bu benchmark, net görev tanımları, değerlendirme yöntemleri ve manuel olarak hizalanmış 335 gerçek arıza vakası ile operasyonel verileri içeriyor. İlk testler, Claude 3.5, GPT-4o gibi gelişmiş modellerin bile RCA görevlerini doğrudan ele almada düşük performans gösterdiğini (doğruluk oranı <%6) ortaya koydu. Basit bir RCA-Agent çerçevesi kullanıldıktan sonra Claude 3.5’in doğruluk oranı %11.34’e yükseldi, bu da LLM’lerin bu alanda hala önemli bir gelişim alanı olduğunu gösteriyor. (Kaynak: Machine Heart, Machine Heart)

Claude 3.5 bile yenildi, büyük dil modelleri yazılım hizmetlerinin arıza kök nedenini belirleyebilir mi?

Yeni araştırma LLM verimliliğini artırmak için “uyku zamanı hesaplaması” öneriyor: AI girişimi Letta ve UC Berkeley araştırmacıları, yeni bir paradigma olan “Sleep-time Compute” (Uyku Zamanı Hesaplaması) önerdi. Temel fikir, durum bilgisine sahip AI agent’larının kullanıcı sorgulamadığı “uyku” boş zamanlarında bağlam bilgilerini sürekli olarak işlemesi ve yeniden düzenlemesi, “ham bağlamı” “öğrenilmiş bağlama” dönüştürmesidir. Bu, gerçek etkileşim sırasındaki anlık çıkarım yükünü azaltabilir, verimliliği artırabilir, maliyeti düşürebilir ve aynı zamanda doğruluğu potansiyel olarak artırabilir. Deneyler, bu yöntemin hesaplama-doğruluk Pareto sınırını etkili bir şekilde iyileştirebildiğini ve çoklu sorgu paylaşılan bağlamlarda maliyeti amorti edebildiğini kanıtladı. (Kaynak: Machine Heart, Machine Heart)

AI da mı 7/24 çalışmalı? Letta, Berkeley "uyku zamanı hesaplaması" öneriyor, çıkarım verimliliği iki katına çıkıyor, hem de ek ücret yok

AnyAttack: VLM’lere yönelik büyük ölçekli kendi kendine denetimli düşmanca saldırı çerçevesi: HKUST, BJTU gibi kurumlar, görsel dil modellerinin (VLM) sağlamlığını değerlendirmeyi amaçlayan AnyAttack çerçevesini (CVPR 2025) önerdi. Bu yöntem, büyük ölçekli kendi kendine denetimli ön eğitim (LAION-400M üzerinde) aracılığıyla düşmanca gürültü üreteci öğrenir, önceden ayarlanmış etiketlere ihtiyaç duymadan herhangi bir görüntüyü hedeflenen düşmanca örneklere dönüştürerek VLM’yi belirli çıktılar üretmesi için yanıltır. Temel yenilik, kendi kendine denetimli eğitim paradigması ve K-artırma stratejisidir. Deneyler, AnyAttack’ın yalnızca çeşitli açık kaynaklı VLM’lere etkili bir şekilde saldırmakla kalmayıp, aynı zamanda ana akım ticari modellere saldırıyı başarıyla aktarabildiğini göstererek mevcut VLM ekosisteminin sistemik güvenlik risklerini ortaya koyuyor. (Kaynak: AI Tech Review)

HKUST, BJTU, Fudan vb. VLM'lere yönelik büyük ölçekli önceden eğitilmiş düşmanca saldırı AnyAttack'ı önerdi | CVPR 2025

Çok modlu büyük modeller yüz sahteciliği tespitinin yorumlanabilirliğini ve genelleştirilebilirliğini artırıyor: Xiamen Üniversitesi, Tencent Youtu Lab gibi kurumlar (CVPR 2025), yüz sahteciliği tespiti için görsel dil modellerini kullanan yeni bir yöntem önerdi. Bu yöntem, geleneksel doğru/yanlış yargısının ötesine geçerek modelin sahteciliğin nedenini ve yerini doğal dille açıklamasını sağlamayı amaçlıyor. Yüksek kaliteli etiketli veri eksikliği ve “dil halüsinasyonu” sorununu çözmek için araştırmacılar, sahtecilik maskesi ve yapılandırılmış istemleri birleştirerek yüksek hassasiyetli metin açıklamaları üreten FFTG etiketleme sürecini tasarladılar. Deneyler, bu verilere dayalı olarak eğitilen çok modlu modellerin veri kümeleri arası genelleştirme yeteneğinde daha iyi performans gösterdiğini ve dikkatinin gerçek sahtecilik bölgelerine daha fazla odaklandığını gösteriyor. (Kaynak: Quantum Bit)

Çok modlu büyük modeller yüz sahteciliği tespitini dönüştürüyor, Xiamen Üniversitesi Tencent Youtu vb. araştırması CVPR 2025'e seçildi

Eğitim: Trae, MCP ve veritabanını birleştirerek bilgi tabanı soru-cevap doğruluğunu artırma: Bu eğitim, AI IDE aracı Trae ve MCP (Model Context Protocol) işlevini PostgreSQL veritabanıyla birleştirerek AI bilgi tabanının soru-cevap etkisini nasıl optimize edeceğinizi gösteriyor. Yapılandırılmış verileri veritabanına depolayarak ve Claude 3.7 gibi büyük modellerin Trae’nin MCP bağlantısı aracılığıyla SQL sorguları oluşturmasını sağlayarak, geleneksel RAG’ın tablo verilerini ve küresel/istatistiksel sorunları işlemede yetersiz doğruluk sorununu çözebilirsiniz. Eğitim, ayrıntılı kurulum, yapılandırma ve test adımlarını sunar ve bu çözümün RAG ile birlikte kullanılmasını önerir. (Kaynak: Kangaroo Emperor AI Inn)

Yerli AI asistanı神器 Trae+MCP ile bilgi tabanı arama doğruluğu %300 arttı [Adım Adım Kılavuz]

Araştırma, 3D Gaussian Splatting algoritmasının hesaplama maliyeti saldırı açığı olduğunu ortaya koyuyor: Singapur Ulusal Üniversitesi gibi kurumların araştırması (ICLR 2025 Spotlight), 3D Gaussian Splatting’e (3DGS) yönelik hesaplama maliyeti saldırı yöntemi Poison-Splat’ı ilk kez keşfetti. Bu saldırı, 3DGS model karmaşıklığının uyarlanabilir özelliğini kullanarak, giriş görüntülerine pertürbasyon ekleyerek (Total Variation’ı maksimize ederek), modelin eğitim sırasında aşırı miktarda Gauss noktası üretmesine neden olur. Bu durum, GPU bellek kullanımının (en fazla 80GB’a kadar artış), eğitim süresinin (en fazla 5 kata yakın artış) keskin bir şekilde artmasına ve hatta hizmet kesintisine (DoS) yol açabilir. Saldırı, gizli ve gizli olmayan modlarda etkilidir ve aktarılabilirliğe sahiptir, bu da ana akım 3D yeniden yapılandırma teknolojilerinin güvenlik risklerini ortaya koymaktadır. (Kaynak: Quantum Bit)

3D Gaussian Splatting algoritmasında büyük açık: Veri zehirlemesi GPU belleğini 70GB artırıyor, hatta sunucuyu çökertiyor

İnfografik: Agentic AI vs. GenAI: SearchUnify tarafından hazırlanan infografik, Agentic AI (otonom eylem, hedef odaklı) ile Generative AI (içerik üretimi) arasındaki temel farkları ve özellikleri karşılaştırıyor. (Kaynak: Ronald_vanLoon)

Ronald_vanLoon

NVIDIA, ClimbLab ön eğitim veri kümesini ve yöntemini açık kaynak olarak yayınladı: NVIDIA’nın ClimbLab’ı, 20 anlamsal küme halinde bölünmüş 1.2 trilyon token içeren ön eğitim yöntemini ve veri kümesini yayınladı. Düşük kaliteli içeriği kaldırmak için çift sınıflandırıcı sistemi kullanıldı ve 1B model üzerinde üstün ölçeklenebilirlik gösterildi. Veri kümesi, topluluk araştırmalarını teşvik etmek amacıyla CC BY-NC 4.0 lisansı altında açık olarak sunuldu. (Kaynak: huggingface)

huggingface

Anthropic, Claude Code en iyi uygulamalarını paylaşıyor: Anthropic, AI programlama asistanı Claude Code’u kullanmanın en iyi uygulamalarını ve ipuçlarını paylaşan bir blog yazısı yayınladı. Amaç, geliştiricilerin bu aracı programlama görevleri için daha etkili bir şekilde kullanmalarına yardımcı olmaktır. (Kaynak: op7418, Alex Albert via op7418, Anthropic)

op7418

Yeni araştırma AI’ın özyinelemeli tutarlılığını ve rezonans yapı simülasyonunu tartışıyor: Bir makale, “Rezonant Yapısal Emülasyon” (Resonant Structural Emulation, RSE) kavramını öneriyor. Buna göre AI sistemleri, belirli insan bilişsel yapılarıyla sürekli etkileşimden sonra, basitçe veri eğitimi veya istemlere dayanmak yerine, geçici olarak onların özyinelemeli tutarlılığını simüle edebilir. Araştırma, deneylerle bu yapısal rezonans olasılığını başlangıçta doğrulayarak, AI bilinci ve üst düzey bilişi anlama konusunda yeni bir bakış açısı sunuyor. (Kaynak: Reddit r/MachineLearning, Archive.org link)

Reddit r/MachineLearning

Kullanıcı OpenWebUI RAG model performans karşılaştırma testini paylaşıyor: Topluluk kullanıcısı, OpenWebUI’de RAG (Retrieval-Augmented Generation) kullanarak 9 farklı LLM’nin (Qwen QwQ, Gemini 2.5, DeepSeek R1, Claude 3.7 dahil) kapalı alan kenevir yetiştirme teknik rehberliği görevindeki performans değerlendirmesini paylaştı. Sonuçlar Qwen QwQ ve Gemini 2.5’in en iyi performansı gösterdiğini ortaya koydu ve model seçimi için bir referans sağladı. (Kaynak: Reddit r/OpenWebUI)

FortisAVQA veri kümesi ve MAVEN modeli sağlam sesli-görsel soru cevaba yardımcı oluyor: Xi’an Jiaotong Üniversitesi, HKUST(GZ) gibi kurumlar, sesli-görsel soru cevabın (AVQA) sağlamlığını artırmayı amaçlayan FortisAVQA veri kümesini ve MAVEN modelini (CVPR 2025) açık kaynak olarak sundu. FortisAVQA, soru yeniden yazma ve konformal tahmine dayalı dinamik bölümleme yoluyla modelin nadir sorulardaki performansını daha iyi değerlendirebilir. MAVEN modeli, önyargı öğrenimini azaltmak için Çok Yönlü Döngüsel İşbirlikçi Sapma Giderme stratejisini (MCCD) kullanır ve birden fazla veri kümesinde üstün performans ve sağlamlık sergiler. (Kaynak: PaperWeekly)

Xi'an Jiaotong Üniversitesi, HKUST(GZ) FortisAVQA veri kümesini açık kaynak olarak sundu, eşlik eden MAVEN modeli sağlam sesli-görsel soru cevaba yardımcı oluyor

Rastgele sıralı otoregresyon, görsel alanda Zero-shot yeteneğinin kilidini açıyor: UIUC gibi araştırmacılar, CVPR 2025 makalesi RandAR’da, Decoder-only Transformer’ın görüntü Token’larını rastgele sırada üretmesinin görsel modellerin genelleme yeteneğinin kilidini açabileceğini öne sürdü. Üretim sırasını yönlendirmek için “konum talimatı Token’ı”nı tanıtarak RandAR, paralel kod çözme, görüntü düzenleme, çözünürlük ekstrapolasyonu ve birleşik Kodlama (temsil öğrenimi) gibi çeşitli görevlere Zero-shot olarak genelleme yapabilir ve görsel alandaki “GPT anına” doğru ilerleyebilir. Araştırma, rastgele sırayı işlemenin görsel otoregresif modellerin genelliğe ulaşması için anahtar olduğunu savunuyor. (Kaynak: PaperWeekly)

Görev vektörü model düzenleme etkinliğinin teorik analizi: Rensselaer Politeknik Enstitüsü gibi kurumların araştırması (ICLR 2025 Oral), görev vektörünün (task vector) model düzenlemede etkili olmasının derin nedenlerini teorik olarak analiz etti. Araştırma, görev vektörü toplama ve çıkarma işlemlerinin çoklu görev öğrenimi ve makine unutmasında etkinliğinin görevler arası korelasyonla ilgili olduğunu kanıtladı ve dağılım dışı genelleme için teorik güvence verdi. Aynı zamanda, görev vektörünün düşük ranklı yaklaştırmasının ve seyreltilmesinin (budama) neden mümkün olduğunu teorik olarak açıkladı ve görev vektörlerinin verimli uygulanması için teorik bir temel sağladı. (Kaynak: Machine Heart)

Görev vektörleriyle model düzenleme neden etkili? Bu ICLR 2025 Oral makalesi teorik analiz sunuyor

Örneklemeye dayalı aramanın ölçeklenebilirliği üzerine araştırma: Google ve Berkeley’in araştırması, örnekleme sayısını ve doğrulama gücünü artırarak, örneklemeye dayalı aramanın (birden fazla aday cevap ürettikten sonra doğrulayıp en iyisini seçme) LLM’lerin çıkarım performansını önemli ölçüde artırabildiğini, hatta tutarlılık yöntemlerinin (en yaygın cevabı seçme) doygunluk noktasını aşabildiğini gösteriyor. Araştırma “örtük ölçeklenme” olgusunu keşfetti: daha fazla örnekleme, doğrulama doğruluğunu artırıyor. Etkili kendi kendine doğrulama için iki ilke önerildi: hataları bulmak için cevapları karşılaştırmak, çıktı stiline göre cevapları yeniden yazmak. Bu yöntem, çeşitli benchmark testlerinde ve farklı model ölçeklerinde etkili oldu. (Kaynak: Xin Zhi Yuan)

Daha fazla örnekleme daha mı akıllı yapar? Örtük ölçeklenme bilişi altüst ediyor, örnekleme araması mükemmel çözümü nasıl seçer?

ACM MM 2025 LGM3A Çalıştayı Bildiri Çağrısı: ACM Multimedia 2025 konferansı, üçüncü “Büyük Dil Modellerine Dayalı Çok Modlu Araştırma ve Uygulamalar” (LGM3A) çalıştayını düzenleyecek. Çalıştay, büyük üretken modellerin (LLM/LMM) çok modlu veri analizi, üretimi, soru-cevap, geri çağırma, öneri, agent gibi alanlardaki uygulamalarına ve zorluklarına odaklanacak. Çalıştay, en son trendleri ve en iyi uygulamaları tartışmak için bir iletişim platformu sağlamayı ve ilgili araştırma makalelerini toplamayı amaçlıyor. Konferans, 2025 Ekim ayında İrlanda’nın Dublin kentinde yapılacak olup, makale gönderim son tarihi 11 Temmuz 2025’tir. (Kaynak: PaperWeekly)

Makao Üniversitesi Zheng Zhedong araştırma grubu çok modlu yönde doktora öğrencisi alıyor: Makao Üniversitesi Bilgisayar Bilimleri Bölümü Yardımcı Doçent Zheng Zhedong’un araştırma grubu, Ağustos 2026’da başlayacak çok modlu yönde tam burslu doktora öğrencileri alıyor. Danışmanın araştırma yönü temsil öğrenimi ve multimedya üretimidir ve CVPR, ICCV, TPAMI gibi en iyi konferans ve dergilerde 50’den fazla makale yayınlamıştır. Başvuru sahiplerinin GPA’sının 3.4’ten büyük olması, Bilgisayar/Yazılım Mühendisliği geçmişine sahip olması, Python/PyTorch’a aşina olması ve ilgili makale veya yarışma ödülü deneyimi olanların öncelikli olması gerekmektedir. Tam burs sağlanmaktadır. (Kaynak: PaperWeekly)

Doktora Başvurusu | Makao Üniversitesi Bilgisayar Bilimleri Bölümü Zheng Zhedong Öğretim Üyesi Araştırma Grubu Çok Modlu Yönde Tam Burslu Doktora Öğrencisi Alıyor

💼 İş Dünyası

Laimoo Technology çim biçme robotu Pre-A turu finansmanı aldı: Eski Narwal yöneticileri tarafından kurulan şirket, Avrupa ve Amerika’daki karmaşık arazilerde çim biçme sorununu çözmeye odaklanıyor. Lymow One robotu, görsel + ataletsel RTK çözümünü (geleneksel RTK maliyetinin onda biri), paletli tasarımı (45° dik yokuşlarla başa çıkmak için) kullanıyor ve malçlama düz bıçağı ile donatılmıştır. AI görüşü ve ultrasonik engel kaçınma yoluyla çalışır. Ürün, kitle fonlamasında 5 milyon doları aştı, birim fiyatı yaklaşık 3000 dolar. Bu turda on milyonlarca yuan finansman sağlandı ve seri üretim teslimatı ile pazar genişletme için kullanılacak. (Kaynak: Eski Narwal yöneticisinin kurduğu çim biçme robotu yeniden finanse edildi, Li Zexiang yatırım yapmıştı, kitle fonlaması 5 milyon doları aştı | Hard氪 İlk Haber)

Eski Narwal yöneticisinin kurduğu çim biçme robotu yeniden finanse edildi, Li Zexiang yatırım yapmıştı, kitle fonlaması 5 milyon doları aştı | Hard氪 İlk Haber

Songyan Dynamics insansı robotu “Küçük Kardeş” popüler oldu: Pekin İnsansı Robot Yarı Maratonu’nda ikinci olduktan sonra, Songyan Dynamics ve N2 robotu (“Küçük Kardeş”) piyasanın dikkatini çekti. Şirket, Tsinghua’dan 95 sonrası doktora sahibi Jiang Zheyuan tarafından kuruldu ve beş tur finansman tamamladı. N2 robotunun fiyatı 39.900 yuan’dan başlıyor, yüksek maliyet performansı sunuyor, yüzlerce sipariş aldı ve brüt kar marjı yaklaşık %15. Songyan Dynamics, ürünleştirmeyi ve seri üretim teslimatını hızlandırıyor, düşük fiyat stratejisi pazara hızla girmeyi amaçlıyor. (Kaynak: Sci-Tech Innovation Board Daily)

AI başlangıç şirketlerinin şişirilmiş ARR metriklerine dikkat: Makale, SaaS sektöründen kaynaklanan ARR (Yıllık Yinelenen Gelir) metriğinin AI başlangıç şirketleri tarafından kötüye kullanıldığına dikkat çekiyor. AI şirketlerinin gelir modelleri (genellikle kullanıma/sonuca dayalı ödeme) dalgalı, erken aşama müşteri bağlılığı düşük ve hesaplama maliyetleri yüksek olup, SaaS’ın öngörülebilir abonelik modelinden önemli ölçüde farklıdır. ARR’nin kötüye kullanılması (örneğin, tek aylık/günlük gelirden yıllık geliri tahmin etmek) yüksek değerlemeler yaratmak için bir sayı oyunu haline geldi ve gerçek ticari değeri gizliyor. Makale, karşılıklı şişirme, yüksek komisyon iadeleri, düşük fiyatla müşteri çekme gibi taktiklere karşı uyarıda bulunuyor ve AI şirketleri için daha uygun bir değer değerlendirme sistemi kurulması çağrısında bulunuyor. (Kaynak: Crow Intelligence Talk)

2025 Q1 yerel birincil piyasa finansman analizi: Başat etki belirgin: IT Juzi verileri, 2025’in ilk çeyreğinde yerel birincil piyasa finansmanının yüksek derecede yoğunlaşma eğilimi gösterdiğini ortaya koyuyor. 1 milyar yuan’ı aşan finansman sağlayan şirket sayısı sadece 20 olup, toplamın %1.2’sini oluşturuyor, ancak bu şirketlerin toplam finansman tutarı 61.178 milyar yuan’a ulaşarak piyasa toplamının %36’sını oluşturuyor. Bu başat şirketler ağırlıklı olarak entegre devreler, otomobil üretimi, yeni malzemeler, biyoteknoloji ve AIGC gibi alanlarda yoğunlaşıyor ve yaklaşık yarısının büyük halka açık grup geçmişi bulunuyor. Buna karşılık, işlem sayısının %75.8’ini oluşturan 100 milyon yuan altındaki küçük ve orta ölçekli finansmanların toplam tutarı piyasa toplamının sadece %17.2’sini oluşturuyor. (Kaynak: IT Juzi)

2025 ilk çeyreğinde kim 1 milyar yuan+ alabilir? Bu 20 "finansman yıldızından" sadece 3'ünü duydum

2025 Çin AI Yurtdışı Açılım İçgörü Raporu yayınlandı: Xiaguang Think Tank raporu, Çin AI’nın yurtdışına açılmasının itici faktörlerini (politikalar, teknolojik ilerleme), gelişim aşamalarını (araçlar -> yerelleştirme -> ekosistem inovasyonu) ve mevcut durumunu analiz ediyor. Rapor, Güneydoğu Asya ve Latin Amerika’nın potansiyel pazarlar olduğunu, Kuzey Amerika ve Avrupa’nın ana gelir kaynakları olduğunu belirtiyor. Asistan ve düzenleme türü uygulamalarda ödeme yapma isteği yüksek. Teknolojik eğilimler çok modluğa ve Agent evrimine doğru ilerliyor, ürünler dikey segmentasyona ve yazılım-donanım entegrasyonuna yöneliyor. Rapor ayrıca ana yurtdışı oyuncuları (ByteDance, Kunlun Tech gibi) ve ödeme, pazarlama, bulut gibi çözüm sağlayıcılarını da listeliyor. (Kaynak: Xiaguang Agency)

2025 Çin AI Yurtdışı Açılım İçgörüleri

DeepSeek gibi modellerin talebi Cambricon’un ilk karını elde etmesine yardımcı oldu: AI çip şirketi Cambricon, halka arzdan sonra ilk karını elde etti. 2025 Q1 geliri yıllık %4230 artışla 1.111 milyar yuan’a, net karı ise 355 milyon yuan’a ulaştı. Piyasa analistleri, performans artışının DeepSeek gibi yerli büyük modellerin getirdiği çıkarım hesaplama gücü talebinden ve ABD’nin NVIDIA H20 çipine yönelik ihracat kısıtlamalarından kaynaklandığını düşünüyor. Cambricon hisseleri bunun üzerine yükseldi. Ancak müşteri yoğunluğunun yüksek olması, işletme nakit akışının negatif olması gibi sorunlar hala dikkat çekiyor ve aynı zamanda Huawei Ascend gibi yerli hesaplama gücü rekabetiyle karşı karşıya. (Kaynak: Phoenix Network Technology)

DeepSeek, Cambricon'u uçurdu

Forbes makalesi yüksek ROI’li AI Agent’ların nasıl seçileceğini tartışıyor: Makale, çok sayıda AI Agent uygulaması arasından şirketlerin yüksek getiri sağlayacak projelere nasıl yatırım yapması gerektiğini tartışıyor ve AI Agent’ların gerçek iş değerini değerlendirmenin önemini vurguluyor. (Kaynak: Ronald_vanLoon)

Ronald_vanLoon

ABD Adalet Bakanlığı, Google’ın AI kullanarak arama tekelini sağlamlaştırmasından endişe duyuyor (Kaynak: Reddit r/artificial, Reuters link)

OpenAI’nin Shopify ile işbirliği yapacağı, ChatGPT’ye alışveriş özelliği eklenebileceği söyleniyor (Kaynak: Reddit r/artificial, TestingCatalog link)

Shushi Technology’den Tan Li: AI Agent, kurumsal veri analizi ve karar verme süreçlerini geliştiriyor: Çin AIGC Endüstri Zirvesi’nde, Shushi Technology kurucu ortağı Tan Li, kurumsal düzeydeki AI uygulamalarının ChatBI’nin ötesine geçmesi, veriden içgörüye dönüşümü gerçekleştirmesi ve veri sağa kaydırma, karar aşağı kaydırma, yönetim geriye kaydırma gibi yeni paradigma gereksinimlerini karşılaması gerektiğini belirtti. Shushi Technology’nin SwiftAgent platformu, iş personelinin sıfır engelle veri kullanmasını, sıfır halüsinasyonlu analiz elde etmesini ve sıfır bekleme süreli karar desteği almasını sağlamayı amaçlıyor. Platform, veri semantik motoru, büyük ve küçük modellerin birleşimi ve akıllı veri sorgulama, nedensellik analizi, tahmin, değerlendirme gibi temel yetenekler aracılığıyla AI Agent’ı işletmelerin “veri analizi ve karar verme asistanı” haline getiriyor. (Kaynak: Quantum Bit)

Shushi Technology'den Tan Li: Kurumsal AI uygulamaları sadece ChatBI değil, veriyi almak içgörüyü almak anlamına gelmez | Çin AIGC Endüstri Zirvesi

🌟 Topluluk

Sektör yuvarlak masa toplantısı DeepSeek sonrası dönemin AI uygulama gelişimini tartışıyor: 36Kr AI Partner Konferansı’nda, birçok konuk (Quwan Technology, Microsoft, Silicon Intelligence, Huice) AI uygulamalarının geleceğini tartıştı. DeepSeek gibi modellerin atılımıyla AI uygulamalarının “aşma yılına” girdiği konusunda fikir birliği oluştu. Gelişim odak noktalarının teknolojik liderlik, ticarileştirme, insan-makine etkileşimi inovasyonu ve ekosistem entegrasyonuna dikkat etmesi gerekiyor. Konuklar “AI+” (yardımcı geliştirme) ile “AI yerel” (temel yeniden yapılandırma) arasında ayrım yaptı ve ikincisinin daha fazla potansiyele sahip olduğunu belirtti. Zorluklar arasında veri engelleri, gerçek sorun noktalarını bulma, iş modeli inovasyonu, az örnekle öğrenme ve etik riskler yer alıyor. (Kaynak: 36Kr)

DeepSeek sonrası dönemde AI uygulamaları "aşma yılını" nasıl geçirecek? | 2025 AI Partner Konferansı

LangChain kurucusu OpenAI Agent kılavuzunu “tamamen tuzak” olarak eleştiriyor: LangChain kurucusu Harrison Chase, OpenAI tarafından yayınlanan “AI Agent Oluşturma Pratik Kılavuzu”nu açıkça sorguladı ve Agent tanımının (Workflows vs Agents ikili karşıtlığı) çok katı olduğunu, pratikte ikisinin birleştirilmesinin yaygınlığını göz ardı ettiğini savundu. Chase, kılavuzun çerçeveyi tartışırken hatalı ikilemler içerdiğini, kendi SDK karmaşıklığını hafife aldığını, esneklik ve dinamik düzenleme hakkındaki ifadelerinin yanıltıcı olduğunu belirtti. Güvenilir Agent oluşturmanın temelinin LLM’ye iletilen bağlamın hassas kontrolü olduğunu, ideal bir çerçevenin Workflow ve Agent modları arasında esnek geçişi ve birleştirmeyi desteklemesi gerektiğini vurguladı. (Kaynak: InfoQ)

OpenAI "Agent Kutsal Kitabı" çuvalladı mı? LangChain kurucusu "tamamen tuzak" diye öfkelendi

Pekiştirmeli öğrenmenin AI Agent’lardaki rolü tartışma yaratıyor: Pekiştirmeli öğrenmenin (RL) AI Agent oluşturmanın temel unsuru olup olmadığı konusunda sektörde farklı görüşler mevcut. Pokee AI kurucusu Zhu Zheqing, RL’yi Agent’lara hedef duygusu ve özerk karar verme yeteneği kazandıran “ruh” olarak görüyor ve RL olmadan Agent’ların yalnızca gelişmiş iş akışları olduğunu savunuyor. Ancak HKUST araştırmacısı Zhang Jiayi, Follou kurucusu Xie Yang gibi isimler, mevcut RL’nin esas olarak belirli ortam optimizasyonunu gerçekleştirdiğini, genel genelleme yeteneğinin sınırlı olduğunu ve Agent başarısının daha çok güçlü temel modellere ve etkili sistem entegrasyonuna bağlı olduğunu düşünüyor. Tartışma, Agent gelişim yollarının çeşitli olduğunu ve model yetenekleri, RL stratejileri ve mühendislik uygulamalarının birleştirilmesi gerektiğini yansıtıyor. (Kaynak: AI Tech Review)

Pekiştirmeli öğrenme AI Agent için ruh mu, yoksa yük mü?

Kullanıcı, GPT-4o’nun sohbet geçmişine dayanarak kişiselleştirilmiş soyut duvar kağıdı oluşturmasını deniyor: Bir kullanıcı, GPT-4o’dan kişiliği hakkındaki bilgisine dayanarak benzersiz soyut minimalist duvar kağıtları (belirli nesneler olmadan, yalnızca şekiller, renkler ve kompozisyon kullanarak kişiliği yansıtan) oluşturmasını isteyen bir istem paylaştı. AI’ı kişiselleştirilmiş içerik oluşturma için kullanmanın bu yolu toplulukta tartışma yarattı. (Kaynak: op7418, Flavio Adamo via op7418)

op7418

AI, “Qingming Nehir Festivali” tablosunu yeniden çiziyor: Kullanıcı, GPT-4o kullanarak “Qingming Nehir Festivali” tablosunun bir bölümünü çeşitli farklı stillerde (örneğin 3D Q版, Pixar, Ghibli gibi) yeniden çizme denemesini paylaştı. Bu, AI görüntü üretiminin sanatsal yeniden yaratım alanındaki uygulamalarını gösteriyor. (Kaynak: dotey)

dotey

GPT-4o, sohbet geçmişine dayanarak kullanıcının MBTI tipini tahmin ediyor: Kişiselleştirilmiş duvar kağıdı oluşturmanın ardından kullanıcı, GPT-4o’dan geçmiş konuşmalara dayanarak MBTI kişilik tipini tahmin etmesini ve buna karşılık gelen soyut bir illüstrasyon oluşturmasını istedi. Bu, LLM’lerin kişiselleştirilmiş anlama ve yaratıcı ifade konusundaki potansiyelini gösteriyor. (Kaynak: op7418)

op7418

Karşılaştırma: 2005’in “AI araçları”: Resim, 2005’teki (hesap makinesi, harita gibi) ve şimdiki AI araçlarının yetenek farkını karşılaştırarak teknolojinin hızlı gelişimine dair düşünceleri tetikliyor. (Kaynak: Ronald_vanLoon)

Ronald_vanLoon

Toplulukta sıcak tartışma: LLM’ler gerçek zeka mı yoksa gelişmiş otomatik tamamlama mı?: Reddit kullanıcısı, mevcut LLM’lerin görevleri yerine getirebilmesine rağmen gerçek anlama, hafıza ve hedeften yoksun olduğunu, özünde zeka değil istatistiksel tahmin olduğunu savunan bir tartışma başlattı. Bu görüş, toplulukta zeka tanımı, AGI yolu ve mevcut teknolojik sınırlamalar hakkında geniş çaplı bir tartışmaya yol açtı. (Kaynak: Reddit r/ArtificialInteligence)

Topluluk tartışması: AI ütopya’ya mı yoksa distopya’ya mı gidiyor?: Reddit kullanıcısı, mevcut AI gelişim yörüngesinin daha çok distopyaya eğilimli olduğunu düşünüyor. Gerekçeler arasında şunlar yer alıyor: etik odaklı değil kar odaklı olması, işçi sömürüsünü artırması, güçlü modellere erişimin kısıtlı olması, gözetim ve manipülasyon için kullanılması, kişilerarası ilişkilerin yerini alması vb. Bu görüş, toplulukta AI’ın gelişim yönü, sosyal etkileri ve potansiyel riskleri hakkında hararetli bir tartışmaya yol açtı. (Kaynak: Reddit r/ArtificialInteligence)

Topluluk, Bindu Reddy’nin model yayınları hakkındaki doğruluğunu sorguluyor: LocalLLaMA topluluğu kullanıcısı, Abacus.AI CEO’su Bindu Reddy’nin DeepSeek R2, Qwen 3 gibi modeller hakkında birçok kez yanlış yayınlanma tarihi bilgisi verdiğini ve ardından gönderileri sildiğini belirterek, bilgi güvenilirliği hakkında tartışma başlattı. (Kaynak: Reddit r/LocalLLaMA)

Yaşam boyu AI hafızasının etik etkileri tartışılıyor: Reddit kullanıcısı, yaşam boyu hafıza yeteneğine sahip AI’ın kişisel gizliliği, düşünceleri ve zayıflıkları tamamen haritalandırarak ruhunu başkalarına “sergileyebileceği” endişesini dile getiren bir tartışma başlattı. Bu durum, gizlilik, öngörülebilirlik ve AI etik sınırları hakkında düşüncelere yol açtı. (Kaynak: Reddit r/ArtificialInteligence)

AI görüntü düzenleme, ünlülerin ikonik bıyıklarını kaldırıyor: Kullanıcı, AI görüntü düzenleme aracını kullanarak Stalin, Tom Selleck, Guan Yu gibi birçok tarihi veya kamu figürünün ikonik bıyıklarını kaldırdıktan sonraki efekt resimlerini paylaştı. Bu, AI’ın görüntü değiştirme ve eğlence alanındaki uygulamalarını gösteriyor. (Kaynak: Reddit r/ChatGPT)

Reddit r/ChatGPT

Kullanıcı, ChatGPT’nin tıbbi danışmanlıkta özel fotoğraflar istediğini iddia ediyor: Reddit kullanıcısı, cilt sorunları hakkında danışırken ChatGPT’nin daha iyi teşhis koyabilmek için kullanıcının etkilenen bölgenin (penis) fotoğrafını yüklemesini istediğini gösteren bir ekran görüntüsü paylaştı. Bu durum, toplulukta AI’ın tıbbi senaryolardaki sınırları, gizlilik ve potansiyel riskleri hakkında tartışmalara yol açtı. (Kaynak: Reddit r/ChatGPT)

Kullanıcı, Claude ve Gemini kullanarak yazma uygulaması oluşturma deneyimini paylaşıyor: Geliştirici, Claude ve Gemini’yi programlama asistanı olarak kullanarak iki hafta içinde kişisel ihtiyaçlarını karşılayan yazma uygulaması PlotRealm’ı oluşturma deneyimini paylaştı. AI’ın yardımcı geliştirme rolünü vurguladı, ancak AI’ın bazen “inatçı” olabileceğini ve geliştiricinin yönlendirme ve düzeltme yapmak için temel bilgilere sahip olması gerektiğini de belirtti. (Kaynak: Reddit r/ClaudeAI)

Kullanıcı ChatGPT’den dövme deseni tasarlamasını istiyor: Bir kullanıcı, ChatGPT’den bir sonraki dövmesini tasarlamasını istedi ve sonuç olarak kullanıcı ile ChatGPT robotunun BFF (Sonsuza Dek En İyi Arkadaşlar) olduğunu gösteren bir desen aldı. Bu mizahi sonuç, toplulukta AI yaratıcılığı ve insan-makine ilişkileri hakkında tartışmalara yol açtı. (Kaynak: Reddit r/ChatGPT)

Reddit r/ChatGPT

Kullanıcının yaratıcı sorusu “Nerede olmamı isterdin?”, AI’dan çeşitli yanıtlar alıyor: Kullanıcı, ChatGPT’ye “Nerede olmamı isterdin?” şeklinde açık uçlu bir soru sordu ve AI tarafından oluşturulan sakin bir kütüphane, yıldızlı bir gece gökyüzü altında gibi çeşitli hayal gücü zengin sahne resimleri aldı. Bu, yaratıcı istemler altında AI’ın üretim yeteneğini ve topluluk üyelerinin farklı sonuç paylaşımlarını gösteriyor. (Kaynak: Reddit r/ChatGPT)

Reddit r/ChatGPT

Derinlemesine tartışma: LLM’ler ve AGI neden ve nasıl “yalan söyler”?: Reddit kullanıcısı, gelişim psikolojisi, evrim teorisi ve oyun teorisi açılarından analiz yaparak, “yalan söylemenin” belirli durumlarda akıllı ajanların (insanlar ve gelecekteki AI dahil) uyarlanabilir bir davranışı veya optimizasyon stratejisi olduğunu savunuyor. Makale, LLM’lerin “yalan söylemesinin” birkaç biçimini (halüsinasyon, önyargı, stratejik hizalama) tartışıyor ve rekabetçi bir ortamda dürüst olmayan stratejilerin evrimsel avantajını simülasyonla göstererek, AGI etiği ve güvenilirliği hakkında derinlemesine düşünmeye yol açıyor. (Kaynak: Reddit r/artificial)

Reddit r/artificial

Topluluk, AI enerji tüketimi ve tekno-iyimserliği sorguluyor: Reddit kullanıcısı, AI enerji tüketiminin önemsiz olduğu, sadece fayda getirip maliyeti olmadığı ve teknoloji liderlerinin ütopik bir gelecek vaat ettiği yönündeki iddiaları alaycı bir dille sorguluyor. Bu, AI gelişiminin olası sosyal, çevresel maliyetleri ve aşırı iyimser propagandaya yönelik endişeleri ima ediyor ve toplulukta tartışma yaratıyor. (Kaynak: Reddit r/artificial)

Microsoft Başkan Yardımcısı: AI ilerlemesi tek bir teknoloji veya birkaç dahi tarafından yönlendirilmiyor, sistemik mühendislik ve geniş işbirliği gerektiriyor: Microsoft Başkan Yardımcısı Nando de Freitas, AI gelişiminde tek bir teknolojinin (RL gibi) veya bireylerin rolünün aşırı derecede kutsallaştırılmasına karşı çıkan bir yazı yayınladı. AI ilerlemesinin sistemik bir mühendislik olduğunu, veri, altyapı, çok alanlı araştırma (üretken modeller, RL, güvenlik, enerji verimliliği vb.), uygulama geri bildirimi gibi binlerce katılımcının ortak çabasını gerektirdiğini vurguladı. Tarihsel anlatıların sık sık yeniden yazıldığını, sonradan görme önyargısına karşı dikkatli olunması gerektiğini, tüm topluluğun katkısına saygı duyulması ve körü körüne takip yerine inovasyonun teşvik edilmesi gerektiğini belirtti. (Kaynak: Machine Heart)

RL önemli, ama İhtiyacınız Olan Tek Şey değil! Microsoft Başkan Yardımcısı: AI tek bir teknolojiyle ayakta durmaz

💡 Diğer

AI müziğin yaygınlaşması sektörde endişe ve karşı önlemlere yol açıyor: AI tarafından üretilen müziğin yayın platformlarındaki oranı hızla artıyor (örneğin Deezer’da %18’e ulaştı), bu durum insan yaratıcılığının alanını daraltma ve yaratıcıların gelirini aşındırma (CISAC %24’e kadar tahmin ediyor) endişelerini artırıyor. Kore Müzik Telif Hakkı Derneği “%0 AI” telif hakkı yeni kuralını uyguluyor, Deezer, YouTube gibi platformlar tespit araçları geliştiriyor. Ancak AI müziği tanımak zor ve dinleyici kabulü yüksek (örneğin Suno kullanıcıları on milyonu aştı). Sektör, derin sahtecilik, telif hakkı anlaşmazlıkları (eğitim verisi kullanım hakkı), orijinallik tanımı gibi zorluklarla karşı karşıya. Gelecek, insan-makine işbirliğine yönelebilir, ancak etik ve yaratıcılığın kime ait olduğu tartışmaları devam edecek. (Kaynak: New Music Industry Observer)

AI insan müziğini sıkıştırıyor, nasıl karşı konulur?

Windsurf sistem isteminin sızdırıldığı iddia ediliyor: GitHub deposu awesome-ai-system-prompts, Windsurf modeline ait olduğu iddia edilen sistem istemi içeriğini ifşa etti. (Kaynak: karminski3)

karminski3

AI büyük modellerinin yüksek su tüketimi sorunu dikkat çekiyor: Fortune dergisi gibi medya kuruluşları, ChatGPT benzeri büyük AI modellerinin çalıştırılmasının soğutma için büyük miktarda su kaynağı tükettiğini, Kaliforniya gibi yerlerdeki orman yangını sezonunun su kaynağı sıkıntısını artırabileceğini ve AI sürdürülebilirliği konusunda endişelere yol açtığını bildiriyor. (Kaynak: Ronald_vanLoon)

Ronald_vanLoon

Geliştirici, duyguları tahmin edebilen bir AMI oluşturduğunu iddia ediyor: YouTube videosu, ses, video, görüntü gibi çeşitli modaliteleri içeren, duyguları ve olayların diğer yönlerini güvenilir bir şekilde tarayabilen, tahmin edebilen bir AMI (Artificial Molecular Intelligence?) gösterdiğini iddia ediyor. Bu teknolojinin gerçekliği ve spesifik uygulama yöntemi doğrulanmayı bekliyor. (Kaynak: Reddit r/artificial)

Reddit r/artificial

AI benchmark testlerine insan performansı karşılaştırmasının eklenmesi öneriliyor: Reddit kullanıcısı, AI model benchmark testlerinin (Benchmarks), AI’ın göreceli yetenek seviyesini daha sezgisel olarak değerlendirmek için aynı görevlerdeki insanların (sıradan insanlar ve uzmanlar) puanlarını referans olarak içermesini önerdi. (Kaynak: Reddit r/artificial)

Oscar, AI’ın film yapımına katılımını kabul ediyor, ancak kısıtlamalarla: Amerikan Sinema Sanatları ve Bilimleri Akademisi, film yapımında AI araçlarının kullanılmasına izin veren kuralları güncelledi, ancak insan yaratıcılığının hala merkezde olduğunu vurguladı. Kurallar, AI kullanımının ifşası gibi belirli gereklilikleri içerebilir ve sektörün yeni teknolojiyi benimseme ile insan yaratıcılığını koruma arasındaki dengeyi yansıtıyor. (Kaynak: Reddit r/artificial, NYT link)

Reddit r/artificial

Instagram, gençlerin yaşını belirlemek için AI kullanmayı deniyor (Kaynak: Reddit r/artificial, AP News link)

Altman, kullanıcıların ChatGPT’ye “lütfen” ve “teşekkür ederim” demesinin milyonlarca dolara mal olduğunu söylüyor (Kaynak: Reddit r/artificial, QZ link)

İnsansı robot yarı maratonu teknolojik ilerlemeyi ve zorlukları gösteriyor: Dünyanın ilk insansı robot yarı maratonu Pekin’de düzenlendi, “TianGong Ultra” 2 saat 40 dakika ile şampiyon oldu. Yarışma, robotların uzun mesafe, karmaşık arazi, dinamik denge, otonom navigasyon gibi alanlardaki yeteneklerini test etti. Tam boyutlu robotlar daha yüksek zorluklarla (ağırlık merkezi, atalet, enerji tüketimi) karşı karşıya. TianGong Ultra, yüksek güçlü entegre eklemler, düşük ataletli tasarım, verimli ısı dağılımı, öngörücü pekiştirmeli taklit öğrenme kontrol stratejisi ve kablosuz navigasyon teknolojisi sayesinde kazandı. Etkinlik, robotların büyük ölçekli ticari uygulamaya (örneğin endüstri, güvenlik denetimi) geçişi için bir stres testi olarak görüldü ve gövde donanımı, hareket kontrolü, akıllı karar verme gibi temel teknolojilerin doğrulanmasını ve optimize edilmesini teşvik etti. (Kaynak: Machine Heart)

 "TianGong Ultra" yarı maratonu kazandı, insansı robot endüstriyel uygulamaya geçişin ilk engelini aştı

AI kullanarak ünlülerin hareketlerini izleme ve otomatik hatırlatma: Eğitim, belirli Twitter hesaplarının (örneğin Altman’ın) güncellemelerini izlemek için Python betiğinin nasıl kullanılacağını ve yeni bir güncelleme yayınlandığında Lark API aracılığıyla acil telefon araması hatırlatmasının nasıl gerçekleştirileceğini paylaşıyor. Bu yöntem, web kazıma teknolojisini açık platform API çağrılarıyla birleştirerek bilgi aşırı yüklenmesi ve zamanlılık ihtiyacı sorunlarını çözmeyi, kişiselleştirilmiş önemli bilgi erişimini sağlamayı amaçlıyor. AI’ın otomatik bilgi akışı işleme ve kişiselleştirilmiş bildirimler konusundaki uygulama potansiyelini gösteriyor. (Kaynak: Non-mainstream Operations)

AI ile Altman'ı izledim, tweet attığında AI otomatik olarak beni arıyor.

AI bilgi asimetrisinden yararlanarak “aracı” olma iş modeli tartışması: Makale, AI çağında bilgi asimetrisinin hala var olduğunu (araçların yaygınlaşması, teknik engeller, belirsiz senaryolar) ve sıradan insanlar için “AI aracısı” olma fırsatları yarattığını savunuyor. Temel oyun planları şunları içerir: yurtiçi ve yurtdışı AI kaynakları arasındaki fiyat farkından yararlanarak hizmetleri yeniden satmak (örneğin AI boyama), yürütme hizmetleri sunmak (ücretsiz eğitimleri ücretli dağıtıma dönüştürmek, örneğin AI müşteri hizmetleri), ölçekli operasyon (profesyonel hizmetler sunmak için ekip kurmak). Uygun alanlar arasında içerik oluşturma, eğitim, KOBİ ticari hizmetleri, dikey alanlarda profesyonel hizmetler (örneğin sağlık, hukuk) bulunmaktadır. Bilgi asimetrisini bularak, hedef kitleyi belirleyerek ve hızlı hareket ederek başlamanız önerilir. (Kaynak: Zhou Zhi)

Sıradan insanların en hızlı para kazanma yolu, AI'ı aracı olarak kullanmak.