Anahtar Kelimeler:AI, OpenAI, o3 ve o4-mini modelleri, görsel mantık ve araç çağrısı, OpenAI açık kaynak Codex CLI, Google DolphinGemma yunus dili, Zeki ağlar ve MCP protokolü, AI teknolojileri, OpenAI yapay zeka, o3 ve o4-mini model karşılaştırması, görsel veri analizi ve araç entegrasyonu, OpenAI Codex CLI kullanımı, Google DolphinGemma dil modeli, MCP protokolü ile akıllı ağ yönetimi
🔥 Odak Noktası
OpenAI, görsel çıkarım ve araç çağırma yeteneklerini güçlendiren o3 ve o4-mini modellerini yayınladı: OpenAI, yapay zekanın çıkarım yeteneklerini, özellikle görsel alanda önemli ölçüde artıran o3 ve o4-mini adlı iki yeni çıkarım modelini tanıttı. Bu, OpenAI’nin görüntüleri düşünce zincirine entegre ederek çıkarım yapabilen ilk modelleridir; grafikler, fotoğraflar ve hatta elle çizilmiş taslakları yorumlayabilir ve Python, web araması, görüntü oluşturma gibi araçlarla birleştirerek çok adımlı karmaşık görevleri yerine getirebilirler. o3, en güçlü çıkarım modeli olarak konumlandırılmış olup, birçok benchmark testinde rekorlar kırmış, özellikle görsel analizde başarılıdır; o4-mini ise hız ve maliyet optimizasyonu için tasarlanmıştır. Yeni modeller aşamalı olarak eski o1 serisinin yerini alacak ve Plus, Pro, Team ve kurumsal kullanıcılara sunulacaktır. Aynı zamanda OpenAI, hafif programlama Agent’ı Codex CLI’yi açık kaynaklı hale getirdi ve bir milyon dolarlık teşvik programı başlattı. İlk kullanıcı testleri olumlu geri bildirimler veriyor; zeka seviyesinin ve proaktifliğinin önemli ölçüde arttığı belirtiliyor, ancak bazı senaryolarda hala halüsinasyon ve güvenilirlik sorunları mevcut (kaynak: 智东西, 元宇宙之心MetaverseHub, 新智元, 量子位, Reddit r/LocalLLaMA, Reddit r/deeplearning)

Google AI modeli DolphinGemma, yunus dilini çözmeye çalışıyor: Google, yunusların akustik iletişimini anlamayı amaçlayan, Gemma mimarisine dayalı hafif (400M parametre) bir AI modeli olan DolphinGemma’yı tanıttı. Model, ses verilerini kullanarak eğitiliyor, yunus ses kalıplarını öğreniyor ve benzer sesler üretiyor, bu da türler arası ilk iletişimi sağlama potansiyeli taşıyor. Proje, yunusları uzun süredir araştıran WDP (Wild Dolphin Project) ile işbirliği içinde yürütülüyor ve onların on yıllardır biriktirdiği etiketlenmiş veri setlerinden yararlanılıyor. Georgia Tech tarafından geliştirilen CHAT su altı bilgisayar sistemiyle (Pixel 9 tabanlı olacak) birleştirilerek, araştırmacılar basitleştirilmiş ortak bir kelime dağarcığı aracılığıyla yunuslarla etkileşim kurmayı umuyor. Google CEO’su Pichai bunu “türler arası iletişime doğru harika bir adım” olarak nitelendirdi ve modeli açık kaynak yapmayı planlıyor. DeepMind CEO’su Hassabis de gelecekte köpekler gibi yüksek zekalı hayvanlarla iletişim kurmayı umduğunu belirtti (kaynak: 新智元)

Paradigma Kayması: “İnsanların Bağlantısı”ndan “Akıllı Ağ”a ve MCP Protokolüne: İnternet kullanıcı büyümesinin zirveye ulaşmasıyla birlikte, sektörün odak noktası insanları bağlamaktan (insanların bağlantısı) AI akıllı varlıklarını bağlamaya (Akıllı Ağ) kayıyor. AI Agent’lar kullanıcılar adına görevleri yerine getirebilir, hizmetleri çağırabilirken, MCP (Model Context Protocol) gibi açık standartlar farklı modeller ve araçlar arasında birlikte çalışabilirlik için olanak sağlıyor, bu da AI dünyasının “USB-C”sine benziyor. Bu durum, platform güç dengesini yeniden şekillendirebilir, geleneksel trafik giriş noktalarının içerik dağıtımı ve kullanıcı dikkati üzerindeki tekelini zayıflatabilirken, aynı zamanda (protokole bağlanarak “yetenek eklentisi” haline gelirse) sessiz kalan küçük ve orta ölçekli web siteleri ve hizmetler için bir canlanma fırsatı sunabilir. Platform ölçüm metrikleri DAU’dan AAU’ya (Aktif Agent Birimi) kayabilir, içerik arzı UGC’den AIGC’ye yönelebilir, etkileşim GUI’den CUI/API’ye evrilebilir, ToC ve ToB sınırları bulanıklaşarak ToAI ekosistemine doğru ilerleyebilir. Microsoft, Google, OpenAI ve Çin’deki büyük teknoloji şirketleri MCP veya ilgili protokoller konusunda şimdiden adımlar attı (kaynak: 朋克商店)

🎯 Gelişmeler
Volcano Engine, Doubao 1.5 Derin Düşünme Modelini yayınladı: Volcano Engine, MoE mimarisini kullanan, toplam 200B parametreye ve 20B aktif parametreye sahip Doubao 1.5 Derin Düşünme modelini tanıttı. Model, matematik, programlama ve bilim alanlarındaki birçok benchmark testinde öne çıkıyor, bazı testlerde DeepSeek-R1’i geride bırakarak OpenAI o1/o3-mini-high seviyesine yaklaşıyor ve ARC-AGI testinde daha yüksek puan alıyor. Öne çıkan özellikleri arasında “düşünürken arama” (önce arayıp sonra düşünmekten farklı olarak) ve metin ve görüntü bilgilerine dayalı görsel anlama yeteneği bulunuyor. Aynı zamanda metinden görüntü oluşturma modeli 3.0 (2K HD görüntü desteği, metin düzenleme optimizasyonu) ve görsel anlama modeli (konumlandırma, sayma, video anlama yetenekleri geliştirildi) güncellendi. Mart sonu itibarıyla Doubao büyük modelinin günlük ortalama çağrı hacmi 12.7 trilyon token’ı aştı (kaynak: 智东西)

WeChat’e entegre AI asistanı “Yuanbao” kullanıma sunuldu: Tencent Yuanbao APP, bir AI asistanı olarak WeChat’e entegre edildi, kullanıcılar arkadaş olarak ekleyip doğrudan sohbet arayüzünde etkileşim kurabiliyor. Asistan, WeChat senaryoları için optimize edilmiş Hunyuan ve DeepSeek çift modlu motorla donatılmış olup, resmi hesap makalelerini, resimleri, belgeleri (100M içinde) analiz etmeyi, akıllı soru-cevap ve günlük etkileşimleri destekliyor. Karmaşık yanıtlar Yuanbao APP’ye yönlendiriliyor. Bu, AI arama gri testinden sonra WeChat’in AI yeteneklerini temel konuşma senaryolarına daha doğal bir şekilde entegre etme yolunda attığı önemli bir adımdır. Tencent son zamanlarda Yuanbao’nun tanıtımına ve hesaplama gücü yatırımına ağırlık vererek AI’ı önemli bir stratejik yön olarak görüyor (kaynak: 界面新闻, 华尔街见闻)

Alibaba Tongyi Qianwen, Omdia tarafından Çin’in ticari büyük model rekabetçiliğinde birinci seçildi: Uluslararası araştırma kuruluşu Omdia, “2025 Yılı Çin Ticari Büyük Modelleri” raporunu yayınladı ve Alibaba Cloud Tongyi Qianwen üst üste ikinci kez lider olarak değerlendirildi ve genel rekabetçilik, model yeteneği ve yürütme yeteneği olmak üzere üç ana boyutta da birinci sırada yer aldı. Rapor, Alibaba’nın model teknolojisi, açık kaynak ekosistemi inşası (Qwen serisi modellerin küresel indirme sayısı 200 milyonu aştı, türetilmiş modeller 100 bini geçti) ve ticarileştirme (MaaS stratejisi) konularındaki lider konumunu onayladı. Daha önce Stanford AI Index raporu da Alibaba’yı küresel olarak önemli model yayınlama sayısında üçüncü, Çin’de ise birinci kurum olarak listelemişti. Alibaba, AI bulut altyapısına sürekli yatırım yapıyor ve önümüzdeki üç yıl içinde 380 milyar yuan’dan fazla yatırım yapmayı planlıyor (kaynak: 乌鸦智能说)

Alibaba ve ByteDance’in AI akıllı gözlükler üzerinde çalıştığı söyleniyor: Baidu, Xiaomi gibi şirketlerin ardından Alibaba ve ByteDance’in de AI akıllı gözlükler geliştirdiği bildiriliyor. Alibaba projesi Tmall Genie ekibi tarafından yönetiliyor, Quark AI yeteneklerini entegre ediyor ve ekranlı ve ekransız olmak üzere iki versiyon sunmayı planlıyor; donanım olarak Qualcomm + Hengxuan çift çip çözümü kullanılabilir. ByteDance projesi Pico ekibi tarafından yönetiliyor, Doubao büyük modelini entegre ediyor ve muhtemelen ilk olarak yurtdışında piyasaya sürülecek. Devlerin teknoloji, sermaye ve ekosistem avantajlarıyla pazara girmesi, pazar gelişimini hızlandırabilir ancak donanım geliştirme deneyiminin nispeten yetersiz olması gibi zorluklarla da karşı karşıya. Bu hamle, akıllı gözlük rekabetini donanım parametrelerinden ekosistem hizmetlerine kaydırabilir ve Rokid, RayNeo gibi mevcut üreticiler için baskı ve fırsatlar yaratabilir (kaynak: 科技新知)

Google, AI kullanarak kötü amaçlı reklam engelleme verimliliğini önemli ölçüde artırdı: Google, 2024 yılında güncellenmiş AI modellerini (LLM’ler dahil) kullanarak reklam politikası uygulamasını güçlendirdi ve 39,2 milyon kötü amaçlı reklamveren hesabını başarıyla askıya aldı; bu, 2023’ün üç katından fazla. AI modelleri, reklam yaptırımlarının %97’sine katıldı ve sürekli değişen dolandırıcılık taktiklerini daha hızlı tespit edip işleyebiliyor. Bu hamle, reklam ağı kötüye kullanımı, sahte beyanlar, ticari marka ihlali ve AI tarafından oluşturulan deepfake dolandırıcılığı gibi sorunlarla mücadele etmeyi amaçlıyor. Hala gözden kaçan kötü niyetli reklamlar olsa da (küresel olarak 5,1 milyar reklam kaldırıldı), hesapları kaynağında engelleyerek genel etki önemli ölçüde arttı. Google, insanların hala süreçte olduğunu vurguluyor, ancak AI uygulaması büyük ölçekli reklam güvenliğinin anahtarı haline geldi (kaynak: Reddit r/ArtificialInteligence)

MIT, protein parçalarının bağlanmasını tahmin eden AI sistemi geliştirdi: MIT araştırmacıları, hangi protein parçalarının (peptitler) hedef proteinlere bağlanabileceğini veya işlevlerini engelleyebileceğini tahmin edebilen bir AI sistemi geliştirdi. Bu, ilaç keşfi ve biyoteknoloji için önemli bir anlam taşıyor ve yeni tedavi yöntemleri veya teşhis araçları tasarlamaya yardımcı oluyor. Sistem, potansiyel bağlanma yeteneğine sahip kısa peptit dizilerini belirlemek için protein yapısı ve etkileşim verilerini analiz etmek üzere makine öğrenimini kullanıyor (kaynak: Ronald_vanLoon)

Grok, konuşma hafızası özelliği ekledi: X platformunun AI asistanı Grok, kullanıcının geçmiş konuşma içeriğini hatırlayabilen yeni bir hafıza özelliği eklediğini duyurdu. Bu, Grok’un sonraki etkileşimlerde daha kişiselleştirilmiş ve tutarlı yanıtlar, öneriler veya tavsiyeler sunarak kullanıcı deneyimini iyileştireceği anlamına geliyor (kaynak: grok)
Google, Agent’lar arası iletişim için açık protokol duyurdu: Google, farklı yapay zeka aracılarının (AI agent’lar) birbirleriyle iletişim kurmasını ve işbirliği yapmasını sağlamayı amaçlayan açık bir protokol başlattığını duyurdu. Bu, MCP (Model Context Protocol) hedefine benzer şekilde, AI uygulamaları arasındaki engelleri kaldırmayı ve daha karmaşık, entegre AI iş akışları ve uygulama ekosistemlerinin oluşumunu teşvik etmeyi amaçlıyor (kaynak: Ronald_vanLoon)

🧰 Araçlar
ChatGPT görüntü oluşturma işlevi ayarlandı: Kullanıcılar, ChatGPT arayüzünün altındaki “Create Image” düğmesinin kaldırıldığını fark etti, ancak açık resim çizme istemleri veya belirli önekler (örneğin “Lütfen resim oluştur:”) aracılığıyla desteklenen modellerde (GPT-4o, o3, o4-mini gibi) görüntü oluşturma işlevi hala çağrılabiliyor. GPT-4.5 ve o1 pro modelleri şu anda bu yöntemle resim oluşturmayı desteklemiyor (kaynak: dotey)

JetBrains IDE, ücretsiz yerel LLM kod tamamlama entegrasyonu sunuyor: JetBrains, AI Assistant’ının önemli bir güncelleme aldığını duyurdu; IDE ürünlerinde (Rider gibi) sınırsız kod tamamlama dahil olmak üzere ücretsiz bir AI işlev katmanı sunuyor ve yerel LLM modellerinin entegrasyonunu destekliyor. Bu hamle, AI destekli geliştirme eşiğini düşürmeyi amaçlıyor. Aynı zamanda, ücretli AI Pro ve AI Ultimate katmanları daha gelişmiş özellikler ve bulut modellerine (GPT-4.1, Claude 3.7, Gemini 2.0 gibi) erişim sunuyor (kaynak: Reddit r/LocalLLaMA)
HypernaturalAI: İçerik pazarlaması gibi senaryolarda verimliliği ve yaratıcılığı artırmayı amaçlayan profesyonel içerik oluşturma için bir AI aracı (kaynak: Ronald_vanLoon)
Kling 2.0 video oluşturma gösterimi: Kullanıcı, Kuaishou tarafından sunulan video oluşturma modeli Kling 2.0 kullanılarak yapılan video kliplerini paylaşarak oluşturma efektini sergiledi (kaynak: op7418)
Cihaz üzerinde AI benchmark testi için Cactus framework’ü: Cactus, AI modellerini kenar cihazlarda (telefonlar, dronlar vb.) internet bağlantısı olmadan verimli bir şekilde çalıştırmayı amaçlayan bir framework’tür. Geliştiriciler, farklı modellerin (Gemma 1B, SmollLM gibi) çeşitli telefonlardaki çalışma hızını (tokens/sn) test etmek için Cactus tabanlı bir sohbet uygulaması demosu yayınladı ve kullanıcıların test etmesi için indirme bağlantısı sağladı (kaynak: Reddit r/deeplearning)

OpenWebUI hibrit AI iş akışı uygulaması: Kullanıcı, ön uç olarak Open WebUI kullanarak hibrit bir AI iş akışı oluşturma başarı öyküsünü paylaştı. Bu iş akışı, kullanıcı sorununa göre otomatik olarak yapılandırılmış SQL sorgusuna (LangChain SQL Agent aracılığıyla DuckDB üzerinde işlem yaparak) veya vektör veritabanına (Pinecone) semantik arama için yönlendirme yapabiliyor ve nihai yanıtı oluşturmak için Gemini Flash’ı kullanarak hızlı yanıt veriyor (kaynak: Reddit r/OpenWebUI)
OpenWebUI bilgi tabanı ve API kullanımı sorunları: Reddit kullanıcıları, OpenWebUI’de bilgi tabanı (RAG) işlevini kullanırken karşılaşılan sorunları tartışıyor; belgelerin web sayfası yüklemesi yerine sunucu dizinine nasıl yönlendirileceği ve dosya senkronizasyonu için API aracılığıyla bilgi tabanındaki dosya kimliklerinin nasıl alınacağı ve yönetileceği dahil (kaynak: Reddit r/OpenWebUI, Reddit r/OpenWebUI)
OpenWebUI ve MCP sunucusu entegrasyonu için yardım talebi: Kullanıcı, Karakeep MCP sunucusunu yerel olarak kurup OpenWebUI ile entegre etme konusunda yardım istiyor ve zorluklarla karşılaşıyor (kaynak: Reddit r/OpenWebUI)

OpenWebUI aracılığıyla Grok3’ün düşünme modunu kullanma: Kullanıcı, Grok API’sini OpenWebUI’ye bağlarken Grok3’e özgü “Think” veya “Deepsearch” modunu etkinleştirmenin bir yolu olup olmadığını soruyor (kaynak: Reddit r/OpenWebUI)
📚 Öğrenme
LLM hedef odaklılık araştırması: DeepMind araştırmacıları, LLM’lerin görevleri yerine getirirken potansiyel olarak yeteneklerini tam olarak kullanmama sorununu araştırdı. Alt görev değerlendirmesi kullanarak, LLM’lerin genellikle sahip oldukları yetenekleri tam olarak kullanamadıklarını, yani tamamen “hedef odaklı” olmadıklarını buldular. Bu araştırma, LLM’lerin iç mekanizmalarını ve sınırlamalarını anlamaya yardımcı oluyor (kaynak: GoogleDeepMind)

Öncü AI modellerinin fiziksel görevlerdeki sınırlamaları: İmalat vaka incelemesine yönelik bir araştırma, mevcut öncü AI modellerinin (multimodal modeller dahil) basit fiziksel görevleri (pirinç parça üretimi gibi) yerine getirmede, özellikle görsel tanıma ve mekansal anlama konularında önemli kusurlarla düşük performans gösterdiğini ortaya koydu. Gemini 2.5 Pro nispeten en iyisi olsa da hala büyük bir fark var. Bu, AI’ın fiziksel dünyadaki uygulamalarının dijital dünyadakinden geri kalabileceğini ve mekansal anlama ile örneklem verimliliğini artırmak için yeni mimarilere veya eğitim yöntemlerine ihtiyaç duyulduğunu gösteriyor (kaynak: Reddit r/MachineLearning)
Araştırma, AI’ın kod hata ayıklama konusunda yetersiz olduğunu buldu: AI’ın kod üretme konusunda ilerleme kaydetmesine rağmen, bir araştırma mevcut AI’ın kod hata ayıklamada düşük performans gösterdiğini ve henüz insan programcıların yerini alamayacağını belirtiyor. Ancak bazı geliştiriciler LLM’lerin belirli sorunları ayıklamada çok yararlı olduğunu düşünüyor (kaynak: Reddit r/artificial)

Yerel LLM performans optimizasyonu pratiği: Çift 3090 üzerinde Qwen2.5-7B ile 5000 t/s: Kullanıcı, iki adet RTX 3090 ekran kartında yerel LLM çıkarım hızını optimize etme deneyimini paylaştı. Qwen2.5-7B modelini seçerek, W8A8 niceleme kullanarak ve Aphrodite motorunu kullanarak, eşzamanlı istek sayısını ayarlayarak (max_num_seqs=32), yaklaşık 5k bağlam uzunluğunda saniyede yaklaşık 4500 token prompt işleme hızı ve saniyede yaklaşık 825 token üretim hızına ulaştı. Bu, yerel olarak büyük miktarda veri işlemesi gereken araştırmalar veya uygulamalar için performans optimizasyonu referansı sağlıyor (kaynak: Reddit r/LocalLLaMA)
Yeni dikkat mekanizması CALA yayınlandı: Bir araştırmacı, “Bağlam Toplanmış Lineer Dikkat” (Context-Aggregated Linear Attention, CALA) adını verdiği yeni dikkat mekanizması makalesinin ilk taslağını yayınladı. CALA, lineer dikkatin O(N) verimliliğini, “yerel bağlam toplama” adımı ekleyerek artırılmış yerel algılama yeteneğiyle birleştirmeyi amaçlıyor. Makale, tasarımını, diğer dikkat mekanizmalarına göre yenilikçi noktalarını ve O(N) verimliliği için gereken karmaşık optimizasyonları (CUDA çekirdek füzyonu gibi) tartışıyor. Araştırmacı, topluluğun sonraki doğrulama ve geliştirmeye katılmasını umuyor (kaynak: Reddit r/MachineLearning)
![[P] Bugün, açık kaynak topluluğuna geri vermek için ilk makalemi yayınlıyorum - yeni bir dikkat mekanizması, Bağlam Toplanmış Lineer Dikkat veya CALA.](https://rebabel.net/wp-content/uploads/2025/04/yIc61XmsPqdJ02d1eyWbLo9h4fZ3ORdzypEFu1tSkN4.jpg)
Claude 3.7 Sonnet kullanarak kelime aşinalığını değerlendirme: Kullanıcı, Wiktionary’deki İngilizce kelimeler ve ifadeler için bir aşinalık puanı veri seti (10 yaş üstü Amerikalıların bilişsel oranını tahmin ederek) oluşturmak üzere API aracılığıyla Claude 3.7 Sonnet’i çağırmak için yaklaşık 300 dolar harcadı. Kullanıcı, Sonnet’in bu görevde diğer üst düzey modellerden daha iyi performans gösterdiğini, günlük dil ile profesyonel terimleri daha iyi ayırt edebildiğini düşünüyor. Proje kodu ve veri seti açık kaynaklı hale getirildi, ancak kullanıcı maliyetin yüksekliğinden yakınıyor ve daha ekonomik yöntemler arıyor (kaynak: Reddit r/ClaudeAI)

💼 İş Dünyası
AI arkadaşlık uygulamaları pazarında soğuma, reklam harcamaları ve indirme sayıları düşüşte: DataEye Araştırma Enstitüsü verilerine göre, Xingye, Maoxiang, Zhumengdao gibi sosyal AI arkadaşlık uygulamaları 2025 başında pazar soğuması yaşadı; indirme sayıları ve reklam harcamaları önemli ölçüde düştü, bazı ürünlerin reklam harcamaları yarı yarıya, hatta daha fazla azaldı. Analizlere göre nedenler şunlar: 1) AI endüstrisinin stratejik odağının DeepSeek gibi derin düşünme büyük modellerine ve AI asistanlarına kayması, sosyal AI’ın öneminin azalması; 2) Ürünlerin birbirine çok benzemesi, kullanıcıların ilgisinin azalması; 3) Yaygın olan abonelik üyelik iş modelinin çekiciliğinin yetersiz olması. Makale, sosyal AI’ın temel değerini (duygusal değer güçlü, rasyonel değer idare eder, fizyolojik değer zayıf) tartışıyor ve gelecekteki yönün duygusal iyileşmeye odaklanmak veya AI arkadaşlık terminalleri geliştirmek olabileceğini belirtiyor (kaynak: DataEye应用数据情报)

Zhipu AI, “büyük model alanında halka arza açılan ilk şirket” olmak için halka arz sürecini başlattı: Tsinghua kökenli AI şirketi Zhipu AI (Zhipu AI), birden fazla finansman turunun (yakın zamanda Hangzhou ve Zhuhai devlet sermayesinden 1,5 milyar yatırım dahil) ardından Nisan ayında halka arz sürecini başlattı. Makale, şirketin avantajlarını teknolojik geçmişi (Tsinghua geni), stratejik konumu (özerk ve kontrol edilebilir, ABD tarafından listeye alındı) ve güçlü yatırımcıları (erken aşamada Dachen Venture Capital, orta aşamada Tencent, Ant Group, Sequoia, Saudi Aramco, yakın zamanda çeşitli yerel devlet sermayeleri) olarak analiz ediyor. Bu zamanda IPO yapma kararının, DeepSeek gibi düşük maliyetli modellerin etkisi altında, sektördeki konumunu sağlamlaştırmak için “büyük model alanında halka arza açılan ilk şirket” konumunu yakalama stratejisi olduğu düşünülüyor; aynı zamanda yatırımcıların (özellikle halka arzı teşvik eden yerel devlet sermayelerinin) getiri beklentilerini karşılıyor. Zhipu AI bu yıl birden fazla model yayınlamayı planlıyor ve hala “çok para harcayan bir yıl” olacak, halka arz finansman ve değerleme sorunlarını çözmeye yardımcı olacak (kaynak: 真故研究室)

AI 1.0 döneminin Tsinghua Yao Sınıfı girişimcileri yeniden yola çıkıyor: Makale, Tsinghua Yao Sınıfı mezunu girişimcilerin (Megvii’den Yin Qi, Pony.ai’den Lou Tiancheng gibi) AI 1.0 dönemindeki (yüz tanıma, otonom sürüş vb.) girişimcilik yolculuklarını inceliyor; erken dönemde teknolojik fırsatları yakalama, sermaye ilgisi görme, ancak ticarileşme zorlukları, artan rekabet, IPO engelleri gibi zorluklarla karşılaşmalarını içeriyor. AI 2.0 (büyük modeller, somutlaşmış yapay zeka) dalgasının yükselişiyle birlikte, bu “dahi gençler” tekrar girişimciliğe atılıyor; örneğin Yin Qi akıllı arabalara (Qianli Technology) yöneliyor, Megvii’nin eski çalışanı Fan Haoqiang somutlaşmış yapay zeka şirketi Yuanli Lingji’yi kuruyor. “Keşfedilmemiş alanlara” meydan okuma Yao Sınıfı genini sürdürüyorlar, yeni teknoloji döngüsünde atılım yapmaya çalışıyorlar, ancak daha şiddetli rekabet ve ticarileşme zorluklarıyla da karşı karşıyalar (kaynak: 直面AI)

Wu Zhao, DingTalk’a geri dönerek reformları uyguluyor, ürün ve müşteri deneyimini vurguluyor: DingTalk kurucusu Chen Hang (Wu Zhao) geri döndükten sonra hızla iç düzenlemeleri başlattı. Ürün ve müşteri deneyimini en ön sıraya koydu, ürün-araştırma-tasarım ekiplerinin ürün deneyimi yolculuğunu tamamen gözden geçirmesini, rakiplerle karşılaştırmasını istedi ve geri bildirim almak için bizzat ekiple birlikte müşterileri “gizli ziyaret” tarzında ziyaret etti, “ortak yaratım” modunu yeniden başlattı. Ticarileşme konusunda, tüm ücretli yolları araştırmayı talep etti, bazı ödeme duvarları kaldırıldı veya düzenlendi, bu da ticarileşme hedeflerinin ürün deneyimi ve AI inovasyonunun gerisine düştüğünü gösteriyor. Yönetimde, iş disiplinini düzenledi (örneğin saat 9’da işe başlama zorunluluğu), yöneticilerin örnek olmasını, sahaya inmesini vurguladı, sadece yönetici olanlara karşı çıktı, raporlama süreçlerini basitleştirdi (PPT yapmama) ve maliyetleri kontrol etti (kaynak: 智能涌现)

Bocha AI: DeepSeek’in arkasındaki AI arama hizmeti sağlayıcısı, Bing’e meydan okuyor: Bocha AI, DeepSeek ve Çin’deki AI uygulamalarının %60’ından fazlasına internet bağlantılı arama API hizmeti sağlıyor. CEO Liu Xun, AI arama ile geleneksel arama arasındaki teknik farkları (vektör indeksleme, semantik sıralama, üretken entegrasyon) açıkladı ve hizmetlerinin yalnızca bir ara halka olduğunu vurguladı. Bocha AI’nin temel rekabet gücü veri işleme, kendi geliştirdiği yeniden sıralama modeli, yüksek eşzamanlılık düşük gecikmeli mimari, maliyet avantajı (Bing fiyatının yaklaşık 1/3’ü) ve veri uyumluluğunda yatıyor. Liu Xun, AI aramanın geleneksel aramanın teklifli sıralama modelini sarsacağını ve şirketleri SEO’dan GEO’ya (içerik kalitesine ve bilgi tabanı oluşturmaya daha fazla odaklanma) yönelteceğini düşünüyor. Sadece AI arama uygulaması yapmanın (Perplexity gibi) iyi bir alan olmadığını, kar modelinin belirsiz olduğunu, Bocha AI’nin ise AI’a arama yeteneği sağlayan bir altyapı olarak konumlandığını ve AGI geliştirme maliyetini düşürmeyi hedeflediğini belirtiyor (kaynak: 腾讯科技)

🌟 Topluluk
AI Uçurumu ve Siyasi Ayrışma: Neden “AI’dan en çok nefret edenler Trump’ı seçti”?: Makale, Trump’ın bazı destekçilerinin, örneğin geleneksel tarım eyaletlerindeki çiftçiler ve Rust Belt (Pas Kuşağı) işçilerinin, AI otomasyonundan etkilenen, teknoloji kazanımlarından pay alamayan ve dışlanmış hisseden gruplar olduğunu analiz ediyor. Mevcut durumdan memnuniyetsizler ve Trump’ın MAGA vaatlerine (imalatın geri dönmesi, teknoloji devlerinin sınırlandırılması gibi) umut bağlıyorlar. Makale, bu grupların zorluklarının teknolojik değişimin getirdiği ekonomik yapısal ayarlamalar ve beceri uçurumundan kaynaklandığını, Trump yönetiminin politikalarının (gümrük duvarları, yetersiz AI temel eğitimi gibi) ise sorunu gerçekten çözmek yerine durumu daha da kötüleştirebileceğini belirtiyor. Yazar, Çin’in AI’ın yaygınlaştırılması (Doğu Verisi Batı Hesabı projesi, endüstriyel AI güçlendirmesi, ücretsiz büyük modeller, AI temel eğitimi gibi) konusundaki çabalarını karşılaştırarak, tüm halkın teknoloji kazanımlarını paylaşmasını sağlamayı ve toplumsal bölünmeyi önlemeyi amaçladığını vurguluyor (kaynak: 脑极体)

Topluluğun o3 programlama yeteneği hakkındaki görüşleri farklı: Aider Leaderboard güncellendikten sonra o3 programlama yeteneği puanını gösterdi, ancak bir kullanıcı (karminski3) bu sonucun kendi test deneyimiyle uyuşmadığını belirtti ve daha fazla kişinin deneyip geri bildirimde bulunmasını önerdi. Bu, topluluğun yeni model yeteneklerinin değerlendirilmesinde farklı bakış açıları ve tartışmaların olduğunu, tek bir benchmark’ın gerçek kullanım deneyimini tam olarak yansıtmayabileceğini gösteriyor (kaynak: karminski3)

Kullanıcı, OpenAI’nin yeni modelinin Çince sorularda zekasının düştüğünü fark etti: Kullanıcı op7418, OpenAI’nin yeni yayınladığı o3 ve o4-mini modellerine Çince soru sorduğunda, modelin İngilizce soru sormaya göre belirgin şekilde daha kötü performans gösterdiğini, özellikle görüntü çıkarımı gerektiren görevlerde Çince soruların görüntü analiz yeteneğini tetiklemiyor gibi göründüğünü bildirdi. Kullanıcı, OpenAI’nin Çince girdilere kısıtlama getirmiş veya yeterince optimize etmemiş olabileceğini tahmin ediyor (kaynak: op7418)

Kullanıcı deneyimi: o3 ile DALL-E birleştirildiğinde resim oluşturma efekti daha iyi: Kullanıcı op7418, ChatGPT’de o3 modelini kullanarak görüntü oluşturmayı (muhtemelen DALL-E 3) çağırdığında, etkinin doğrudan oluşturmaktan daha iyi olduğunu, özellikle modelin arka plan bilgisini (belirli bir roman sahnesi gibi) anlamasını gerektiren karmaşık kavramlar için daha iyi olduğunu fark etti. o3 önce metin içeriğini anlayıp sonra daha uygun bir görüntü oluşturabiliyor (kaynak: op7418)

Kullanıcı, ChatGPT içerik kısıtlamalarını aşarak resim oluşturmayı paylaştı: Reddit kullanıcısı, “yönlendirme” veya istemleri aşamalı olarak detaylandırma yoluyla ChatGPT’nin (DALL-E 3) içerik kısıtlamalarını aşarak kuralları ihlal etmeyen ancak yakın olan resimler (mayo gibi) oluşturduğunu paylaştı. Yorum bölümünde bu yöntemin püf noktaları ve AI içerik kısıtlamalarının makuliyeti hakkındaki görüşler tartışıldı (kaynak: Reddit r/ChatGPT)
Topluluğun OpenAI yeni model lansmanına tepkisi: Açık kaynak eksikliğine dikkat çekiliyor: OpenAI’nin o3 ve o4-mini’yi yayınlamasını tartışan Reddit başlığında, birçok yorum OpenAI’nin kapalı kaynak yolunda ısrar etmesinden duyulan memnuniyetsizliği dile getirdi; bunun topluluk ve araştırmacılar için sınırlı anlam taşıdığını ve yerel olarak dağıtılabilen açık kaynaklı modeller yayınlamasını beklediklerini belirtti (kaynak: Reddit r/LocalLLaMA)
AI’ın beklenmedik kullanımları: Topluluk paylaşımları: Reddit kullanıcısı, AI’ın ana akım dışı ancak pratik kullanım örneklerini topladı. Yanıtlar arasında şunlar yer aldı: AI’ı psikoterapi için kullanma, müzik teorisi öğrenme, röportaj kayıtlarını düzenleme ve hikaye kurgusu oluşturma, DEHB hastalarının görev önceliklerini planlamasına yardımcı olma, çocuklar için kişiselleştirilmiş doğum günü şarkıları besteleme gibi örnekler, AI’ın günlük yaşamda ve belirli ihtiyaç senaryolarındaki geniş potansiyelini gösteriyor (kaynak: Reddit r/ArtificialInteligence)
Topluluk mizahı: Nvidia model adlandırması ve Llama 2 ile dalga geçme: Reddit kullanıcısı, Nvidia’nın yeni model adlarının karmaşık ve hatırlanması zor olduğunu mizahi bir dille eleştiren bir gönderi paylaştı ve Llama 2’nin bir sıralamada zirvede yer aldığını ironik bir dille göstererek benchmark testlerinin değişkenliği ve topluluğun yeni ve eski modellere bakış açısıyla dalga geçti (kaynak: Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

Kullanıcı Claude Max ile ChatGPT Pro arasında kararsız: OpenAI o3’ü yayınladıktan sonra, bir kullanıcı Reddit’te Claude Max’e mi yoksa ChatGPT Pro’ya mı abone olacağı konusunda kararsız olduğunu belirtti; o3’ün güçlü o1’in bir iyileştirmesi olabileceğini ve mevcut modelleri geçebileceğini düşündüğünü söyledi. Yorum bölümünde Claude’un son zamanlarda karşılaştığı hız sınırlamaları, performans sorunları ve kodlama gibi belirli senaryolardaki avantaj ve dezavantajları tartışıldı (kaynak: Reddit r/ClaudeAI)
Topluluk mizahı: AI ve kullanıcı etkileşimiyle dalga geçme: Reddit kullanıcısı, AI’ın duyguları veya bilinci olup olmadığı hakkında bir şaka gönderisi paylaştı ve bu, topluluk üyeleri arasında AI’ın insanlaştırılması ve kullanıcı beklentileri hakkında hafif bir tartışma başlattı (kaynak: Reddit r/ChatGPT)

Kullanıcı Claude kapasite sınırlaması nedeniyle yanıtların kaybolmasından şikayetçi: Reddit kullanıcısı, Anthropic Claude modelinden duyduğu memnuniyetsizliği dile getirdi; modelin tam ve yararlı bir yanıt ürettikten sonra “kapasite aşıldı” nedeniyle içeriği silmesinin kullanıcıya büyük bir hayal kırıklığı yaşattığını belirtti. Bu, mevcut bazı AI hizmetlerinin kararlılık ve kullanıcı deneyimi açısından hala sorunları olduğunu yansıtıyor (kaynak: Reddit r/ClaudeAI)
Claude modelinin LiveBench sıralamasındaki ani düşüş şüphe uyandırdı: Kullanıcı, Claude Sonnet serisi modellerin programlama benchmark testi LiveBench’teki sıralamasının aniden önemli ölçüde düştüğünü, OpenAI modellerinin sıralamasının ise yükseldiğini fark etti. Bu durum, benchmark testinin güvenilirliği ve arkasında çıkar çatışması olup olmadığı konusunda tartışmalara yol açtı. Topluluk üyeleri bu durum karşısında şaşkınlık yaşadı ve test yöntemlerinde değişiklik veya modelin gerçek performansında dalgalanma gibi nedenler olabileceğini düşündü (kaynak: Reddit r/ClaudeAI)
Kullanıcı AI tarafından oluşturulan oyun karakteri selfielerini sergiledi: Reddit kullanıcısı, tanınmış video oyunu karakterleri için ChatGPT (DALL-E 3) kullanarak oluşturduğu bir dizi “selfie” paylaştı ve AI’ın karakter özelliklerini anlama ve yaratıcı görüntüler oluşturma yeteneğini sergiledi. Yorum bölümündeki kullanıcılar da kendi sevdikleri karakterlerin selfielerini oluşturarak ilginç bir etkileşim yarattı (kaynak: Reddit r/ChatGPT)
AI yöneticilerin yerini alabilir mi? Toplulukta hararetli tartışma: Reddit’te AI’ın neden yüksek maaşlı yöneticiler yerine öncelikle alt düzey beyaz yakalıların yerini aldığı tartışıldı. Görüşler arasında şunlar yer aldı: AI’ın şu anki yetenekleri yöneticilerin karmaşık karar alma süreçleri için yetersiz; güç yapısı, değiştirme kararını yöneticilerin elinde tutmasını sağlıyor; AI’ın yöneticilerin yerini alması daha acımasız verimlilik odaklı kararlara yol açabilir ve bu çalışanlar için mutlaka iyi olmayabilir; ayrıca AI yönetişimi ve kontrolü konusundaki endişeler (kaynak: Reddit r/ArtificialInteligence)
AI özetleme araçları kritik “ilham anlarını” yakalamakta zorlanıyor: Kullanıcı Reddit’te, uzun podcast’leri veya videoları özetlemek için AI araçlarını (Gemini veya Chrome eklentisi gibi) kullandığında genellikle ana noktaları alabildiğini, ancak sık sık kısa ama son derece ilham verici “altın sözleri” veya kritik anları kaçırdığından şikayet etti. Kullanıcı, geri bildirim sağlayarak özetleme etkisini iyileştirip iyileştiremeyeceğini düşündü ve başkalarının da benzer deneyimleri olup olmadığını sordu (kaynak: Reddit r/artificial)
Topluluk OpenAI yayınlama stratejisinden memnuniyetsizliğini dile getirdi: Reddit kullanıcısı, OpenAI’nin son yayınlarını (o3/o4-mini, Codex CLI gibi) eleştiren bir gönderi paylaştı; teknolojinin özünde bilinen yöntemlerin ölçeklendirilmiş uygulaması olduğunu, köklü bir yenilik olmadığını, kapalı kaynak ürünleri aşırı pazarladığını, açık kaynak topluluğuna yeterince katkıda bulunmadığını, gerçek öğrenme değeri sunmadığını, daha çok ticari çıkarlara hizmet ettiğini ve bunun sıkıcı olduğunu belirtti (kaynak: Reddit r/LocalLLaMA)

ChatGPT beklenmedik bir şekilde kullanıcının beş yıllık temporomandibular eklem bozukluğunu (TMJ) “iyileştirdi”: Bir Reddit kullanıcısı şaşırtıcı bir deneyim paylaştı: Beş yıldır kendisini rahatsız eden çene eklemi tıklaması (TMJ semptomu), ChatGPT’nin önerdiği basit bir egzersizi (ağzı açıp kapatırken dili damağa dayayarak simetriyi koruma) denedikten sonra sadece yaklaşık bir dakika içinde kayboldu ve etkisi devam etti. Kullanıcı daha önce doktora gitmiş ve MRI çektirmiş ancak sonuç alamamıştı. Bu vaka, toplulukta AI’ın geleneksel olmayan ancak etkili sağlık önerileri sunma potansiyeli hakkında tartışmalara yol açtı (kaynak: Reddit r/ChatGPT)
💡 Diğer
Kissinger’ın AI gelişimi üzerine düşünceleri: İnsanlık en büyük kısıtlama olabilir: Merhum düşünür Henry Kissinger ve diğerleri bir makalede AI’ın gelecekteki gelişim olasılıklarını tartıştılar; planlama yeteneği kazanma, “gerçeklikle bağlantı” (gerçeklikle güvenilir ilişki), hafıza ve nedensellik anlayışı, hatta başlangıç düzeyinde öz farkındalık geliştirme dahil. Makale, AI yetenekleri arttıkça insanlığa bakış açısının değişebileceği konusunda uyarıyor; özellikle insanlar AI karşısında pasiflik gösterdiğinde, dijital dünyaya bağımlı hale gelip gerçeklikten koptuğunda, AI insanlığı gelişimin bir ortağı yerine bir kısıtlaması olarak görebilir. Makale ayrıca AI’a maddi form ve özerk hareket yeteneği vermenin derin etkilerini ve genel yapay zekanın (AGI) internete bağlandıktan sonra getirebileceği bilinmeyen zorlukları tartışıyor, insanlığı kadercilik veya inkarcılık yerine aktif olarak uyum sağlamaya çağırıyor (kaynak: 腾讯研究院)
AI destekli robot uygulamaları gösterimi: Sosyal medyada AI tarafından desteklenen veya yardımcı olunan çeşitli robot uygulama örnekleri sergilendi; bunlar arasında Google DeepMind tarafından geliştirilen masa tenisi oynayabilen robot, hassas işlemler yapabilen (bıldırcın yumurtası zarını ayırma, elmas yerleştirme, keskiyle sanat eseri yaratma gibi) mekanik kollar ve garip görünümlü robotlar (robot köpek, kablosuz kontrollü böcek robotu, Mecanum tekerlekleri kullanarak hareket eden robot gibi) yer alıyor. Bu örnekler, AI’ın robotların algılama, karar verme ve kontrol yeteneklerini artırmadaki ilerlemesini gösteriyor (kaynak: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)
AI’ın sağlık alanındaki uygulamaları üzerine tartışmalar: Sosyal medyada AI’ın sağlık alanındaki uygulamalarıyla ilgili birçok makale ve tartışmaya değinildi; odak noktaları arasında AI’ın sağlık hizmeti sağlayıcılarının toplumsal değişimlere uyum sağlamasına nasıl yardımcı olabileceği, üretken AI’ın sağlık alanındaki inovasyon potansiyeli ve belirli uygulama yönleri yer alıyor (kaynak: Ronald_vanLoon, Ronald_vanLoon)

AI destekli kavramsal teknoloji gösterimi: Sosyal medyada AI ile entegre edilmiş bazı kavramsal teknolojiler veya ürünler sergilendi; örneğin AI destekli otonom uçan araba konsepti ve gelecekteki perakende senaryolarında AI’ın oynayabileceği roller (kaynak: Ronald_vanLoon, Ronald_vanLoon)
ABD toplum kolejleri “robot öğrenci” akınıyla mücadele ediyor: Haberlere göre, ABD toplum kolejleri robotlar (muhtemelen AI tarafından yönlendirilen) tarafından gönderilen çok sayıda sahte kayıt başvurusuyla karşı karşıya; bu durum okulların kayıt ve yönetim sistemleri için zorluklar yaratıyor ve okullar çözüm bulmaya çalışıyor (kaynak: Reddit r/artificial)

OpenAI’nin GPT-4.1’i güvenlik raporu olmadan yayınlaması dikkat çekti: Teknoloji medyası, OpenAI’nin GPT-4.1’i yayınlarken önceki yeni model lansmanlarında olduğu gibi ayrıntılı bir güvenlik değerlendirme raporu sunmadığını bildirdi. OpenAI tarafı, modelin mevcut teknolojiye dayandığını ve risklerin kontrol edilebilir olduğunu düşünebilir, ancak bu hamle AI güvenliği şeffaflığı ve sorumluluğu hakkında tartışmalara yol açtı (kaynak: Reddit r/artificial)

AGI gelişiminin hızlanması ve güvenlikteki gecikme endişe yaratıyor: Makale, yapay zeka endüstrisinin genel yapay zekaya (AGI) ulaşma konusundaki beklenti zaman çizelgesinin kısaldığını, ancak aynı zamanda AI güvenlik sorunlarına yönelik ilgi ve yatırımın göreceli olarak geri kaldığını belirtiyor; bu da gelecekteki AI gelişim riskleri hakkında endişelere yol açıyor (kaynak: Reddit r/artificial)

ABD’nin DeepSeek’i yasaklamayı düşündüğü söyleniyor: Haberlere göre Trump yönetimi, Çin’in DeepSeek büyük modelinin ABD’de kullanılmasını yasaklamayı ve Nvidia gibi Çinli AI şirketlerine çip sağlayan tedarikçilere baskı yapmayı düşünebilir. Bu hamle, veri güvenliği, ulusal rekabet ve yerel AI şirketlerini (OpenAI gibi) koruma düşüncelerine dayanabilir ve teknoloji kısıtlamaları ile açık kaynaklı modellerin geleceği hakkında endişelere yol açtı (kaynak: Reddit r/LocalLLaMA)

AI sorunlarını çözmek için AI Agent düşünce kuruluşu kurma önerisi: Reddit kullanıcısı bir fikir önerdi: Belirli alanlarda uzmanlaşmış ve üstün yetenekli AI Agent’lardan (ANDSI, Yapay Dar Alan Süper Zekası) oluşan bir “düşünce kuruluşu” kullanarak, bunların işbirliği içinde çalışmasını sağlamak ve mevcut AI alanındaki zorlukları (halüsinasyonları ortadan kaldırma, çoklu mimari AI model füzyonunu keşfetme gibi) özel olarak çözmek. Fikir, AI’ın insanüstü zekasını kullanarak AI’ın kendi gelişimini hızlandırmanın, sadece AI’ı insan işlerinin yerine koymaktan daha fazla potansiyele sahip olabileceğini savunuyor (kaynak: Reddit r/deeplearning)
İnsanlığın geleceğini güvence altına almak için AGI’nin açık kaynak olması çağrısı: Bir YouTube video bağlantısı, başlığında açık kaynaklı genel yapay zekanın (Open Source AGI) insanlığın geleceğini güvence altına almak için hayati önem taşıdığını savunuyor; açık, şeffaf ve dağıtık bir AGI geliştirme yolunun kapalı, merkezi bir yoldan insanlığın refahı için daha faydalı olduğunu ima ediyor (kaynak: Reddit r/ArtificialInteligence)
