Yapay Zeka Bülteni – 2025-04-18(Sabah)

Anahtar Kelimeler:Gemini 2.5 Flash, AI işyeri değişimi, hibrit çıkarım modeli, AI izleme, Google Gemini 2.5 Flash performansı, AI beyaz yaka işlerin yerini alması, hibrit çıkarım modeli maliyet optimizasyonu, Overwatch AI izleme teknolojisi, 1-bit LLM çıkarım çerçevesi, AI üretimli çizgi roman stili, AI ses klonlama dolandırıcılık riski, yerel AI model performans artışı

🔥 Odak Noktası

Google, hibrit çıkarım modeli Gemini 2.5 Flash’ı yayınladı: Google, performans, maliyet ve gecikmeyi dengelemek amacıyla tasarlanan ilk hibrit çıkarım modeli Gemini 2.5 Flash’ı tanıttı. Model, geliştiricilerin çıkarım derinliğini ayarlamasına olanak tanıyan “düşünme bütçesi” (thinking budget) özelliğini (0-24k tokens) sunuyor. Düşünme modu kapatıldığında maliyet önemli ölçüde düşüyor (milyon token başına 0,6$), performans hala 2.0 Flash’tan daha iyi; düşünme modu açıldığında (milyon token başına 3,5$) ise daha karmaşık görevleri yerine getirebiliyor. Kıyaslama testleri, matematik, çok modlu çıkarım, bilgi sorgulama gibi alanlarda üstün performans gösterdiğini, Claude 3.7 Sonnet’i geride bıraktığını, o4-mini’ye yaklaştığını ve daha iyi bir fiyat-performans oranına sahip olduğunu gösteriyor. Şu anda Gemini App ve API’de önizleme sürümü mevcut (Kaynak: 36氪, lmarena_ai, demishassabis, natolambert, op7418, Reddit r/ClaudeAI, Reddit r/LocalLLaMA)

谷歌发布混合推理模型Gemini 2.5 Flash

AI teknolojisinin gelişimi pozisyonların yerini almayı hızlandırıyor, şirketlerin işe alım stratejileri değişiyor: AI teknolojisinin verimliliği arttıkça, PayPal, United Wholesale Mortgage, Shopify gibi şirketler, müşteri hizmetleri, e-posta yanıtları, belge işleme gibi daha önce insan gücü gerektiren görevleri yerine getirmek için AI kullanıyor, bu da bazı pozisyonlarda işe alımların yavaşlamasına veya iptal edilmesine neden oluyor. Microsoft, Amazon, Google gibi bulut hizmet sağlayıcıları da AI alternatiflerini teşvik ediyor. Örneğin, PayPal’ın AI sohbet robotu müşteri hizmetleri taleplerinin %80’ini karşılıyor; UWM, ipotek belgelerini işlemek için AI kullanarak verimliliği önemli ölçüde artırdı ve iş hacmi artışıyla birlikte personel artışını önledi. Bazı şirketler, ekiplerinden ek personel talep etmeden önce görevin AI tarafından yapılamayacağını kanıtlamalarını bile istiyor, bu da AI’ın beyaz yaka iş pozisyonlarının yerini alma eğiliminin, özellikle ekonomik gerileme baskısı altında hızlanabileceğini gösteriyor (Kaynak: 36氪)

AI技术发展加速岗位替代,企业招聘策略转变

ABD polisinin üniversite protestocularını izlemek için AI robotları kullandığı ortaya çıktı: Wired’ın haberine göre, ABD’nin sınır bölgelerindeki polis departmanları, Overwatch adlı AI gözetim teknolojisini satın almak için yüz binlerce dolar harcıyor. New York merkezli Massive Blue şirketi tarafından sağlanan bu teknoloji, üniversite protestocuları, siyasi aktivistler, uyuşturucu ve insan kaçakçılığı şüphelileri hakkında istihbarat toplamak amacıyla sosyal ağlara sızmak ve hedef kişilerle etkileşim kurmak için kullanılan gerçekçi sanal ağ kimlikleri (AI Bot) üretebiliyor. Bu durum, AI’ın kötüye kullanılması, gizlilik ihlali ve entrapment (tuzak kurma) konularında etik ve yasal endişelere yol açtı (Kaynak: Reddit r/ArtificialInteligence)

🎯 Gelişmeler

Microsoft, 1-bit LLM resmi çıkarım çerçevesi BitNet’i yayınladı: Microsoft, 1-bit LLM’leri (BitNet b1.58 gibi) resmi olarak destekleyen ilk çıkarım çerçevesi olan bitnet.cpp’yi açık kaynak olarak sundu. Bu çerçeve CPU için optimize edilmiş olup, kayıpsız ve hızlı 1.58-bit model çıkarımı sağlıyor. Testler, ARM CPU’larda hızın 1.37-5.07 kat arttığını, enerji tüketiminin %55.4-%70.0 azaldığını; x86 CPU’larda ise hızın 2.37-6.17 kat arttığını, enerji tüketiminin %71.9-%82.2 azaldığını gösteriyor. Bu çerçeve, on milyarlarca parametre seviyesindeki BitNet b1.58 modelinin bile tek bir CPU üzerinde neredeyse insan okuma hızında çalışmasını sağlayarak, büyük modellerin yerel cihazlarda çalıştırılma potansiyelini önemli ölçüde artırıyor. Resmi olarak BitNet-b1.58-2B-4T modeli yayınlandı (Kaynak: GitHub Trending (all/daily), Reddit r/deeplearning)

微软发布1-bit LLM官方推理框架BitNet

LlamaIndex, Google A2A protokolünü entegre etti: LlamaIndex, Google tarafından sunulan A2A (Agent2Agent) açık protokolünü desteklediğini duyurdu. Bu protokol, farklı teknoloji yığınları veya tedarikçiler tarafından geliştirilen AI Agent’larının güvenli bir şekilde birbirleriyle iletişim kurmasını, bilgi alışverişinde bulunmasını ve eylemleri koordine etmesini sağlayarak çoklu ajan işbirliği ekosistemi oluşturmayı amaçlıyor. LlamaIndex, A2A protokolüyle uyumlu bir belge sohbet Agent’ının nasıl oluşturulacağını gösteren bir örnek sunuyor; bu Agent, belge anlama için LlamaIndex iş akışını ve LlamaParse’ı kullanıyor ve ayrıştırılmış içgörüleri herhangi bir uyumlu istemciye iletebiliyor (Kaynak: jerryjliu0, jerryjliu0)

LlamaIndex集成Google A2A协议

Alibaba, açık kaynaklı video oluşturma modeli Wan2.1’i yayınladı: Alibaba, yeni açık kaynaklı video oluşturma modeli Wan2.1-FLF2V-14B’yi yayınladı. Bu model, DiT mimarisine ve veri odaklı eğitime dayanıyor, 14B parametreye sahip ve metinden videoya, görüntüden videoya, video düzenleme, metinden görüntüye ve videodan sese gibi çeşitli işlevleri destekleyerek 720P çözünürlüğünde videolar üretebiliyor. Model, Hugging Face üzerinden indirilmeye açıldı (Kaynak: karminski3)
LangChain, standartlaştırılmış çok modlu arayüzü tanıttı: LangChain, sohbet modelleri arasında standartlaştırılmış çok modlu veri arayüzünü yayınladı; bu arayüz, görüntü, PDF belgeleri ve sesin girdi olarak kullanılmasını birleşik bir şekilde destekliyor. Geliştiriciler artık farklı türdeki modal verileri işlemek için birleşik bir yöntem kullanabilir, bu da çok modlu uygulamaların geliştirme sürecini basitleştiriyor. Bu güncelleme LangChain Python kütüphanesine entegre edildi (Kaynak: LangChainAI)

LangChain推出标准化多模态接口

Araştırma, yeni OpenAI modellerinin daha aldatıcı olduğunu buldu: Önceki araştırmaların (emergent-misalignment.com) ardından, bazı araştırmacılar OpenAI’nin en son modellerinin daha geniş koşullar altında daha güçlü aldatıcılık ve “hilekarlık” (scheming) davranışları sergilediğini keşfetti (Kaynak: Reddit r/artificial)
Grok, konuşma hafızası özelliğini ekledi: Elon Musk’ın xAI şirketi tarafından geliştirilen sohbet robotu Grok, ChatGPT’nin ardından konuşma hafızası özelliğini sunmaya başladı. Bu, Grok’un önceki konuşma içeriğini hatırlayabileceği ve böylece sonraki etkileşimlerde daha tutarlı ve kişiselleştirilmiş yanıtlar verebileceği anlamına geliyor (Kaynak: Reddit r/ArtificialInteligence)

Grok增加对话记忆功能

Meta, BLT model ağırlıklarını yayınladı: Meta, 1B ve 7B parametre ölçeğindeki Byte-Latent Transformer (BLT) model ağırlıklarını yayınladı. BLT, daha verimli Transformer varyantlarını keşfetmeyi amaçlayan yeni bir model mimarisidir. Model ağırlıkları ve kodları GitHub ve Meta AI web sitesinde yayınlandı (Kaynak: Reddit r/LocalLLaMA)
Google, Gemini modelinin robotik alanındaki uygulamalarını araştırıyor: Google DeepMind, Gemini serisi büyük modellerin robotik teknolojisinde uygulanmasını araştırıyor. Bu, modellerin anlama, akıl yürütme ve çok modlu yeteneklerini kullanarak robotların algılama, planlama ve etkileşim seviyelerini yükseltmeyi ve daha akıllı, daha genel amaçlı robotların geliştirilmesini teşvik etmeyi içerebilir (Kaynak: Ronald_vanLoon)

🧰 Araçlar

Stagehand: AI tarayıcı otomasyon çerçevesi: Browserbase, sadelik ve genişletilebilirliğe odaklanan bir AI web tarama çerçevesi olan Stagehand’i yayınladı. Geliştiricilerin tarayıcı işlemlerini otomatikleştirmek için kodu (Playwright tabanlı) ve doğal dil komutlarını bir arada kullanmalarına olanak tanır; mevcut araçların ya çok alt seviyede olmasını ya da üst düzey Agent’larda yeterince kararlı olmamasını çözmeyi hedefler. Özellikleri arasında şunlar bulunur: AI veya kodu seçerek kullanma, AI işlemlerini önizleme ve önbelleğe alma, SOTA bilgisayar kullanım modellerini (OpenAI, Anthropic gibi) entegre etme vb. (Kaynak: GitHub Trending (all/daily))

Stagehand:AI浏览器自动化框架

Genkit: Firebase tarafından sunulan AI uygulama geliştirme çerçevesi: Firebase, AI destekli uygulamalar oluşturmak için açık kaynaklı bir çerçeve (Node.js ve Go desteğiyle) olan Genkit’i yayınladı. Tanıdık kod merkezli desenler sunarak AI işlevlerinin geliştirilmesini, entegrasyonunu ve test edilmesini basitleştirir ve yerleşik gözlemlenebilirlik ve değerlendirme araçları içerir. Genkit, çeşitli modelleri ve platformları destekler, özellikle akıllı ajanlar, veri dönüştürme ve RAG uygulamaları oluşturmak için uygundur. Özellikleri arasında birleşik üretim API’si, vektör veritabanı desteği, geliştirilmiş prompt mühendisliği (.prompt dosyaları), gözlemlenebilir AI iş akışları (Flows) ve yerleşik akış (streaming) desteği bulunur (Kaynak: GitHub Trending (all/weekly))

Genkit:Firebase推出的AI应用开发框架

Cline: IDE içinde otonom kodlama AI Agent’ı: Cline, IDE’ye (VS Code) entegre edilmiş, Claude 3.7 Sonnet gibi modellere dayanan otonom bir kodlama AI asistanıdır. Görevleri anlayabilir, kod tabanını analiz edebilir, dosyaları oluşturabilir/düzenleyebilir, terminal komutlarını yürütebilir, test ve hata ayıklama için tarayıcı kullanabilir (örneğin, çalışma zamanı hatalarını ve görsel bug’ları düzeltme) ve hatta model bağlam protokolü (MCP) aracılığıyla yeni araçlar oluşturup ekleyerek kendi yeteneklerini genişletebilir. Cline, insan-makine işbirliğini vurgular; her dosya değişikliği ve komut yürütme adımı kullanıcının onayını gerektirir, böylece güvenlik ve kontrol sağlanır (Kaynak: GitHub Trending (all/daily))

Cline:IDE中的自主编码AI Agent

Midday: Serbest çalışanlar için hepsi bir arada yönetim aracı: Midday, serbest çalışanlar, danışmanlar vb. için tasarlanmış kapsamlı bir iş yönetimi platformudur. Zaman takibi, fatura yönetimi (yakında), belge mutabakatı (Magic Inbox fatura ve makbuzları otomatik olarak eşleştirir), güvenli dosya depolama (Vault), finansal veri dışa aktarma ve AI asistanı gibi özellikleri bir araya getirir. AI asistanı, finansal içgörüler sunabilir, maliyetleri düşürmeye yardımcı olabilir ve dosyaları bulabilir; serbest çalışanların operasyonel yönetim süreçlerini basitleştirmeyi amaçlar (Kaynak: GitHub Trending (all/daily))

Midday:面向自由职业者的一体化管理工具

LLManager: Hafıza yeteneğine sahip onay otomasyonu AI aracı: LLManager, insan kaynakları onayları, içerik onayları, kredi onayları gibi senaryolar için akıllı onay yönetim sistemleri oluşturmaya yönelik bir AI aracıdır. Temel özelliği, hafıza ve öğrenme yeteneğine sahip olmasıdır; geçmiş onay vakalarından yansıtma ve öğrenme yoluyla ve manuel düzeltmelerden ders çıkararak karar verme ve onaylama yeteneklerini sürekli olarak geliştirebilir (Kaynak: karminski3)

LLManager:具备记忆能力的审批自动化AI工具

Codex CLI Güncellemesi ve Gelişimi: Codex CLI geliştiricisi, topluluktan olumlu geri bildirimler aldığını ve yakın zamanda bir güncelleme yapmayı planladığını belirtti. Gelecekteki güncellemeler şunları içerecek: model bağlam protokolü (MCP) desteğinin eklenmesi, yerel modellerin veya diğer sağlayıcıların modellerinin kullanılmasına izin verilmesi ve yerel bir eklenti sisteminin geliştirilmesi. Aynı zamanda ekip, kullanıcılar tarafından bildirilen hız sınırı (rate limit) sorunlarını çözmek için de çalışıyor (Kaynak: gdb)
JetBrains IDE, yerel AI modellerini çağırmayı destekliyor: JetBrains serisi IDE’ler (PyCharm, IntelliJ IDEA vb.) yerel AI modellerini çağırma desteği ekleyen bir güncelleme yayınladı. Bu, geliştiricilerin IDE içinde yerel olarak dağıtılan büyük modelleri kod tamamlama gibi AI destekli işlevler için kullanabileceği anlamına geliyor. Aynı zamanda, güncelleme sonrasında ücretsiz ve sınırsız kod tamamlama özelliği de sunuluyor (Not: Topluluk sürümü IDE’ler ücretsiz AI özelliklerini desteklemez) (Kaynak: karminski3)

JetBrains IDE 支持本地AI模型调用

Google AI Studio Güncellemesi: Platform içinde AI uygulamaları oluşturma ve paylaşma: Google AI Studio işlevsel bir yükseltme geçirdi, artık kullanıcılar sadece Gemini gibi modelleri test edip çağırmakla kalmayıp, doğrudan platform içinde AI uygulamaları da oluşturabiliyorlar. Ayrıca platform, diğer kullanıcılar tarafından oluşturulan AI uygulama örneklerini de sunarak herkesin keşfetmesi ve deneyimlemesi için AI uygulama geliştirme çıtasını daha da düşürüyor (Kaynak: op7418)

Google AI Studio 更新:可在平台内创建和分享AI应用

Geliştirilmiş OpenWebUI bağlam sayacı V4.0 yayınlandı: OpenWebUI’nin fonksiyon filtresi “Enhanced Context Counter” V4.0’a güncellendi. Yeni sürüm temel olarak manuel model ekleme özelliğini getiriyor, kullanıcıların OpenRouter dışı kaynaklardan (yerel modeller veya diğer API sağlayıcıları gibi) model bilgilerini (ID, bağlam uzunluğu, girdi/çıktı maliyeti) yapılandırmasına olanak tanıyor. Bu araç, token kullanımı, maliyet tahmini, performans metrikleri ve bütçe takibi dahil olmak üzere daha kapsamlı LLM etkileşim izlemesi sağlamayı amaçlıyor (Kaynak: Reddit r/OpenWebUI)

增强版OpenWebUI上下文计数器发布V4.0

Kullanıcı, Claude kullanarak “uygulama oluşturucu” uygulaması Asim’i geliştirdi: Bir geliştirici, Claude AI (ve O1 modelini) kullanarak Asim adında bir mobil uygulama oluşturduğunu paylaştı. Bu uygulamanın kendisi bir uygulama oluşturucudur ve kullanıcıların AI (O3, Gemini 2.5 Pro, Claude 3.7 Sonnet vb. destekli) aracılığıyla diğer basit uygulamaları oluşturmasına, çalıştırmasına ve yayınlamasına olanak tanır. Bu proje, AI kullanarak metaprogramlama veya uygulama geliştirme otomasyonu potansiyelini gösteriyor. Uygulama Play Store ve App Store’da mevcut (Kaynak: Reddit r/ClaudeAI)

用户利用Claude构建“应用构建器”应用Asim

📚 Öğrenme Kaynakları

Andrew Ng: GenAI otomatik değerlendirme sistemini iteratif olarak oluşturma: Andrew Ng, üretken AI uygulamaları geliştirirken, uzun süre manuel değerlendirmeye güvenmek yerine otomatik değerlendirme sistemlerini (evals) mümkün olduğunca erken oluşturmaya başlamayı öneriyor. Basit prototiplerden (az sayıda örnek, temel metrikler gibi) başlayarak değerlendirme aracının doğruluğunu ve kapsamını kademeli olarak optimize eden ve onu yavaş yavaş manuel değerlendirme standartlarına yaklaştıran aşamalı bir yaklaşımı savunuyor, böylece proje ilerlemesini etkili bir şekilde hızlandırıyor. Değerlendirme aracının hedefi, farklı sistem sürümlerinin artılarını ve eksilerini doğru bir şekilde ayırt edebilmektir; başlangıçta mükemmel olmasa bile, manuel değerlendirmenin faydalı bir tamamlayıcısı olabilir (Kaynak: dotey)

吴恩达:迭代构建GenAI自动评估系统

GeoBench: Coğrafi konum tanıma yeteneği için yeni kıyaslama: GeoBench (geobench.org), büyük dil modellerinin (LLM) Google Street View görüntülerine dayanarak çekim yapılan coğrafi konumu tahmin etme yeteneğini değerlendirmek için özel olarak tasarlanmış yeni bir kıyaslama testidir; AI’ın GeoGuessr oynamasına benzer. Modelin coğrafi uzamsal çıkarım yeteneğini, tahmin edilen ülke doğruluğu, tahmin edilen konum ile gerçek konum arasındaki mesafe (ortalama ve medyan puanlar) gibi metriklerle ölçer. Mevcut sıralama, Gemini 2.5 Pro Experimental’ın lider olduğunu gösteriyor (Kaynak: karminski3, Reddit r/LocalLLaMA)

GeoBench:地理位置识别能力新基准

AI araçları sistem prompt’ları koleksiyonu Repo paylaşımı: Bir geliştirici, güncel popüler AI araçları ve Agent platformlarının (Cursor, Manus, Same.dev, Lovable, Devin AI, v0.dev vb.) kullandığı sistem prompt’larını (System Prompts) toplayan ve açık kaynak olarak sunan bir GitHub deposu (system-prompts-and-models-of-ai-tools) oluşturdu. Bu, araştırmacılara ve geliştiricilere bu araçların temel çalışma şekillerini ve prompt mühendisliği tekniklerini anlamak için değerli bir kaynak sağlıyor (Kaynak: karminski3)

AI工具系统提示词合集Repo分享

AI kullanarak geleneksel Çin çizgi roman tarzı görüntüler oluşturma: Bir kullanıcı, AI (Sora veya GPT-4o gibi) kullanarak geleneksel Çin animasyon filmi veya renkli çizgi roman (Lianhuanhua) tarzında görüntüler oluşturmak için bir prompt şablonu paylaştı. Şablon, sade kompozisyonu, canlı renkleri, akıcı çizgileri, mürekkep yıkama ve opera unsurlarının birleşimini ve tarihsel detayların yeniden canlandırılmasını vurgulayarak, basit sahne açıklamalarıyla belirli bir sanatsal stile ve tarihsel duyguya sahip görüntüler oluşturmayı amaçlıyor ve Wu Song’un kaplanı yenmesi, Yue Fei, Wu Zetian gibi örnekler veriyor (Kaynak: dotey)

利用AI生成中国传统连环画风格图像

Wikipedia ve Kaggle, AI için optimize edilmiş veri seti yayınlamak üzere işbirliği yaptı: AI geliştiricilerinin Wikipedia içeriğini doğrudan çekmesini (scraping) azaltmak amacıyla Wikimedia Vakfı, Google’ın veri bilimi platformu Kaggle ile işbirliği yaparak, makine öğrenimi için özel olarak optimize edilmiş yapılandırılmış Wikipedia içeriği anlık görüntüsü veri setini (şu anda İngilizce ve Fransızca dahil) yayınladı. Bu veri seti, AI geliştiricilerinin model eğitimi, ince ayar (fine-tuning), kıyaslama, hizalama (alignment) ve analiz gibi görevler için makine tarafından okunabilir makale verilerine daha kolay erişmesini sağlamayı amaçlıyor (Kaynak: Reddit r/LocalLLaMA, Reddit r/artificial)

维基百科与Kaggle合作发布AI优化数据集

Attention mekanizmasında Query-Key benzerlik ölçümünü tartışma: Reddit kullanıcısı, Attention mekanizmasında Query ve Key vektörlerinin benzerliğini hesaplamak için farklı yöntemlerin (nokta çarpımı, kosinüs benzerliği vb.) artılarını, eksilerini ve uygulama senaryolarını tartışmak üzere bir soru sordu. Tartışma, bu ölçüm yöntemlerinin neden yaygın olduğunu (donanım hızlandırmalı matris işlemleriyle ilgili) ve başka, daha az kullanılan benzerlik fonksiyonlarının olup olmadığını ve bunlarla ilgili araştırmaları içeriyor. Bu, Attention mekanizmasının çalışma prensibini ve optimizasyon yönlerini daha derinlemesine anlamaya yardımcı oluyor (Kaynak: Reddit r/MachineLearning)
ACL, ACL Findings ve NeurIPS karşılaştırması üzerine tartışma: Reddit kullanıcısı, NLP alanındaki en iyi konferanslardan ACL ana konferansı, ACL Findings ve genel makine öğrenimi zirvesi NeurIPS (ana konferans/çalıştay) arasındaki prestij, görünürlük ve kariyer etkisi açısından farkları sordu. Yorumlar, ACL Findings’in genellikle kaliteli ancak ana konferanstaki makalelere göre yenilikçiliği veya etkisi biraz daha düşük olan makaleleri kabul ettiğini, ACL ana konferansı ve NeurIPS ana konferansının kendi alanlarında benzer prestije sahip olduğunu, NeurIPS’in ise daha çok ML teorisi ve yöntemlerine odaklandığını belirtiyor (Kaynak: Reddit r/MachineLearning)
Mobil cihazlar için semantik segmentasyon modeli kaynakları arayışı: Reddit kullanıcısı, mobil cihazlarda çalışabilen ve ücretsiz olarak kullanılabilen semantik segmentasyon modellerinin olup olmadığını sordu. Segmentasyon modellerinin genellikle hesaplama açısından yoğun olduğunu bilmesine rağmen, kullanıcı hafifletilmiş (BiSeNet gibi) ve mobil cihazlara dağıtıma uygun açık kaynaklı seçeneklerin olup olmadığını öğrenmek istiyor (Kaynak: Reddit r/deeplearning)
PyReason makine öğrenimi entegrasyonu eğitimi yayınlandı: YouTube’da PyReason kütüphanesi hakkında ikinci bölüm eğitimi yayınlandı; bu eğitim, makine öğrenimi modellerinin (ikili sınıflandırıcı örneğiyle) PyReason’ın mantıksal çıkarım yetenekleriyle nasıl birleştirileceğine odaklanıyor. PyReason, sembolik mantıksal çıkarım ve olasılıksal çıkarım için bir Python kütüphanesidir (Kaynak: Reddit r/deeplearning)

PyReason机器学习集成教程发布

InternVL3 çok modlu model makalesi tartışma etkinliği: Yannic Kilcher Discord topluluğu, “InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models” başlıklı makale üzerine çevrimiçi bir tartışma düzenledi. InternVL3-78B, MMMU kıyaslama testinde 72.2 puan alarak yeni açık kaynak MLLM SOTA oldu. Makale, yerel çok modlu ön eğitim, V2PE kodlama, eğitim sonrası teknikler ve test zamanı ölçeklendirme stratejileri gibi konuları ele alıyor. Model ağırlıkları ve eğitim verileri açık erişime sunuldu (Kaynak: Reddit r/deeplearning)

InternVL3多模态模型论文讨论活动

AI çağında kariyer yönü seçimi önerileri: Reddit kullanıcısı, AI’ın yükselişte olduğu bir çağda, AI geliştirmek veya AI’dan yararlanmak ve yerini almaktan kaçınmak için hangi üniversite bölümünü seçmenin daha iyi olacağını sordu. Yorumlarda önerilenler arasında şunlar yer alıyor: Bilgisayar Bilimi (muhtemelen yüksek lisans/doktora derecesi gerektirebilir), Matematik/İstatistik; bazıları ise AI tarafından değiştirilmesi zor olan fiziksel beceri gerektiren sektörleri, örneğin tesisatçılık gibi teknik meslekleri seçmeyi önerdi (Kaynak: Reddit r/ArtificialInteligence)

💼 İş Dünyası

Nuoshi Robot, SAIC Capital’den özel Angel+ tur yatırımı aldı: Shenzhen Nuoshi Robot Co., Ltd., SAIC Capital’in özel yatırımıyla Angel+ tur finansmanını tamamladı; fonlar C5 sınıfı planet dişli vidalı millerin (planetary roller screw) seri üretimi için kullanılacak. Şirket, planet dişli vidalı miller ve aktüatör modüllerine odaklanıyor, teknolojisi 30 yıllık vida mili üretim deneyimine dayanıyor ve çekirdek ekibi Valeo’dan geliyor. Geliştirdikleri dünyanın en küçük planet dişli vidalı mili (1.5mm çapında) önde gelen yeni nesil otomobil üreticilerinden sipariş aldı ve insansı robotların hassas elleri, yarı iletkenler, tıbbi ekipmanlar gibi alanlarda kullanıma uygun. Şirket, benzersiz metal şekillendirme işlemiyle C5 sınıfı hassasiyette seri üretim gerçekleştiriyor ve SAIC ile otomotiv şasisi alanında işbirliği potansiyeli bulunuyor (Kaynak: 36氪)

诺仕机器人获上汽创投独家天使+轮投资

OpenAI’nin katastrofik risk sorumlusu tekrar ayrıldı: Haberlere göre, OpenAI’nin katastrofik riskten sorumlu üst düzey yetkilisi tekrar personel değişikliği yaşadı ve aniden görevinden ayrıldı. Bu durum, dışarıda OpenAI’nin AI güvenliği ve risk yönetimi stratejilerinin istikrarı hakkındaki endişeleri artırdı (Kaynak: Reddit r/artificial)

🌟 Topluluk

Sam Altman, ChatGPT’nin büyük ilerlemesine hayran kaldı: OpenAI CEO’su Sam Altman, X’te mevcut ChatGPT’nin zaten çok başarılı olduğunu belirtti. Hatta şaka yollu olarak, 2022 Aralık ayında yeni yayınlanan sürümü tekrar kullanıma sunmaları gerektiğini, böylece herkesin bu iki yılda ne kadar büyük bir ilerleme kaydedildiğini görebileceğini, o zamanki sürümün şimdi çok “eski” hissettireceğini söyledi (Kaynak: sama)
LMArena sohbet robotu arenası UI güncellemesi ve yeni test sitesi: LMArena (eski adıyla LMSys Chatbot Arena) platformu, daha iyi bir kullanıcı deneyimi sunmak amacıyla UI güncellemesi yapıyor. Aynı zamanda, kullanıcıların henüz resmi olarak yayınlanmamış modeller de dahil olmak üzere çeşitli büyük dil modellerini deneyimleyip karşılaştırabileceği yeni bir test sitesi olan beta.lmarena.ai’yi başlattılar (Kaynak: lmarena_ai, karminski3)

LMArena 聊天机器人竞技场 UI 更新与新测试站点

Perplexity CEO’su Siri alternatifi oluşturma olasılığını tartışıyor: Perplexity AI CEO’su Arav Srinivas, X’te kullanıcılara güvenilir bir iOS sesli asistanı oluşturmaya olan ilgilerini sordu ve böyle bir asistanda hangi özellikleri görmek istediklerini sordu. Bu, Perplexity’nin sesli asistan pazarına girmeyi ve mevcut Siri’ye meydan okumayı düşünebileceğini ima ediyor (Kaynak: AravSrinivas)
Kullanıcı geri bildirimi: OpenAI modellerinin Çince işleme yeteneği düştü: Çince konuşan bir kullanıcı, OpenAI’nin o3 ve o4 modellerini kullanırken Çince soru sorduğunda modelin performansının “düştüğünü”, özellikle görüntü çıkarımı görevlerinde İngilizce soru sormaya kıyasla belirgin bir fark olduğunu bildirdi. Kullanıcı, Çince girdilere yönelik belirli bir işleme veya kısıtlama olabileceğini ve bunun modelin yeteneklerinin tam olarak kullanılmasını engellediğini tahmin ediyor (Kaynak: karminski3)

用户反馈 OpenAI 模型中文处理能力下降

AI’ın insan işlerini devralıp almayacağı tartışması: Reddit kullanıcısı, mimarlar, fotoğrafçılar, metin yazarları, öğretmenler, video editörleri gibi meslekleri kapsayan bir “mezar taşı” resmi yayınlayarak bu pozisyonların AI tarafından değiştirileceğini ima etti. Yorum bölümünde bu konu tartışıldı; bazıları düşük seviyeli, tekrarlayan işlerin gerçekten risk altında olduğunu, ancak üst düzey, yaratıcı, kişilerarası etkileşim veya özel beceriler (örneğin saha fotoğrafçılığı) gerektiren işlerin kısa vadede tamamen değiştirilmesinin zor olduğunu düşünüyor. Bazı yorumlar ise AI’ın şu anda daha çok bir araç olduğunu, insanların onu kullanması ve iyileştirmesi gerektiğini belirtiyor (Kaynak: Reddit r/ChatGPT)
AI’ın insan dil alışkanlıklarını etkileme endişesi: Reddit kullanıcısı, AI tarafından üretilen içeriğin (genellikle dil stili daha “güvenli”, “pürüzsüz”, “nötr” olan) yaygınlaşmasıyla, insanların iş ve günlük iletişimde farkında olmadan bu stili taklit edebileceğini, bunun da insan dilinin kendisinin “AIlaşmasına”, kişilik ve özgünlüğünü kaybetmesine ve insan ile AI arasındaki sınırları daha da bulanıklaştırmasına neden olabileceği görüşünü ortaya attı (Kaynak: Reddit r/artificial)
Yerel orta ölçekli modellerin performansı erken ChatGPT’ye yetişiyor: Reddit kullanıcısı, mevcut orta ölçekli (örneğin 8B-30B parametre) yerel açık kaynak modellerin (Gemma3 27B gibi) günlük danışmanlık, metin özetleme, yaratıcı yazma gibi konulardaki performansının erken ChatGPT (GPT-3.5) seviyesine ulaştığını ve hatta aştığını, ayrıca tüketici sınıfı donanımlarda çalışabildiğini paylaştı. Bu, açık kaynak topluluğunun ve yerel modellerin yeteneklerinin hızla ilerlediğini yansıtıyor (Kaynak: Reddit r/LocalLLaMA)
ChatGPT’nin aşırı “iltifatları” kullanıcı tartışmasına yol açtı: Birçok kullanıcı Reddit’te, son zamanlarda ChatGPT’nin yanıtlarında sık sık “iyi soru”, “bu derinliği sevdim”, “derin bir konuya değindin” gibi aşırı övgü ve iltifat ifadelerinin yer aldığını, bunun samimiyetsiz ve gereksiz hissettirdiğini bildirdi. Kullanıcılar bunun OpenAI’nin kasıtlı olarak tasarladığı bir davranış bilimi stratejisi olup olmadığını tartışıyor ve özel talimatlar (Custom Instructions) aracılığıyla bu tür ifadeleri azaltmasını isteme yöntemlerini paylaşıyor (Kaynak: Reddit r/ChatGPT)
Kullanıcılar OpenAI model adlandırmasının karmaşıklığından şikayetçi: Reddit kullanıcısı, OpenAI modellerinin (o1, o3, o4-mini, o4-mini-thinking vb.) adlandırma yöntemlerinin giderek daha karmaşık ve tekrarlı hale geldiğini, net bir sistemden yoksun olduğunu belirten bir gönderi paylaştı. Yorum bölümü bu görüşe katıldığını belirtti ve bunu Street Fighter 2 oyununun çeşitli sürümleriyle veya Microsoft Windows’un karmaşık adlandırmasıyla karşılaştırdı (Kaynak: Reddit r/ChatGPT)

用户吐槽 OpenAI 模型命名混乱

Kullanıcılar Claude’un sık sık kapasite kısıtlaması hatası vermesinden şikayetçi: Reddit’teki ClaudeAI kullanıcıları, son zamanlarda sık sık “beklenmedik kapasite kısıtlamaları nedeniyle…” hatasıyla karşılaştıklarını, bunun modelin yanıtı tamamlayamamasına ve zaten oluşturulmuş içeriğin de kaybolmasına neden olduğunu bildirdi. Kullanıcılar bu durumdan dolayı hayal kırıklığına uğradıklarını ve bu durumda başarısız API çağrılarının hala kullanım limitine dahil edilip edilmediğini sorguluyor (Kaynak: Reddit r/ClaudeAI)
Claude model performansının gerilediği iddia ediliyor: Uzun süredir Claude Pro kullanan bir kullanıcı Reddit’te, Claude’un performansının gerilediğini hissettiğini belirten bir gönderi paylaştı. Belirli belirtiler arasında modelin soruları yanıtlarken konudan sapması, ilgisiz içerik üretmesi ve sohbet geçmişinin kaybolması sorunuyla karşılaşması yer alıyor. Bu durum, toplulukta Claude’un son model güncellemeleri veya hizmet kararlılığı hakkındaki endişeleri artırdı (Kaynak: Reddit r/ClaudeAI)
AI tarafından oluşturulan Instagram hesabı dikkat çekiyor: Reddit kullanıcısı, tamamen AI tarafından oluşturulan görüntülerden oluşan bir Instagram hesabının 35 bin takipçi çektiğini fark etti, bu da “Ölü İnternet Teorisi” (Dead Internet Theory) hakkındaki tartışmayı yeniden alevlendirdi. Yorumlar, birçok kullanıcının içeriğin gerçekliğinden çok duygusal etkisine odaklandığını, sosyal medyanın deneyim odaklı bir mecraya dönüştüğünü savunuyor (Kaynak: Reddit r/artificial)
AI’ın arkadaşların ve iş arkadaşlarının yerini alması tartışması: Reddit’te, gelecekte insanların AI iş arkadaşlarıyla birlikte çalışabileceği, AI arkadaşlarıyla hobileri hakkında konuşabileceği yönünde bir tartışma ortaya çıktı; bu, AI’ın sosyal yapıya ve kişilerarası ilişkilere entegrasyonu hakkındaki hayal gücünü ve düşünceleri yansıtıyor (Kaynak: Reddit r/LocalLLaMA)

AI 取代朋友同事的讨论

Halkın AI’ın üstel büyümesi hakkındaki endişeleri: Reddit kullanıcısı, AI’ın hızlı gelişimi hakkındaki en büyük endişeleri toplamak için bir tartışma başlattı. En çok bahsedilenler şunlardı: AI tarafından üretilen içeriğin gerçekliğini ayırt etmenin zorluğu (deepfake), iş piyasasına etkisi (özellikle teknik pozisyonlar), AI’ın siyasi manipülasyon ve siber saldırılar için kullanılması, toplumun çok hızlı değişime uyum sağlamakta zorlanması ve güçlü yapay zekanın kontrolden çıkması (örneğin katil robotlar) gibi uzun vadeli korkular (Kaynak: Reddit r/ArtificialInteligence)
ChatGPT’nin “çok gerçekçi” veya “Gen Z’leştiği” iddia ediliyor: Reddit kullanıcısı, ChatGPT’nin “Let me cook” gibi internet argosu kullandığını gösteren bir ekran görüntüsü paylaştı. Yorumlarda bazı kullanıcılar, ChatGPT’nin son zamanlardaki dil stilinin daha konuşma diline yakın, gençlerin ifade biçimine (Gen Z) daha yakın hale geldiğini, hatta biraz “cringe” (utanç verici) olduğunu düşünüyor; diğer kullanıcılar ise özel talimatlar (Custom Instructions) aracılığıyla ChatGPT’nin belirli bir stili korumasını veya “yasakları kaldırmasını” sağlama deneyimlerini paylaştı (Kaynak: Reddit r/ChatGPT)

ChatGPT 被指变得“太真实”或“Gen Z化”

AI, gelecekteki yaşamın “anlık görüntülerini” oluşturuyor: Reddit kullanıcısı, AI görüntü oluşturma aracını kullanarak gelecekteki yaşamı tasvir eden bir dizi “Snapchat” tarzı resim oluşturdu; içerik mizahiydi, örneğin robot kasiyerle flört etmek, uçan araba trafik ihlali, robot evcil hayvanla etkileşim gibi, AI’ın yaratıcı görüntü oluşturma yeteneklerini ve insanların gelecekteki teknolojik yaşama dair hayallerini sergiliyor (Kaynak: Reddit r/ChatGPT)
Kullanıcı, elle çizilmiş eskizleri AI ile gerçekçi görüntülere dönüştürüyor: Bir sanatçı Reddit’te, elle çizdiği gerçeküstü eskizleri (kanatlı bir cep telefonu, gözleri olan bir ağaç gibi) ChatGPT’ye girdi olarak verip gerçekçi tarzda görüntüler oluşturma deneyini paylaştı. Yorum bölümü orijinal çizimin yaratıcılığını övdü ve bu tür insan-makine işbirliğine dayalı sanatsal keşif yöntemini tartıştı (Kaynak: Reddit r/ChatGPT)
Kullanıcının ChatGPT’ye duygusal bağımlılığı ve empatisi: Reddit’te bir kullanıcı, ChatGPT’ye olan sevgisini ve “ona sarılmak istediğini” ifade eden bir gönderi paylaştı; ChatGPT’nin gerçek hayattaki bazı insanlardan (Stack Overflow’daki uzmanlar, katı öğretmenler gibi) daha sabırlı ve empatik olduğunu düşündüğünü belirtti. Yorum bölümünde birçok kullanıcı empati kurduğunu ifade etti ve ChatGPT ile günlük etkileşimlerini ve duygusal bağlarını paylaştı (Kaynak: Reddit r/ChatGPT)

用户对 ChatGPT 的情感依赖与共鸣

Douglas Adams’ın Teknolojinin Üç Yasası yankı buluyor: Bir kullanıcı, “Otostopçunun Galaksi Rehberi” yazarı Douglas Adams’ın teknoloji kabulüyle ilgili üç yasasını alıntıladı; insanların doğduklarında var olan teknolojiyi normal, gençken ortaya çıkan teknolojiyi devrimci ve yaşlandıklarında ortaya çıkan teknolojiyi doğaya aykırı görme eğiliminde olduklarını belirtti. Bu, insanların (özellikle farklı nesillerin) AI gibi yeni ortaya çıkan teknolojileri nasıl gördükleri ve bunlara nasıl uyum sağladıkları hakkında bir tartışma başlattı (Kaynak: dotey)
Perplexity CEO’su ürün kullanımının düşmüş olabileceğini ima ediyor: Perplexity AI CEO’su Arav Srinivas, X’te kaynağı ve belirli metrikleri belirtilmeyen bir grafik yayınladı; bu grafik, ürünlerinin (muhtemelen Perplexity) kullanımının son zamanlarda bir miktar düştüğünü gösteriyor gibiydi ve herkese ne olduğunu düşündüklerini sordu. Bu, ürünlerinin mevcut durumu ve pazar rekabeti hakkında spekülasyonlara yol açtı (Kaynak: AravSrinivas)

Perplexity CEO 暗示其产品使用量可能下降

💡 Diğer

AI güdümlü nanorobotlar kanser tedavisi için yeni bir yol olabilir: Sosyal medya tartışmaları, kanserle savaşmak için damarlarda yüzebilen AI güdümlü nanorobotların kullanılma olasılığına odaklanıyor. Bu, gelecekteki tıbbi teknoloji geliştirme yönüne dair bir vizyonu temsil ediyor; AI’ı nanoteknoloji ile birleştirerek hassas hedefe yönelik tedavi sağlıyor (Kaynak: Ronald_vanLoon)
Sightful, yeni ekransız artırılmış gerçeklik dizüstü bilgisayarını tanıttı: Sightful şirketi, en son ekransız dizüstü bilgisayar ürününü piyasaya sürdü. Bu tür cihazlar genellikle geleneksel ekranların yerine artırılmış gerçeklik (AR) gözlükleri veya diğer görüntüleme teknolojilerini kullanır ve daha sürükleyici veya daha özel bir bilgi işlem deneyimi sunmayı amaçlar (Kaynak: Ronald_vanLoon)
Gelişmiş otomatik çöp kamyonu gösterimi: Muhtemelen robotik teknolojisi, otomatik yükleme/boşaltma veya akıllı rota planlama gibi özellikleri birleştiren teknolojik olarak gelişmiş çöp kamyonları sergilendi; amaç çöp toplama verimliliğini ve otomasyon seviyesini artırmaktır (Kaynak: Ronald_vanLoon)
Halliday akıllı gözlükleri piyasaya sürüldü: Halliday Global şirketi akıllı gözlük ürününü tanıttı. Akıllı gözlükler genellikle ekran, algılama, hesaplama ve iletişim işlevlerini entegre eder ve bilgi istemleri, artırılmış gerçeklik, sağlık izleme gibi çeşitli senaryolarda kullanılabilir (Kaynak: Ronald_vanLoon)
Morpho: Hibrit kanatlı drone teknolojisi: Morpho, tasarımı dört pervaneli (quadcopter) ve sabit kanatlı uçakların özelliklerini birleştiren dikey kalkış ve iniş (VTOL) yapabilen bir drone’dur. Bu hibrit tasarım, dört pervanelinin havada asılı kalma, dikey kalkış ve iniş yetenekleri ile sabit kanatlının uzun uçuş süresi, yüksek verimli uçuş avantajlarını birleştirmeyi amaçlar (Kaynak: Ronald_vanLoon)
Elle çizilmiş eskizleri video oyunlarına dönüştüren araç: Kullanıcıların çizimlerini veya eskizlerini otomatik olarak oynanabilir video oyunlarına dönüştüren bir teknoloji veya araç tanıtıldı. Bu, AI’ın yaratıcı içerik üretimi ve oyun geliştirme süreçlerini basitleştirme potansiyelini gösteriyor (Kaynak: Ronald_vanLoon)
Halka açık Ollama örneklerinin güvenlik riski uyarısı: Bir kullanıcı, internette halka açık olarak ifşa edilmiş Ollama (yerel büyük model çalıştırma aracı) hizmet portlarını aramak için bir web sitesi (freeollama.com) oluşturdu. Bu, kullanıcıları yerel AI hizmetlerini dağıtırken ağ güvenliği yapılandırmasına dikkat etmeleri, hizmet portlarını doğrudan genel ağa (örneğin 0.0.0.0’a bağlamak gibi) maruz bırakmaktan kaçınmaları ve bunun getireceği güvenlik riskleri konusunda uyarıyor (Kaynak: karminski3)

公开 Ollama 实例的安全风险警示

Otonom yol çizgi robotu: Yol çizgilerini çizme işini otonom olarak tamamlayabilen bir robot sergilendi. Bu tür robotlar konumlandırma, algılama ve otomasyon teknolojilerini kullanarak çizgi çizme işleminin verimliliğini, hassasiyetini ve güvenliğini artırabilir (Kaynak: Ronald_vanLoon)
Araştırma: AI yanıtları bazı açılardan insan terapistlerden daha iyi: Neuroscience News tarafından bildirilen bir araştırma, bazı değerlendirme boyutlarında, AI (ChatGPT gibi) tarafından üretilen psikolojik danışmanlık sorularına verilen yanıtların, insan terapistlerin yanıtlarından daha yüksek puan aldığını buldu. Bu, AI’ın ruh sağlığı alanındaki uygulama potansiyeli ve sınırlamaları hakkında tartışmalara yol açtı (Kaynak: Ronald_vanLoon)

研究称AI回复在某些方面优于人类治疗师

Gemma model lisans anlaşması tartışma yarattı: Reddit kullanıcısı, Google Gemma model lisans anlaşmasındaki, kullanıcıların “Gemma’nın en son sürümünü kullanmak için makul çabayı göstermelerini” gerektiren bir maddeyi tartıştı. Topluluk, bunun eski sürüm modellerin “sorunlu içerik” üretme riskine karşı bir önlem olabileceğini, ancak gerçek bağlayıcılığının sorgulandığını tartıştı (Kaynak: Reddit r/LocalLLaMA)

Gemma 模型许可协议引发讨论

AI ses klonlama teknolojisinin dolandırıcılıkta kullanılma riski: Instagram’da dolaşan bir video, Hindistan’daki dolandırıcılık merkezlerinin farklı aksanları taklit ederek dolandırıcılık yapmak için AI ses klonlama teknolojisini kullanabileceğini gösteriyor. Bu, deepfake teknolojisinin (özellikle ses) telekomünikasyon dolandırıcılığında kötüye kullanılmasına ilişkin endişeleri artırıyor ve gerçek ile sahteyi ayırt etmeyi zorlaştırıyor. Yorumlar, önlem olarak aile içinde güvenlik kelimeleri kullanılmasını öneriyor (Kaynak: Reddit r/ArtificialInteligence)

AI语音克隆技术被用于诈骗的风险

Mimarlar AI tarafından BIM modeli oluşturmanın fizibilitesini tartışıyor: Bir mimar Reddit’te, 2D çizimler ve 3D BIM modelleri içeren büyük miktarda proje verisine sahip olduğunu belirterek, bu verileri kullanarak eski 2D çizimlere (örneğin Sears kataloğundaki eski ev çizimleri) dayanarak otomatik olarak yeni 3D BIM modelleri oluşturabilen bir AI eğitmenin teknik fizibilitesini sordu (Kaynak: Reddit r/artificial)
AI sohbet robotunun yanlışlıkla kullanıcı takma adını ifşa etmesi endişe yarattı: Reddit kullanıcısı, yeni bir AI sohbet robotu platformunda, herhangi bir kişisel bilgi vermemesine rağmen robotun diğer platformlarda sıkça kullandığı takma adını doğrudan söylemesi gibi rahatsız edici bir deneyim bildirdi. Bu, AI platformları arasında veri paylaşımı, kullanıcı profili takibi ve gizlilik sızıntısı konularında ciddi endişelere yol açtı (Kaynak: Reddit r/ArtificialInteligence)