Palavras-chave:Agentes de IA, Microsoft Build 2025, AlphaEvolve, GPT-4, Azure AI Foundry, NVIDIA Computex 2025, Ferramentas de programação com IA, Inteligência incorporada, Extensão GitHub Copilot para VSCode, Protocolo de Contexto de Modelo (MCP), Rede de Linguagem Natural (NLWeb), Meituan NoCode, Assistente Inteligente QBot da Tencent

🔥 Foco

Microsoft Build 2025 inaugura a era da “rede de agentes inteligentes”, abraçando totalmente o desenvolvimento nativo de IA: Na conferência de programadores Build 2025, a Microsoft anunciou a sua visão de uma “Open Agentic Web”, lançou mais de 50 atualizações, cujo núcleo inclui a extensão VSCode de código aberto do GitHub Copilot, o lançamento do protocolo de contexto de modelo (MCP) e dos padrões abertos de rede de linguagem natural (NLWeb), e a introdução de mais de 1900 modelos, incluindo o Grok da xAI, no Azure AI Foundry. Estas iniciativas visam unificar o pipeline de desenvolvimento de modelos para AI Agents, permitindo a sua operação autónoma e interoperabilidade em diferentes cenários. O CEO da Microsoft, Satya Nadella, enfatizou que os AI Agents irão remodelar a forma como os problemas são resolvidos e, juntamente com o CEO da OpenAI, Sam Altman, o CEO da Nvidia, Jensen Huang, e o fundador da xAI, Elon Musk, discutiu o futuro dos agentes de IA no desenvolvimento de software, infraestrutura e aplicações no mundo físico. (Fonte: 36氪 | GitHub Blog | VS Code Blog | The Verge)

Google DeepMind lança AlphaEvolve, agente de IA quebra recorde de 56 anos na eficiência da multiplicação de matrizes: O Google DeepMind lançou o AlphaEvolve, um agente de codificação alimentado pelo Gemini, que, através de algoritmos evolutivos e um sistema de avaliação automatizado, descobriu com sucesso um algoritmo de multiplicação de matrizes complexas 4×4 mais eficiente que o algoritmo de Strassen, usado há 56 anos, reduzindo o número de multiplicações escalares necessárias de 49 para 48. Este avanço não só é significativo na teoria matemática, como já demonstrou valor em aplicações internas do Google, como acelerar as operações de multiplicação de grandes matrizes na arquitetura Gemini em 23%, reduzir o tempo de treino do Gemini em 1% e melhorar o desempenho do FlashAttention em 32,5%. O AlphaEvolve demonstra o enorme potencial da IA na descoberta científica automatizada e na otimização de algoritmos, capaz de lidar com uma variedade de problemas complexos, desde desafios matemáticos até ao agendamento de recursos de data centers e aceleração do treino de modelos de IA. (Fonte: Google DeepMind Blog | 量子位)

Estudo revela que GPT-4 é 64% mais persuasivo que humanos em debates personalizados: Um estudo publicado na “Nature Human Behaviour” indica que, quando o GPT-4 da OpenAI consegue aceder a informações pessoais do oponente no debate, como género, idade, nível de educação, e ajustar os seus argumentos com base nisso, o seu poder de persuasão é 64% superior ao dos humanos. Esta investigação, realizada em colaboração por instituições como o Instituto Federal Suíço de Tecnologia de Lausanne, envolveu 900 participantes e confirma ainda mais a poderosa capacidade dos grandes modelos de linguagem (LLM) na persuasão. Os investigadores alertam que isto revela que as ferramentas de IA, após obterem uma pequena quantidade de informação do utilizador, conseguem construir argumentos complexos e persuasivos, representando uma ameaça potencial para a disseminação de desinformação personalizada. Apelam aos decisores políticos e plataformas para que levem este risco a sério e explorem o uso de LLMs para gerar conteúdo de contra-narrativa personalizado para combater a desinformação. (Fonte: Nature Human Behaviour | MIT Technology Review)

Microsoft e Hugging Face aprofundam colaboração, Azure AI Foundry integra mais de dez mil modelos open-source: Na conferência Microsoft Build, a Microsoft anunciou a expansão da sua colaboração com a Hugging Face. O Azure AI Foundry integra agora mais de 10.000 modelos open-source da Hugging Face, abrangendo múltiplas modalidades e tarefas como texto, áudio e imagem. Esta medida visa permitir que os utilizadores do Azure implementem de forma mais conveniente e segura uma diversidade de modelos open-source para construir aplicações de IA e agentes inteligentes. Todos os modelos integrados passaram por testes de segurança, utilizam o formato safetensors e não contêm código remoto, garantindo a segurança para aplicações de nível empresarial. Ambas as partes planeiam continuar a introduzir os modelos mais recentes e populares, suportar mais modalidades (como vídeo, 3D) e reforçar a otimização para agentes e ferramentas de IA no futuro. (Fonte: HuggingFace Blog)

Microsoft and Hugging Face expand collaboration

🎯 Tendências

Nvidia lança múltiplos novos produtos de IA na Computex 2025, acelerando a transformação em fábricas de IA: O CEO Jensen Huang, na Computex 2025, lançou a GPU GeForce RTX 5060, a plataforma de supercomputação Grace Blackwell GB300, o supercomputador pessoal de IA DGX Spark (equipado com GB10, disponível em poucas semanas) e a DGX Station (784GB de memória, capaz de executar DeepSeek R1). Huang enfatizou que a Nvidia está a transformar-se de um fornecedor de GPUs para um fornecedor global de infraestrutura de IA, com o objetivo de criar fábricas de IA “prontas para uso”. Simultaneamente, o motor de física Newton, desenvolvido em conjunto pela Nvidia, DeepMind e Disney, será open-source em julho, e será lançado o modelo fundamental para robôs humanoides Isaac GR00T, impulsionando o desenvolvimento da IA física. A Nvidia também anunciou a construção de um novo escritório em Taiwan, China, e destacou a importância dos talentos de IA da China. (Fonte: 36氪 | 36氪)

Microsoft planeia permitir que utilizadores da UE alterem o assistente de voz padrão em dispositivos como o iPhone: Segundo a Bloomberg, a Apple planeia permitir que os utilizadores na União Europeia alterem o assistente de voz padrão em dispositivos como iPhone, iPad e Mac, de Siri para outras opções como Google Assistant ou Amazon Alexa. Esta medida é possivelmente uma resposta à pressão antitrust do Regulamento dos Mercados Digitais (DMA) da UE. Nos últimos anos, a Siri tem sido muito criticada por funcionalidades desatualizadas e inteligência insuficiente. Internamente, na Apple, existem divergências sobre a direção do desenvolvimento da Siri, e a sua arquitetura atual dificilmente se integra eficazmente com grandes modelos de linguagem (LLM). Embora a Apple esteja a desenvolver uma nova Siri baseada em LLM e tenha lançado o Apple Intelligence, permitir que os utilizadores mudem o assistente padrão pode ter um impacto no seu ecossistema. (Fonte: 36氪)

Apple testa internamente chatbot de IA auto-desenvolvido, capacidade pode ser comparável à do ChatGPT: O jornalista da Bloomberg, Mark Gurman, revelou que a Apple está a testar internamente o seu projeto de chatbot de IA auto-desenvolvido. Sob a liderança do novo responsável por IA, John Giannandrea, o projeto fez progressos significativos nos últimos seis meses, com alguns executivos a considerar que a sua versão atual tem capacidades próximas da versão mais recente do ChatGPT. O chatbot poderá ter capacidades de pesquisa instantânea na web e integração de informações. Esta medida pode visar reduzir a dependência de serviços externos como o OpenAI e aumentar a competitividade da Siri. Embora a WWDC 2025 possa não destacar as atualizações da Siri, o investimento da Apple em IA continua a aumentar, na esperança de revitalizar o seu assistente de voz na era da IA. (Fonte: 36氪)

Windows suportará nativamente o protocolo de contexto de modelo (MCP): Na conferência Build 2025, a Microsoft anunciou que o sistema operativo Windows suportará nativamente o protocolo de contexto de modelo (MCP), com o objetivo de simplificar o desenvolvimento e a implementação de aplicações de IA no Windows. O MCP é comparado ao “USB-C para aplicações de IA”, tentando fornecer uma forma padronizada de interação para diferentes modelos e aplicações de IA. A plataforma Windows AI Foundry integrará este suporte, permitindo que os programadores executem e giram mais facilmente modelos de IA locais e agentes inteligentes em dispositivos Windows. (Fonte: op7418 | Reddit r/LocalLLaMA)

👀 Microsoft just created an MCP Registry for Windows

Microsoft Azure AI Foundry introduz o grande modelo Grok da xAI: Na conferência de programadores Build 2025, a Microsoft anunciou que os grandes modelos Grok 3 e Grok 3 mini da empresa xAI de Elon Musk se juntarão à plataforma Azure AI Foundry. Os utilizadores do Azure poderão usar e pagar diretamente por estes modelos através da plataforma na nuvem. Esta medida expande ainda mais o número de modelos de IA disponíveis no Azure (já ultrapassando os 1900), que anteriormente já incluía OpenAI, Meta e DeepSeek, entre outros. Musk, através de uma ligação por vídeo, expressou o desejo de que os programadores forneçam feedback e espera oferecer os serviços Grok a mais empresas no futuro. (Fonte: 36氪)

Equipa de Percy Liang lança projeto Marin para promover o desenvolvimento de modelos de IA abertos: O professor Percy Liang, da Universidade de Stanford, liderou o lançamento do projeto Marin, que visa construir modelos abertos de uma “forma radicalmente participativa”. O projeto enfatiza um processo de desenvolvimento aberto, permitindo que qualquer pessoa contribua. Os primeiros modelos Marin já foram lançados, com o modelo 8B disponível na plataforma Together AI para teste. Esta iniciativa responde a apelos por uma abertura mais profunda no campo da IA, não apenas abrindo pesos, código e dados, mas todo o ecossistema de investigação e desenvolvimento. (Fonte: vipulved)

vipulved

Intel lança placa gráfica profissional Arc Pro B60, KTransformers anuncia suporte para GPUs Intel: A Intel lançou a nova placa gráfica de nível profissional Arc Pro B60, com 24GB de VRAM e 456GB/s de largura de banda de memória, com um preço de cerca de 500 dólares por placa, oferecendo uma nova opção de hardware para computação de IA. Ao mesmo tempo, a framework KTransformers anunciou suporte para GPUs Intel. Testes mostram que, numa plataforma Xeon 5 + DDR5 + Arc A770, a execução do modelo quantizado DeepSeek-R1 Q4 pode atingir cerca de 7,5 tokens/s, oferecendo mais possibilidades de hardware para executar grandes modelos localmente. (Fonte: karminski3 | karminski3)

karminski3

DeepMind antecipa a conferência Google I/O: A conta oficial do Google DeepMind antecipou a próxima conferência Google I/O, que se realizará a 20 de maio (10h, hora do Pacífico), e será transmitida em direto na plataforma X. Espera-se que a conferência anuncie uma série de atualizações e produtos importantes relacionados com IA, continuando o forte impulso do Google no campo da IA. (Fonte: GoogleDeepMind)

🧰 Ferramentas

AgenticSeek: Agente de IA de execução puramente local, comparável ao Manus AI: AgenticSeek é um projeto open-source que visa fornecer um assistente de IA totalmente executado localmente, com capacidade de navegar autonomamente na web, escrever código e planear tarefas, mantendo todos os dados no dispositivo do utilizador para garantir a privacidade. A ferramenta é projetada especificamente para modelos de inferência locais, suporta interação por voz e dedica-se a reduzir o custo de utilização de agentes de IA (apenas consumo de energia) e o risco de fuga de dados. (Fonte: GitHub Trending)

Fosowl/agenticSeek - GitHub Trending (all/monthly)

Meituan testa internamente ferramenta de programação IA NoCode, posicionada como Vibe Coding: O 36Kr reportou em exclusivo que a Meituan lançará em breve a ferramenta de programação IA “NoCode”, com o domínio nocode.cn já registado e em fase de testes graduais. O produto, desenvolvido pela equipa de Qualidade e Eficiência de I&D da Meituan, é posicionado de forma semelhante ao “ambiente de programação” do Lovable, direcionado a não técnicos. Através de interação conversacional, completa automaticamente tarefas de codificação e implementação, como análise de dados, protótipos de produtos, geração de ferramentas operacionais, etc. O NoCode adota uma arquitetura Code Agent, capaz de raciocínio lógico em múltiplos passos, e planeia ser aberto a comerciantes e ao público em geral, reduzindo a barreira de TI para pequenas e médias empresas. (Fonte: 36氪)

美团要开放AI编程能力,将推出新产品NoCode|36氪独家

Navegador QQ da Tencent atualiza para Navegador IA, integra assistente inteligente QBot: O Navegador QQ anunciou a sua atualização para Navegador IA e lançou um assistente de IA chamado QBot, baseado nos modelos duplos Hunyuan da Tencent e DeepSeek. O QBot integra funcionalidades como pesquisa IA, navegação IA, escritório IA, aprendizagem IA, escrita IA, e introduz capacidades de AI Agent semelhantes ao Manus, capaz de executar tarefas complexas. O primeiro lote de testes graduais de Agents inclui o “AI高考通” (AI Vestibular Pass), que pode gerar planos personalizados de candidatura ao vestibular para os utilizadores. O Navegador QQ tem mais de 400 milhões de utilizadores, e esta atualização visa melhorar a eficiência com que os utilizadores obtêm informações e processam tarefas através da IA. (Fonte: 36氪)

OpenAI Codex chega à versão iOS do ChatGPT, suportando tarefas de programação em dispositivos móveis: A OpenAI anunciou que o seu assistente de programação Codex está agora integrado na aplicação iOS do ChatGPT. Os utilizadores podem iniciar diretamente novas tarefas de codificação, visualizar diferenças de código, solicitar modificações e até mesmo enviar PRs diretamente do telemóvel. A funcionalidade também suporta o acompanhamento de atividades em tempo real no ecrã de bloqueio, permitindo que os utilizadores acompanhem o progresso do trabalho do Codex a qualquer momento e continuem tarefas inacabadas ao regressar ao computador. Isto marca um passo importante na programação com IA em direção à colaboração móvel e multisscenário. (Fonte: karinanguyen_ | gdb)

karinanguyen_

Aplicação móvel NotebookLM lançada, com suporte para Android e iOS: A ferramenta de notas com IA do Google, NotebookLM, lançou oficialmente a sua aplicação móvel, que está a ser disponibilizada gradualmente nas plataformas Android e iOS. A versão móvel oferece funcionalidades essenciais como resumos em áudio e conversação, facilitando aos utilizadores a análise de conteúdo e a aprendizagem com IA em qualquer lugar e a qualquer momento. Uma funcionalidade conveniente é que os utilizadores podem encaminhar diretamente o conteúdo que estão a visualizar (exceto contas oficiais do WeChat) para o NotebookLM para processamento. (Fonte: op7418)

op7418

Public lança ferramenta de investimento IA “Generated Assets”: A plataforma de investimento Public lançou um novo produto, “Generated Assets”, que permite aos utilizadores apresentar ideias de investimento à IA. A IA, por sua vez, devolve sugestões de investimento, índices de investimento personalizados e consegue comparar retornos históricos, bem como acompanhar o desempenho em tempo real. Isto é semelhante a uma implementação de IA de “investimento por ambiente” ou “investimento temático”, com o objetivo de reduzir a barreira para os utilizadores construírem e gerirem portfólios de investimento personalizados. (Fonte: op7418)

op7418

ClaraVerse: Aplicação “tudo-em-um” que integra várias ferramentas de IA: Uma suite de ferramentas de IA chamada ClaraVerse foi partilhada pela comunidade. Integra uma interface de chat, componentes de IA, Ollama (execução local de grandes modelos), n8n (fluxos de trabalho/tarefas agendadas), modelos de AI Agent, ComfyUI (geração de imagens) e uma biblioteca de imagens com indexação por IA. O objetivo é fornecer aos utilizadores uma plataforma de trabalho de IA centralizada, simplificando o uso e a alternância entre diferentes ferramentas de IA. (Fonte: karminski3)

karminski3

Base de dados vetorial Qdrant integra protocolo NLWeb da Microsoft: A base de dados vetorial Qdrant anunciou ser um dos primeiros parceiros do protocolo aberto NLWeb, lançado pela Microsoft na conferência Build. O NLWeb visa transformar as caixas de pesquisa tradicionais em interfaces semânticas baseadas em linguagem natural e conscientes da intenção. Através da integração com o Qdrant, os websites podem utilizá-lo para pesquisa vetorial rápida e com filtros, fornecendo resultados semanticamente relevantes, sem necessidade de modificar significativamente a lógica do frontend ou backend. (Fonte: qdrant_engine)

qdrant_engine

📚 Aprendizagem

DeepMind propõe Planeamento Visual (Visual Planning): paradigma de raciocínio puramente baseado em sequências de imagens: Yi Xu e outros investigadores propuseram um novo paradigma de raciocínio chamado “Planeamento Visual” (Visual Planning), que visa permitir que os modelos pensem e planeiem inteiramente através de sequências de imagens, simulando a forma como os humanos concebem passos mentalmente, sem necessidade de pensamento linguístico ou textual. Este método explora a possibilidade de a IA realizar raciocínios complexos sob sistemas simbólicos não linguísticos, oferecendo novas perspetivas para o desenvolvimento da IA multimodal. (Fonte: madiator)

madiator

Stanford e outras instituições lançam Terminal-Bench: benchmark para avaliar capacidades de agentes de IA em tarefas de terminal: Investigadores da Universidade de Stanford e da Laude lançaram o Terminal-Bench, uma framework e benchmark para avaliar a capacidade de agentes de IA em completar tarefas complexas em ambientes de terminal do mundo real. Dado que muitos agentes de IA (como Claude Code, Codex CLI) executam tarefas valiosas através da interação com o terminal, este benchmark visa quantificar a sua eficácia real, promovendo o avanço das capacidades de agentes para implementação prática. (Fonte: madiator | andersonbcdefg)

madiator

Análise técnica do DeepSeek-V3: design codesenvolvido de software e hardware para um modelo eficiente: O modelo DeepSeek-V3 foi treinado em apenas 2048 GPUs NVIDIA H800 através de um design codesenvolvido de software e hardware. As suas inovações chave incluem Multi-Head Latent Attention (MLA), Mixture of Experts (MoE), treino com precisão mista FP8 e topologia de rede multi-plano. Estas tecnologias atuam em conjunto com o objetivo de alcançar um desempenho superior do modelo a um custo inferior, representando uma nova tendência no design de modelos de IA em direção a uma maior eficiência de custo. (Fonte: TheTuringPost)

TheTuringPost

Novo artigo discute o otimismo representacional no deep learning: a hipótese da representação emaranhada e fraturada: Kenneth Stanley e colegas publicaram um documento de posicionamento intitulado “Questionando o Otimismo Representacional no Deep Learning: A Hipótese da Representação Emaranhada e Fraturada”. O estudo aponta que redes descobertas através de pesquisa aberta não convencional, capazes de produzir uma única imagem, possuem representações elegantes e modulares; enquanto redes que aprendem a mesma saída através de SGD têm representações caóticas e emaranhadas. Isto sugere que um bom comportamento de saída pode esconder representações internas deficientes, mas também revela a possibilidade de representações melhores, com implicações profundas para a generalização, criatividade e capacidade de aprendizagem dos modelos, oferecendo novas perspetivas para melhorar modelos fundamentais e LLMs. (Fonte: hardmaru | togelius | bengoertzel)

hardmaru

Tutorial de RL atualizado, com foco no capítulo de LLM (DPO, GRPO, cadeia de pensamento, etc.): Sirbayes lançou uma nova versão do seu tutorial de Aprendizagem por Reforço (RL). Esta atualização foca-se principalmente no capítulo sobre Grandes Modelos de Linguagem (LLM), adicionando conteúdos mais recentes como DPO (Direct Preference Optimization), GRPO (Group Relative Policy Optimization) e cadeia de pensamento (Thinking). Simultaneamente, os capítulos sobre Aprendizagem por Reforço Multi-Agente (MARL), Aprendizagem por Reforço Baseada em Modelos (MBRL), Aprendizagem por Reforço Offline e DPG (Deep Deterministic Policy Gradient) também receberam pequenas atualizações. (Fonte: sirbayes)

sirbayes

ByteDance propõe estratégia de Média de Modelos Pré-treinados (Pre-trained Model Averaging): A equipa de investigação da ByteDance publicou um artigo propondo uma nova framework para a fusão de modelos durante o processo de pré-treino de grandes modelos de linguagem – a estratégia de Média de Modelos Pré-treinados (PMA). A investigação descobriu que a fusão de checkpoints treinados com uma taxa de aprendizagem constante não só pode atingir um desempenho comparável ou até melhor do que o treino contínuo, mas também pode melhorar significativamente a eficiência do treino. Este estudo oferece novas ideias para a otimização da eficiência no pré-treino de grandes modelos e valida o potencial da fusão de modelos na melhoria do desempenho e da eficiência. (Fonte: teortaxesTex)

teortaxesTex

Nova investigação do Tongyi Lab: ZeroSearch – LLM desempenha papel de motor de busca, melhora capacidade de inferência sem API: O Tongyi Lab da Alibaba propôs a framework ZeroSearch, que permite ao LLM simular o comportamento de um motor de busca durante o processo de aprendizagem por reforço, sem a necessidade de chamar efetivamente APIs de motores de busca, reduzindo assim custos e melhorando a estabilidade do treino. Este método, através de um ajuste fino leve, permite que o LLM gere resultados úteis e ruído interferente, e adota um treino curricular anti-ruído, aumentando gradualmente a capacidade de inferência e anti-interferência do modelo em cenários de pesquisa complexos. Experiências mostram que um LLM com apenas 3B de parâmetros como módulo de recuperação pode melhorar eficazmente a capacidade de pesquisa. (Fonte: 量子位)

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

Novo algoritmo RXTX da Universidade Chinesa de Hong Kong otimiza cálculo da multiplicação de matrizes XXt: Investigadores da Universidade Chinesa de Hong Kong propuseram um novo algoritmo, RXTX, para acelerar o cálculo do produto de uma matriz pela sua transposta (XXt). O algoritmo baseia-se na multiplicação recursiva de matrizes em blocos 4×4, combinada com técnicas de pesquisa por machine learning e otimização combinatória. Comparado com algoritmos existentes baseados na recursão de Strassen, o RXTX reduz a constante de multiplicação assintótica em cerca de 5% e demonstra uma vantagem no volume total de operações para n≥256, sendo 9% mais rápido que a implementação padrão do BLAS em testes com matrizes de 6144×6144. Esta investigação tem impacto potencial em áreas como análise de dados, design de chips e treino de LLMs. (Fonte: 量子位)

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

Artigo AdaptThink: Fazer com que modelos de inferência aprendam quando “pensar”: Esta investigação propõe o AdaptThink, uma framework que, através da aprendizagem por reforço, ensina modelos de inferência a escolher adaptativamente se devem ou não realizar um pensamento profundo (como Chain-of-Thought) com base na dificuldade do problema. O seu núcleo inclui um objetivo de otimização com restrições (que incentiva a redução do pensamento enquanto se mantém o desempenho) e uma estratégia de amostragem por importância (para equilibrar amostras com e sem pensamento). Experiências demonstram que o AdaptThink pode reduzir significativamente os custos de inferência e melhorar o desempenho, por exemplo, em conjuntos de dados matemáticos, reduzindo o comprimento médio da resposta do DeepSeek-R1-Distill-Qwen-1.5B em 53% e aumentando a precisão em 2,4%. (Fonte: HuggingFace Daily Papers)

Artigo VisionReasoner: Unificando perceção visual e raciocínio através de aprendizagem por reforço: VisionReasoner é uma framework unificada que visa processar múltiplas tarefas de perceção visual através de um modelo partilhado. Adota uma estratégia de aprendizagem cognitiva multi-objeto e uma reconstrução sistemática de tarefas, melhorando a capacidade do modelo de analisar inputs visuais e realizar raciocínio estruturado para lidar com dez tarefas diferentes, como deteção, segmentação e contagem. Os resultados experimentais mostram que o VisionReasoner supera modelos como o Qwen2.5VL em benchmarks como COCO (deteção), ReasonSeg (segmentação) e CountBench (contagem). (Fonte: HuggingFace Daily Papers)

Artigo AdaCoT: Ativação adaptativa de cadeia de pensamento ótimo de Pareto através de aprendizagem por reforço: Para resolver o custo computacional desnecessário da cadeia de pensamento (CoT) quando grandes modelos de linguagem (LLM) processam consultas simples, foi proposta a framework AdaCoT. Utiliza aprendizagem por reforço (PPO) para permitir que o LLM decida adaptativamente se deve ou não invocar o CoT com base na complexidade implícita da consulta, visando equilibrar o desempenho do modelo e o custo de invocação do CoT. Através da técnica de mascaramento seletivo de perdas (SLM) para evitar o colapso da fronteira de decisão, as experiências demonstram que o AdaCoT pode reduzir significativamente a taxa de ativação desnecessária de CoT (tão baixa quanto 3,18%) e o número de tokens de resposta (redução de 69,06%), mantendo ao mesmo tempo um alto desempenho em tarefas complexas. (Fonte: HuggingFace Daily Papers)

Artigo GIE-Bench: Benchmark de avaliação prático para edição de imagens guiada por texto: Para avaliar com maior precisão os modelos de edição de imagens guiados por texto, foi proposto o GIE-Bench. Este benchmark avalia a partir de duas dimensões: correção funcional (verificando se a edição foi bem-sucedida através de questões de múltipla escolha geradas automaticamente) e preservação do conteúdo da imagem (usando técnicas de mascaramento sensíveis a objetos e uma pontuação de preservação para garantir a consistência das regiões não alvo). Inclui mais de 1000 exemplos de edição de alta qualidade, cobrindo 20 categorias. A avaliação de modelos como o GPT-Image-1 mostra que lideram no seguimento de instruções, mas têm espaço para melhorias na preservação de regiões irrelevantes. (Fonte: HuggingFace Daily Papers)

Artigo InstanceGen: Geração de imagens com instruções a nível de instância: Para resolver o problema de modelos pré-treinados de texto para imagem que têm dificuldade em capturar com precisão a semântica ao processar prompts complexos contendo múltiplos objetos e atributos a nível de instância, o InstanceGen propõe uma nova técnica. Esta técnica combina uma inicialização estruturada de grão fino baseada em imagem (fornecida diretamente por modelos contemporâneos de geração de imagem) e instruções a nível de instância baseadas em LLM, permitindo que as imagens geradas sigam melhor todas as partes dos prompts de texto, incluindo o número de objetos, atributos a nível de instância e relações espaciais entre instâncias. (Fonte: HuggingFace Daily Papers)

💼 Negócios

Empresa de inteligência incorporada da Tsinghua, “Qianjue Technology”, conclui ronda de financiamento Pre-A+ de centenas de milhões de yuans: A empresa de “cérebros incorporados” Qianjue Technology concluiu recentemente uma nova ronda de financiamento Pre-A+, com investimento da Junshan Investment,祥峰投资 (Vertex Ventures) e Shixi Capital, acumulando um financiamento total de centenas de milhões de yuans. A empresa, incubada por membros centrais do Departamento de Automação da Universidade de Tsinghua e instituições de investigação de IA relacionadas, foca-se no desenvolvimento de sistemas de “cérebro incorporado” de uso geral, enfatizando a perceção multimodal em tempo real, planeamento contínuo de tarefas e capacidade de execução autónoma. Já alcançou a implementação de produtos em cenários como serviços domésticos e distribuição logística, e colabora com vários fabricantes de robôs de topo e empresas de eletrónica de consumo. (Fonte: 36氪)

清华系具身大脑团队累计融资数亿规模,对标美国头部公司,已在行业头部厂商落地|硬氪首发

AI Agents poderão remodelar o panorama do mercado SaaS: O CEO da Microsoft, Satya Nadella, previu que as aplicações SaaS enfrentarão disrupção na era dos AI Agents, desencadeando uma ampla discussão na indústria sobre o futuro dos AI Agents e do SaaS. Com as suas capacidades de perceção, decisão e ação autónomas, os AI Agents prometem resolver os pontos problemáticos do SaaS tradicional em termos de personalização, interoperabilidade de dados e experiência do utilizador, como a criação automática de fluxos de trabalho através de interação em linguagem natural, integração de dados entre aplicações e fornecimento proativo de sugestões de negócios. Embora os AI Agents atualmente enfrentem desafios em aplicações empresariais, como limitações de capacidade dos LLMs, custos e segurança de dados, fabricantes como Salesforce, Microsoft e Yonyou já começaram a integrar AI Agents nos seus produtos SaaS, explorando novos modelos de fusão ou disrupção do SaaS. (Fonte: 36氪)

AI Agent,会是SaaS的终结者吗?

IA remodela a gestão de remunerações: da análise de dados à decisão e comunicação inteligentes: A inteligência artificial está a transformar profundamente a gestão de remunerações. Um relatório da Korn Ferry mostra que a aplicação da IA na comunicação sobre remuneração, benchmarking externo e arquitetura de competências de cargos está a aumentar gradualmente. No futuro, espera-se que a IA, ao processar dados em maior escala e mais diversificados (incluindo plataformas sociais, pesquisas de terceiros), realize a transição de uma abordagem orientada por dados para uma tomada de decisão inteligente, como prever o risco de rotatividade de funcionários, avaliar a eficácia dos incentivos, ajustar dinamicamente as faixas salariais e implementar incentivos personalizados. Ao mesmo tempo, a IA também enfrenta desafios como privacidade de dados, a “caixa preta” dos algoritmos e a credibilidade dos resultados. Uma comunicação eficaz sobre remuneração é ainda mais importante na era digital e inteligente, e as ferramentas de IA podem auxiliar os gestores na comunicação sistemática e personalizada, aumentando o sentimento de justiça e satisfação dos funcionários. (Fonte: 36氪)

🌟 Comunidade

Sundar Pichai publica foto a “pensar profundamente”, antecipando o Google I/O: O CEO do Google, Sundar Pichai, publicou nas redes sociais uma foto sua a “pensar profundamente”, gerando grande expectativa na comunidade em relação à próxima conferência Google I/O. Esta foto foi partilhada e interpretada por vários KOLs da área de IA, que geralmente acreditam que prenuncia anúncios importantes do Google no campo da IA, especialmente em relação ao modelo Gemini e suas aplicações. Membros da comunidade especulam sobre possíveis novas funcionalidades, novos modelos ou novas estratégias. (Fonte: demishassabis | YiTayML | zacharynado | lmthang | scaling01 | brickroad7 | jack_w_rae | TheTuringPost | shaneguML | op7418)

demishassabis

Capacidade de programação de AI Agents gera debate acalorado, Sama otimista quanto à sua capacidade de concluir projetos inacabados automaticamente: O CEO da OpenAI, Sam Altman, expressou entusiasmo pela capacidade dos agentes de programação de IA (como o Codex) de concluir projetos que estão 80% concluídos mas não finalizados, e de realizar manutenção automática. A comunidade comparou e discutiu as capacidades de diferentes agentes de programação de IA (como Codex, Jules, Claude Code), focando em aspetos como capacidade de planeamento de tarefas, ambiente de máquina virtual (por exemplo, se está conectado à internet) e desempenho em tarefas complexas de longo prazo. Há um consenso geral de que o potencial dos AI Agents no desenvolvimento de software é enorme, mas os diferentes modelos ainda apresentam variações na implementação e nos resultados específicos. (Fonte: sama | mathemagic1an)

Introdução de deteção de conteúdo gerado por IA em universidades gera controvérsia, “Prefácio ao Pavilhão do Príncipe Teng” classificado com 100% de taxa de IA: Várias universidades na China incluíram a “taxa de deteção de conteúdo gerado por IA” na avaliação de teses, levando os estudantes a recorrer a vários métodos para evitar a deteção, e os professores a debaterem-se entre o veredito da IA e o julgamento humano. As ferramentas de deteção de IA, devido à sua dependência da comparação com bases de dados e preconceitos baseados em padrões, frequentemente classificam erradamente obras clássicas (como o “Prefácio ao Pavilhão do Príncipe Teng” com 100% de taxa de IA, e “Luar sobre o Lago de Lótus” de Zhu Ziqing com 62,88%) e escrita académica normativa como geradas por IA. Este fenómeno deu origem a uma “cadeia industrial cinzenta” para “reduzir a taxa de IA”, desencadeando uma reflexão profunda sobre as limitações da tecnologia de deteção de IA, os padrões de avaliação académica e a essência da educação. (Fonte: 36氪)

《滕王阁序》AI生成率竟达100%,高校AI检测逼疯师生

Modo de pensar da próxima geração, criada na era da IA, gera debate: A comunidade Reddit discute intensamente como o modo de pensar da nova geração de crianças, que cresce num ambiente de IA, será significativamente diferente das gerações anteriores. Elas estarão habituadas a interagir com assistentes de IA, e o foco da aprendizagem poderá mudar da memorização de factos para a formulação de perguntas e navegação em sistemas, e da aprendizagem por tentativa e erro para iteração rápida. Esta fusão precoce com a lógica das máquinas pode remodelar profundamente a sua curiosidade, memória, intuição e até mesmo a própria definição de inteligência, levantando questões sobre a formação das suas futuras crenças, capacidade de construir sistemas e confiança nos seus próprios pensamentos. (Fonte: Reddit r/ArtificialInteligence)

Rápido desenvolvimento da IA na engenharia de software gera sentimento de crise profissional entre programadores: Um engenheiro de software de 42 anos, que antes ganhava 150.000 dólares anuais, após ser ultrapassado por tendências relacionadas com IA, enviou mais de 800 currículos, mas teve poucas oportunidades de entrevista, e atualmente sobrevive a fazer entregas de comida. A sua experiência desencadeou um debate sobre se a IA (como GitHub Copilot, Claude, ChatGPT) já começou a substituir programadores em grande escala. O CEO da Anthropic previu anteriormente que a IA seria capaz de gerar a maior parte do código. Embora os dados do Bureau of Labor Statistics ainda mostrem que a engenharia de software é uma das profissões que mais cresce, a onda de despedimentos na indústria tecnológica continua, e as empresas estão a usar a IA para reduzir custos e aumentar a eficiência. Isto leva a uma reflexão sobre como a sociedade deve lidar com o desemprego estrutural causado pela IA e a construção de novos paradigmas de colaboração “humano + IA”. (Fonte: 36氪)

42岁程序员被AI淘汰,曾年薪15万美元,如今800份简历打水漂、只能靠送外卖糊口……

Problema do viés de género nos algoritmos de IA: a invisibilidade e ausência dos “dados dela”: No desenvolvimento da inteligência artificial, o problema do viés de género nos algoritmos torna-se cada vez mais proeminente. Devido a razões históricas e sociais, a representatividade dos dados femininos na recolha de dados é insuficiente (como em ensaios clínicos, entradas da Wikipédia), levando a que a IA possa gerar enviesamentos contra as mulheres em áreas como diagnóstico médico e recomendação de conteúdo. Por exemplo, sistemas de reconhecimento de imagem podem identificar erradamente homens na cozinha como mulheres, e os resultados de imagens dos motores de busca reforçam estereótipos de género. O desequilíbrio de género na indústria de IA também é considerado uma das causas. Resolver este problema requer uma abordagem multifacetada, incluindo o aumento da consciencialização dos programadores, a garantia de oportunidades de carreira justas para as mulheres, o aperfeiçoamento de leis e regulamentos, o estabelecimento de mecanismos de auditoria de género para sistemas de IA e a otimização de algoritmos (como reamostragem de dados, aplicação de inferência causal). (Fonte: 36氪)

人工智能的“歧视”:“她数据”在算法运行中隐形

AI Agents desencadeiam discussão sobre a transformação da indústria SaaS: O CEO da Microsoft, Satya Nadella, prevê que o SaaS enfrentará disrupção na era dos AI Agents. Com as suas capacidades autónomas de perceção, decisão e ação, os AI Agents prometem resolver os pontos problemáticos do SaaS em termos de personalização, interoperabilidade de dados e experiência do utilizador. Por exemplo, os AI Agents podem criar automaticamente fluxos de trabalho através de interação em linguagem natural, integrar dados entre aplicações e fornecer proativamente sugestões de negócios. Atualmente, fornecedores de SaaS como Salesforce, Microsoft e Yonyou já começaram a integrar AI Agents, explorando novos modelos de fusão ou disrupção do SaaS. Embora os AI Agents em aplicações empresariais ainda enfrentem desafios como as capacidades dos LLMs, custos e segurança de dados, o seu potencial transformador já atraiu ampla atenção da indústria. (Fonte: finbarrtimbers)

💡 Outros

IA gera cartas de Tarot ao estilo da ópera chinesa: O utilizador @op7418 usou a ferramenta de IA Lovart para criar um conjunto de cartas de Tarot ao estilo da ópera chinesa. O seu conceito de design consiste em combinar o conteúdo tradicional da ópera com o significado expresso pelas cartas de Tarot correspondentes, demonstrando o potencial de aplicação da IA no design criativo e na fusão cultural. (Fonte: op7418)

op7418

Remodelação da estrutura organizacional na era da IA: a ascensão das Equipas de Execução Estratégica (SET): O artigo discute como, na era da aceleração do desenvolvimento da IA, as estruturas organizacionais tradicionais têm dificuldade em adaptar-se à complexidade trazida pela IA. Propõe um modelo organizacional de três camadas centrado em “Equipas de Execução Estratégica” (SET), com o objetivo de tornar a IA parte da equipa, alcançando uma execução ágil e expansão inteligente através de mecanismos razoáveis de colaboração homem-máquina. As SET são responsáveis por traduzir a estratégia em ações interdepartamentais, monitorizar a entropia organizacional, ajustar flexivelmente as estratégias e coordenar a colaboração entre pessoas, processos e agentes de IA, de modo a libertar o potencial da IA e impulsionar a implementação da estratégia. (Fonte: 36氪)

设计在人工智能时代蓬勃发展的组织结构

A verificação de factos por crowdsourcing pode conter a desinformação nas redes sociais?: Preslav Nakov, professor da Universidade de Inteligência Artificial Mohamed bin Zayed, discute o impacto da substituição, pela Meta, de verificadores de factos terceirizados pelas Community Notes. Ele acredita que modelos de crowdsourcing como as Community Notes (originárias do Birdwatch do X) têm potencial, mas a moderação de conteúdo requer uma combinação de vários métodos, incluindo filtragem automática, crowdsourcing e verificação de factos profissional. Comparando com a filtragem de spam e o processamento de conteúdo prejudicial por LLMs, ele aponta que cada método tem as suas vantagens e desvantagens e devem funcionar em conjunto. Estudos mostram que as Community Notes podem ampliar o impacto do trabalho dos verificadores de factos profissionais, e embora os seus focos sejam diferentes, as conclusões são semelhantes, podendo complementar-se mutuamente. (Fonte: MIT Technology Review)

Can crowdsourced fact-checking curb misinformation on social media?

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *