Palavras-chave:Modelo de raciocínio, Agente de IA, Aprendizagem por reforço, Modelo de grande escala, DeepSeek-R1, Navegação visual-linguagem (VLN), Aprendizagem auto-supervisionada DINOv2, Agente LangGraph RAG, Localização de chips de IA, Método de otimização SRPO, Transferência de habilidades operacionais de inteligência incorporada, Governação da computação quântica
🔥 Foco
Modelos de inferência tornam-se o novo foco da IA, DeepSeek-R1 abala a indústria: Após o lançamento pela OpenAI de modelos da série o focados em raciocínio estruturado, o código aberto e o desempenho excecional do DeepSeek-R1 (especialmente em matemática e código) marcam uma nova fase na competição de grandes modelos. O foco da indústria está a deslocar-se da escala de parâmetros pré-treinados para o aprimoramento da capacidade de inferência através da aprendizagem por reforço. Grandes empresas nacionais como Baidu (Wenxin X1), Alibaba (Tongyi Qianwen Qwen-QwQ-32B), Tencent (Hunyuan T1), ByteDance (Doubao 1.5), iFlytek (Starfire X1), etc., seguiram rapidamente, lançando os seus próprios modelos de inferência, formando um novo cenário de modelos de inferência chineses a competir com a OpenAI. Esta mudança enfatiza a importância do pensamento profundo, planeamento, análise e capacidade de invocação de ferramentas dos modelos, prevendo que a implementação de aplicações como Agents dependerá mais de modelos de base de inferência robustos. (Fonte: 国产六大推理模型激战OpenAI?, “AI寒武纪”爆发至今,五类新物种登上历史舞台)

Aplicação de compras AI Nate acusada de fraude, fundador acusado de enganar investidores em 40 milhões de dólares: O Departamento de Justiça dos EUA acusa o fundador da aplicação de compras AI Nate, Albert Saniger, de obter investimentos através de publicidade enganosa sobre tecnologia AI. A Nate afirmava usar tecnologia AI para simplificar o processo de compra entre plataformas, permitindo compras com um clique, mas foi acusada de contratar centenas de funcionários nas Filipinas para processar manualmente os pedidos, usando “trabalho humano” para simular “inteligência”. O incidente expõe a possível bolha e os riscos de fraude na febre das startups de IA, e também levanta discussões sobre a cultura de “Fake it till you make it” de Silicon Valley, enfatizando a linha ténue entre exagero promocional e engano. Este caso também reflete os desafios de viabilidade técnica de certos conceitos de aplicação de IA antes da maturação da tecnologia AI (especialmente grandes modelos). (Fonte: AI购物竟是人工驱动,硅谷创投圈又玩出新花活)

IA integra-se nos fluxos de trabalho, reconfigurando o valor no local de trabalho e os modelos de gestão: A IA está a passar do conceito à prática, integrando-se profundamente nas operações empresariais e no trabalho diário dos funcionários. A Alibaba Cloud utiliza grandes modelos e governação de dados para implementar um “painel de gestão operacional organizacional”, otimizando os processos OKR/CRD; a Deloitte China dedica-se a formar dez mil talentos em IA para se adaptar às necessidades de organizações intensivas em conhecimento; a Yum China implementa ferramentas de IA ao nível dos gerentes de restaurante. Isto indica que a IA não é apenas uma ferramenta de eficiência, mas está também a remodelar a natureza do trabalho, a estrutura organizacional e as necessidades de talento. O trabalho repetitivo e padronizado está a ser substituído pela IA, exigindo mais dos funcionários em termos de criatividade, pensamento crítico, capacidade de decisão e capacidade de colaboração com IA (adaptabilidade à IA). A gestão empresarial precisa de passar da supervisão para a capacitação, estabelecendo um novo paradigma de colaboração humano-IA e mecanismos de confiança. (Fonte: 当AI来和我做同事:重构职场价值坐标系, 重塑工作:AI时代的组织进化与管理革命)

🎯 Tendências
Modelo visual auto-supervisionado DINOv2 introduz mecanismo de registos: A Meta AI Research atualizou o seu método e modelo de aprendizagem auto-supervisionada DINOv2, introduzindo um mecanismo de “registos” (registers), de acordo com o artigo “Vision Transformers Need Registers”. O DINOv2 visa aprender características visuais robustas sem supervisão, que podem ser usadas diretamente em várias tarefas de visão computacional (como classificação, segmentação, estimativa de profundidade), com bom desempenho entre domínios, sem necessidade de fine-tuning. Esta atualização pode melhorar ainda mais o desempenho e a qualidade das características do modelo. (Fonte: facebookresearch/dinov2 – GitHub Trending (all/daily))
Aprendizagem por Reforço (RL) torna-se o caminho chave para o pós-treino e aprimoramento de capacidades de LLM: Académicos como David Silver e Richard Sutton apontam que a IA está a entrar na “era da experiência”, com a RL a desempenhar um papel central na fase de pós-treino de LLM. Através da aprendizagem de modelos de recompensa a partir de feedback humano (RLHF), demonstrações ou regras (Inverse RL), a RL confere aos LLM capacidades de otimização contínua, exploração e generalização que ultrapassam a aprendizagem por imitação (como SFT). Especialmente em tarefas de raciocínio (como matemática, código), a RL ajuda os modelos a descobrir padrões de resolução mais eficazes (como longas cadeias de pensamento), superando as limitações das abordagens baseadas em dados. Isto marca uma mudança no desenvolvimento de LLM, passando da dependência de dados estáticos para a aprendizagem dinâmica através de interação e feedback. (Fonte: 被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路)

Visual-Language-Navigation (VLN) continua a ser um desafio importante na inteligência incorporada: O Professor Associado Qi Wu da Universidade de Adelaide salienta que, embora as tarefas de manipulação (Manipulation) estejam em voga no campo da inteligência incorporada, a Visual-Language-Navigation (VLN), como componente chave da Visual-Language-Action (VLA), ainda enfrenta numerosos desafios em ambientes não estruturados e dinâmicos (especialmente cenários domésticos), estando longe de ser totalmente resolvida. A navegação é a base para que os robôs executem tarefas subsequentes. Os principais estrangulamentos atuais da VLN incluem a falta de dados de alta qualidade (simuladores, ambientes 3D, dados de tarefas), o gap de transferência Sim2Real e os desafios de engenharia da implementação eficiente no dispositivo (edge). (Fonte: 阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈)

IA demonstra um caminho claro de comercialização nas áreas de publicidade e marketing: Em comparação com outros cenários de aplicação de IA, a comercialização da tecnologia AI nas áreas de publicidade e marketing parece ser mais clara e rápida. Ao utilizar IA para análise de dados, perfis de utilizador, segmentação precisa e marketing automatizado, empresas como a Applovin Corp e a Zeta Global já alteraram com sucesso o ecossistema publicitário, aumentando a eficiência e o retorno sobre o investimento. Isto indica que, na onda da IA, as aplicações capazes de gerar rapidamente valor comercial são mais facilmente favorecidas pelo mercado, sendo a publicidade e o marketing exemplos típicos. (Fonte: “AI寒武纪”爆发至今,五类新物种登上历史舞台)

Cadeia de abastecimento de chips de IA tensa e tendência de nacionalização: A competição tecnológica entre a China e os EUA intensifica-se, com os EUA a apertarem continuamente os controlos de exportação de chips de IA para a China (especialmente modelos de ponta como o Nvidia H20). Segundo relatos, várias empresas tecnológicas chinesas (como ByteDance, Alibaba, Tencent) acumularam grandes quantidades de chips Nvidia antes da entrada em vigor das proibições, para manter as suas capacidades de I&D e implementação de IA. Ao mesmo tempo, para lidar com os riscos da cadeia de abastecimento e os problemas de dependência, o caminho tecnológico de IA com stack totalmente nacional está a receber mais atenção, como por exemplo a iFlytek a treinar e implementar o seu grande modelo Starfire com base em poder computacional nacional como o Huawei Ascend, o que pode tornar-se uma tendência importante para o futuro desenvolvimento da IA na China. (Fonte: 国产六大推理模型激战OpenAI?, Reddit r/artificial, Reddit r/ArtificialInteligence)

🧰 Ferramentas
Suna: Plataforma open-source de agente de IA generalista: A Kortix AI lançou o Suna, um Generalist AI Agent (agente de IA generalista) open-source. Os utilizadores podem, através de diálogo em linguagem natural, fazer com que o Suna ajude a completar várias tarefas do mundo real, incluindo pesquisa na web, análise de dados, automação do navegador (navegação em páginas web, extração de dados), gestão de ficheiros (criação e edição de documentos), web crawling, pesquisa expandida, execução de linha de comandos, implementação de websites e integração de várias APIs e serviços. O Suna visa tornar-se o companheiro digital do utilizador, automatizando fluxos de trabalho complexos. (Fonte: kortix-ai/suna – GitHub Trending (all/daily))

Repositório Leaked System Prompts recolhe prompts internos de grandes modelos: Surgiu no GitHub um repositório popular chamado leaked-system-prompts
, que recolhe e divulga os System Prompts (prompts de sistema internos) de vários modelos de IA convencionais. Estes prompts revelam as instruções, regras, definições de papéis e restrições de segurança que os modelos foram concebidos para seguir. O repositório inclui prompts vazados de numerosos modelos, como a série Anthropic Claude (2.0, 2.1, 3 Haiku/Opus/Sonnet, 3.5 Sonnet, 3.7 Sonnet), Google Gemini 1.5, OpenAI ChatGPT (várias versões, incluindo 4o), DALL-E 3, Microsoft Copilot, xAI Grok (várias versões), entre outros, fornecendo aos investigadores e programadores uma janela para compreender os mecanismos internos de funcionamento destes modelos. (Fonte: jujumilk3/leaked-system-prompts – GitHub Trending (all/daily))
Plataforma de geração de vídeo WAN lança serviço de aceleração pago: A versão internacional da plataforma de geração de vídeo AI WAN (WAN.Video) anunciou a entrada na fase de comercialização, lançando opções pagas. Todos os utilizadores ainda podem desfrutar de geração de vídeo gratuita ilimitada (modo Relax), mas precisam de esperar numa fila. Os utilizadores pagantes, por outro lado, podem obter um serviço de geração prioritária sem fila, obtendo assim os resultados de vídeo mais rapidamente. Isto oferece um canal acelerado para utilizadores que necessitam de alta eficiência ou para fins comerciais. (Fonte: op7418)

Modelo Dia TTS chega à API do Hugging Face: Os utilizadores podem agora chamar diretamente a API do modelo Text-to-Speech (texto para voz) Dia 1.6B através da plataforma Hugging Face, um serviço suportado pela FAL AI. Os programadores podem integrar esta funcionalidade com apenas algumas linhas de código, implementando síntese de voz de alta qualidade. Esta integração reduz a barreira de entrada para usar modelos TTS avançados, facilitando a adição rápida de capacidades de voz às aplicações pelos programadores. (Fonte: huggingface)
Modelo classificador ModernBERT integra vLLM para inferência rápida: O modelo ModernBERT pode agora ser executado no framework vLLM, aumentando significativamente a velocidade de inferência. Alegadamente, a sua velocidade é suficiente para processar mais de 200.000 artigos do arXiv em poucos minutos. Esta integração permite que centenas de modelos ModernBERT alojados no Hugging Face Hub sejam implementados e aplicados mais rapidamente em tarefas de classificação de texto. (Fonte: huggingface)
Trackers: Biblioteca Python de alto desempenho para rastreamento de objetos: A Roboflow lançou em código aberto uma biblioteca Python chamada Trackers, focada em tarefas de rastreamento de objetos (object tracking). A biblioteca foi concebida para ser modular, suporta múltiplos algoritmos de rastreamento e integra-se facilmente com bibliotecas populares de machine learning como Ultralytics e Transformers. O seu desempenho é robusto, capaz de rastrear um grande número de objetos simultaneamente, tendo rastreado com sucesso mais de 269 ovos no vídeo de demonstração. (Fonte: karminski3)
Unsloth lança técnica de quantização Dynamic v2.0 GGUF e modelos: A Unsloth introduziu a nova técnica de quantização Dynamic v2.0, especificamente concebida para modelos no formato GGUF. Alegadamente, esta versão quantizada supera as versões anteriores nas avaliações MMLU e KL Divergence, e corrige problemas na implementação RoPE do Llama-4 no Llama.cpp. A Unsloth já utilizou esta técnica para lançar novos modelos quantizados do DeepSeek-R1 e DeepSeek-V3-0324 para uso da comunidade. (Fonte: karminski3)

Assistente de voz do Perplexity para iOS integra funções do sistema: A aplicação iOS do Perplexity atualizou a sua funcionalidade de assistente de voz, permitindo-lhe invocar mais operações ao nível do sistema. Os utilizadores podem agora usar comandos de voz para que o assistente Perplexity reserve restaurantes, use a navegação do Apple Maps, crie lembretes, pesquise e reproduza Apple Music ou podcasts, e chame transporte, entre outras coisas. Isto torna o assistente Perplexity funcionalmente mais próximo de assistentes nativos do sistema como o Siri, aumentando a sua utilidade. (Fonte: AravSrinivas)

Extensão VS Code MCP Server lançada, conecta Claude ao ambiente de desenvolvimento local: O programador Juehang Qin lançou uma extensão para o VS Code que transforma o VS Code num servidor MCP (Model Context Protocol). Isto permite que assistentes de IA como o Claude acedam e manipulem diretamente o workspace que o utilizador tem aberto no VS Code, incluindo ler e escrever ficheiros, visualizar informações de diagnóstico de código (como erros e avisos), etc. Quando o utilizador muda de projeto, a extensão expõe automaticamente o novo workspace, facilitando a colaboração contínua do assistente de IA entre diferentes projetos. (Fonte: Reddit r/ClaudeAI)
📚 Aprendizagem
DINOv2: Meta lança método open-source de aprendizagem de características visuais auto-supervisionadas: A Meta AI Research lançou o projeto DINOv2 em código aberto, incluindo código PyTorch e modelos pré-treinados. DINOv2 é um método de aprendizagem auto-supervisionada que visa aprender características visuais poderosas e genéricas, que apresentam excelente desempenho em múltiplas tarefas de visão computacional (como classificação de imagens, segmentação semântica, estimativa de profundidade), sem necessidade de fine-tuning para tarefas downstream. O projeto fornece documentação detalhada, links para download de modelos e artigos relacionados, sendo um recurso importante para a investigação e aplicação da aprendizagem visual auto-supervisionada. (Fonte: facebookresearch/dinov2 – GitHub Trending (all/daily))
HD-EPIC: Lançamento de conjunto de dados de vídeo na primeira pessoa com alto detalhe: Investigadores lançaram o conjunto de dados HD-EPIC, contendo 41 horas de vídeo na primeira pessoa gravado em ambientes de cozinha reais. A característica chave deste conjunto de dados são as suas anotações multimodais extremamente detalhadas, cobrindo passos de receita, informação nutricional dos ingredientes (através de registos de pesagem), descrições de ações de grão fino (conteúdo, modo, razão), gémeo digital da cena 3D, trajetórias de movimento de objetos (2D/3D), máscaras de mão/objeto, rastreamento do olhar e interação objeto-cena, entre outros. Este conjunto de dados visa fornecer um benchmark de alta qualidade para a investigação em compreensão visual na primeira pessoa, inteligência incorporada e interação humano-computador. (Fonte: CVPR 2025 | HD-EPIC定义第一人称视觉新标准:多模态标注精度碾压现有基准)

SRPO: Método de otimização para resolver treino RL interdomínio da capacidade de raciocínio de LLM: A equipa Kwaipilot da Kuaishou, enfrentando os gargalos de desempenho e problemas de eficiência ao usar métodos de aprendizagem por reforço como o GRPO para treinar LLM em tarefas mistas de matemática e código, propôs o método SRPO (Otimização de Política de Reamostragem Histórica em Duas Fases). Este método utiliza uma primeira fase com dados matemáticos para estimular o pensamento profundo, e uma segunda fase que introduz dados de código para desenvolver o pensamento programático, combinando com a técnica de reamostragem histórica para resolver o problema da variância zero do sinal de recompensa. Experiências mostram que o SRPO necessita apenas de 10% dos passos de treino para superar o DeepSeek-R1-Zero-Qwen-32B no AIME24 e LiveCodeBench, fornecendo um caminho eficiente para o aprimoramento da capacidade de raciocínio interdomínio. (Fonte: DeepSeek-R1-Zero被“轻松复现”?10%训练步数实现数学代码双领域对齐)
TTRL: Aprendizagem por reforço em tempo de teste sem dados anotados: A Universidade de Tsinghua e o Shanghai AI Lab propuseram o método TTRL (Test-Time Reinforcement Learning), que permite aos LLM realizar aprendizagem por reforço durante a fase de teste, sem necessidade de anotação manual. Este método utiliza múltiplas saídas de amostragem do próprio modelo, gerando pseudo-rótulos e sinais de recompensa através de votação por maioria, entre outras formas, impulsionando o modelo a auto-evoluir para se adaptar a novos dados ou tarefas. Experiências mostram que o TTRL pode melhorar significativamente o desempenho do modelo nas tarefas alvo, aproximando-se até dos resultados do treino supervisionado, oferecendo uma nova abordagem para resolver os desafios da aplicação de RL em ambientes não supervisionados. (Fonte: TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨)
SeekWorld: Tarefa e modelo de inferência de geolocalização simulando rastreamento de pistas visuais o3: Para aprimorar a capacidade de raciocínio visual de grandes modelos de linguagem multimodais (MLLM), especialmente simulando a capacidade do modelo o3 da OpenAI de perceber e operar dinamicamente imagens (rastreamento de pistas visuais) durante a inferência, investigadores propuseram a tarefa de inferência de geolocalização SeekWorld (inferir o local da fotografia a partir da imagem). Construíram um conjunto de dados em torno desta tarefa e treinaram o modelo SeekWord-7B através de aprendizagem por reforço. Este modelo supera modelos como Qwen-VL, Doubao Vision Pro, GPT-4o, etc., na inferência de geolocalização. O projeto disponibiliza em código aberto o modelo, o conjunto de dados e uma demonstração online. (Fonte: 一张图片找出你在哪?o3-like 7B模型玩网络迷踪超越一流开闭源模型!)
ManipTrans: Transferência de habilidades de manipulação das mãos humanas para mãos hábeis: Investigadores do Beijing General Artificial Intelligence Research Institute, da Universidade de Tsinghua e da Universidade de Pequim propuseram o método ManipTrans para transferir eficientemente as habilidades de manipulação bimanual humana para mãos robóticas hábeis em ambientes de simulação. O método adota uma estratégia de duas fases: primeiro, imita o movimento da mão humana através de um imitador de trajetória universal, e depois realiza um fine-tuning combinando aprendizagem residual e restrições de interação física. Com base neste método, a equipa lançou o conjunto de dados de manipulação com mãos hábeis em larga escala DexManipNet, contendo sequências de tarefas complexas como desapertar tampas de garrafa, escrever, colher com colher, abrir tampas de pasta de dentes, etc., e validou a viabilidade da implementação em hardware real. (Fonte: 机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手)

Tutorial LangGraph: Criar um Agent RAG com mecanismo de reflexão: A LangChain publicou um tutorial em vídeo detalhando como usar o framework LangGraph para construir um Agent RAG (Retrieval-Augmented Generation) com capacidade de reflexão (Reflection). A ideia central é adicionar um nó de avaliação ao fluxo RAG, permitindo que o Agent, antes de gerar a resposta final, analise a informação recuperada, avalie a sua relevância e qualidade, e decida, com base na avaliação, se deve recuperar novamente, corrigir a consulta ou gerar diretamente a resposta, filtrando assim eficazmente o ruído e melhorando a eficácia da resposta a perguntas. (Fonte: LangChainAI)

Arena-Hard-v2.0: Benchmark de avaliação de grandes modelos mais rigoroso: A LMSYS Org atualizou e lançou o benchmark de avaliação Arena-Hard para a versão 2.0. A nova versão baseia-se em 500 prompts mais desafiadores submetidos por utilizadores do LMArena, utiliza modelos de avaliação automática mais poderosos (Gemini-2.5 & GPT-4.1), suporta mais de 30 idiomas e adiciona avaliação da capacidade de escrita criativa. O objetivo é fornecer uma plataforma mais difícil e abrangente para diferenciar o desempenho dos melhores grandes modelos. (Fonte: lmarena_ai)

PHYBench: Lançamento de benchmark para avaliar a capacidade de raciocínio físico de LLM: A equipa de investigação da Universidade de Pequim lançou o PHYBench, um novo benchmark de avaliação especificamente concebido para avaliar a capacidade dos grandes modelos de linguagem de compreender e raciocinar sobre processos físicos do mundo real. O benchmark contém 500 questões baseadas em cenários físicos reais. De acordo com os resultados preliminares de avaliação fornecidos no artigo, o Gemini-2.5-Pro da Google lidera neste benchmark. (Fonte: karminski3)

💼 Negócios
Alibaba Tongyi Qianwen e FLock.io anunciam parceria estratégica: O grande modelo Tongyi Qianwen (Qwen) da Alibaba e a plataforma de computação de IA descentralizada FLock.io estabeleceram uma parceria estratégica. Ambas as partes visam explorar e promover conjuntamente a implementação prática da IA descentralizada, combinando as capacidades da série de modelos open-source Qwen com o framework tecnológico descentralizado da FLock.io, para oferecer novas possibilidades aos programadores e utilizadores de IA. (Fonte: Alibaba_Qwen)
Laboratório Tongyi da Alibaba recruta estagiários de investigação em diálogo multi-turno LLM: O Laboratório Tongyi da Alibaba, responsável pelo desenvolvimento da série de grandes modelos Tongyi, através da sua equipa de inteligência de diálogo, está a recrutar estagiários de investigação em Pequim e Hangzhou, focados na área de diálogo multi-turno LLM. As áreas de investigação incluem modelagem generativa de recompensas, expansão de modelos de recompensa em tempo de inferência, aprendizagem por reforço para tarefas criativas como role-playing e diálogo multimodal texto-voz. Exige-se que os candidatos sejam estudantes de doutoramento em curso, com experiência de publicação em conferências de topo, e que possam garantir pelo menos 6 meses de estágio. (Fonte: 北京/杭州内推 | 阿里通义实验室对话智能团队招聘LLM多轮对话方向研究实习生)

Ferramenta de produtividade Remio recruta estagiário de gestão de redes sociais internacionais: A startup Remio procura um estagiário familiarizado com redes sociais internacionais (Reddit, Hacker News, Twitter, etc.) e apaixonado por ferramentas de produtividade. As principais responsabilidades são a gestão de redes sociais e criação de conteúdo. A posição aceita trabalho remoto, podendo candidatar-se tanto na China como na América do Norte, com um requisito mínimo de karma no Reddit (sugerido 100+). (Fonte: dotey)
Empresa de API Kong recruta engenheiros e estagiários para a equipa de Xangai: A Kong Inc. (conhecida pelo seu API gateway open-source), através da sua equipa na China (localizada em Xangai), está a expandir o recrutamento, oferecendo várias posições, incluindo estágios e empregos a tempo integral. As áreas de recrutamento abrangem desenvolvimento em Rust, AI Gateway, Kong Gateway e desenvolvimento frontend. Programadores interessados nas respetivas stacks tecnológicas podem estar atentos. (Fonte: dotey)

Webtoon utiliza LangGraph para reduzir carga de trabalho de revisão de conteúdo em 70%: A plataforma global de banda desenhada digital Webtoon utilizou o framework LangGraph da LangChain para construir um sistema chamado WCAI (Webtoon Comprehension AI). Este sistema utiliza um Agent de IA multimodal para compreender automaticamente o conteúdo da banda desenhada, incluindo identificar personagens e atribuir diálogos, extrair enredos e tom emocional, e suportar consultas em linguagem natural. O WCAI já está a ser utilizado pelas equipas de marketing, tradução e recomendação, tendo reduzido com sucesso a carga de trabalho de navegação e revisão manual em 70%, aumentando a eficiência no processamento de conteúdo e o apoio à criação. (Fonte: LangChainAI)

Meta AI recruta talento de investigação na ICLR 2025: A equipa da Meta AI participou na conferência ICLR 2025 em Singapura, montando um stand (#L03) para interagir com os participantes. Simultaneamente, a Meta AI está a divulgar ativamente informações de recrutamento, procurando Cientistas de Investigação em IA, Investigadores de Pós-Doutoramento e Assistentes de Investigação (Doutoramento), com áreas de investigação que incluem teoria central da aprendizagem, IA generativa 3D, IA generativa de linguagem, etc. Os locais de trabalho incluem centros de investigação globais como Paris. (Fonte: AIatMeta)

🌟 Comunidade
Andrew Ng: Programação assistida por IA reduz barreira linguística, aumenta capacidade interdisciplinar dos programadores: O renomado académico de IA Andrew Ng salienta que as ferramentas de programação assistida por IA estão a mudar profundamente o desenvolvimento de software. Mesmo sem dominar uma linguagem específica (como JavaScript), os programadores podem usar a IA para escrever código eficientemente, tornando mais fácil construir aplicações multiplataforma e interdisciplinares (como programadores backend a construir frontend). Embora a sintaxe de linguagens específicas se torne menos importante, compreender conceitos centrais de programação (estruturas de dados, algoritmos, princípios de frameworks específicos como React) continua a ser crucial, ajudando a orientar a IA com mais precisão e a resolver problemas. A IA está a tornar os programadores mais “multilingues”. (Fonte: AndrewYNg)
CEO da Microsoft AI afirma que Copilot forneceu informação antecipada sobre atraso de voo: O responsável pela divisão de IA da Microsoft, Mustafa Suleyman, partilhou na plataforma X um “momento mágico”: o seu assistente Copilot AI informou-o sobre o atraso do seu voo antes do anúncio oficial do aeroporto. Após confirmação com o pessoal da porta de embarque, a informação era verdadeira, apenas ainda não tinha sido anunciada publicamente. Isto demonstra o potencial da IA na integração e transmissão de informação em tempo real, podendo superar os canais tradicionais de divulgação de informação. (Fonte: mustafasuleyman)

Comunidade discute prós e contras do GPT-4.5 e o1 Pro em diferentes tarefas: Utilizadores da plataforma X discutiram as suas experiências práticas com diferentes modelos da OpenAI. Um utilizador considerou que o GPT-4.5 tem um excelente desempenho em tarefas de escrita e tradução, mas está limitado por uma janela de contexto menor, o que prejudica o seu desempenho em textos longos. Em contraste, o modelo o1 Pro, destinado a utilizadores Pro, possui uma janela de contexto de 128K, apresentando um desempenho mais estável e fiável no processamento de longas entradas de código, sendo, portanto, mais adequado para tarefas de programação. Isto reflete as diferenças de foco no design e otimização entre os diferentes modelos. (Fonte: dotey)

Hugging Face Hub recomendado como plataforma de aprendizagem e intercâmbio em IA: Utilizadores da plataforma X recomendam o Hugging Face Hub não apenas como um repositório de modelos e conjuntos de dados, mas também como uma comunidade ativa de aprendizagem e intercâmbio em IA. Os utilizadores podem encontrar engenheiros e investigadores nas áreas de discussão de modelos, conjuntos de dados ou Spaces a partilhar os seus processos experimentais, problemas encontrados, soluções e discussões sobre artigos de investigação relacionados, obtendo assim experiência prática em primeira mão e insights profundos. (Fonte: huggingface)
“Crítica” do ChatGPT à cultura da comunidade Reddit gera debate: Um utilizador do Reddit pediu ao ChatGPT para fazer uma “crítica” (roast) à plataforma Reddit. A resposta gerada pelo ChatGPT capturou e satirizou com precisão algumas características típicas da comunidade Reddit, como as opiniões contraditórias dos utilizadores, a preocupação excessiva com o karma (upvotes), a falta de experiência real ao dar conselhos de especialista, e o comportamento de “guerreiro do teclado” em subreddits específicos. A publicação gerou discussão entre os utilizadores da comunidade e mais criações imitativas. (Fonte: Reddit r/ArtificialInteligence)
Originalidade e valor do conteúdo gerado por IA levantam questões: Uma publicação no Reddit gerou discussão sobre a originalidade do conteúdo gerado por IA. Usando a Mona Lisa como exemplo, a publicação argumenta que a própria criação humana é também um “remix” baseado na experiência, e que a IA, ao gerar conteúdo sob orientação humana, assemelha-se mais a um “mestre a orientar um aprendiz” do que a pura cópia. A discussão considera que o ponto crucial não é se a IA pode ser “original”, mas sim como atribuir crédito de forma justa, respeitar os direitos dos criadores originais e avaliar a intenção e o valor da obra. (Fonte: Reddit r/ArtificialInteligence)
Comunidade questiona a validade dos rankings de grandes modelos (LLM Leaderboard): Utilizadores da comunidade Reddit r/LocalLLaMA expressaram dúvidas ao discutir rankings de grandes modelos baseados na classificação Elo, como o LMSYS Arena. Alguns comentários sugerem que estes rankings podem refletir mais o “estilo” ou a “sensação” do modelo (como ser prolixo, usar Markdown e emojis), do que a sua real capacidade geral. Além disso, os intervalos de confiança das pontuações Elo entre os modelos de topo frequentemente sobrepõem-se, questionando a significância estatística das diferenças de ranking. (Fonte: Reddit r/LocalLLaMA)
Utilizador observa vários “comportamentos emergentes” no ChatGPT: Um utilizador do Reddit partilhou várias ocorrências de comportamentos “inesperados” que encontrou recentemente ao usar o ChatGPT, classificando-os como “comportamentos emergentes”. Especificamente: 1. Sem ser corrigido, o modelo percebeu que interpretou mal a instrução (confundindo o histórico de chat com um documento carregado) e pediu desculpa e corrigiu-se proativamente. 2. Depois de um tópico sensível mencionado pelo utilizador ter sido apagado pelo sistema, o modelo citou proativamente o conteúdo apagado numa conversa subsequente para expressar preocupação. 3. Ao discutir a dificuldade de testar o pensamento espontâneo da IA, o modelo criou proativamente um conceito análogo, o “Princípio da Incerteza Recursiva de Heisenberg”. Estes casos geraram discussão sobre os limites da autoconsciência, memória e criatividade dos LLM. (Fonte: Reddit r/ArtificialInteligence)
💡 Outros
Google DeepMind atualiza conjunto de ferramentas Music AI Sandbox: A Google DeepMind anunciou a adição de novas funcionalidades ao seu Music AI Sandbox. Trata-se de um conjunto de ferramentas experimentais de IA destinadas a músicos profissionais, com o objetivo de auxiliar na criação musical. As novas funcionalidades são impulsionadas pelo seu mais recente modelo Lyria 2 e podem ajudar compositores, letristas e outros músicos a explorar inspiração criativa, gerar trechos musicais, etc. (Fonte: demishassabis)
Discussão sobre princípios de governação da computação quântica: Membros da comunidade partilharam e discutiram princípios relativos à governação da computação quântica. Com o desenvolvimento da tecnologia de computação quântica, o seu enorme potencial em áreas como criptografia, ciência dos materiais, desenvolvimento de fármacos e a sua combinação com IA/ML suscita interesse, mas também traz desafios de segurança, éticos e de governação, exigindo a definição prévia de normas adequadas. (Fonte: Ronald_vanLoon)

MIT desenvolve robô macio vestível em forma de banana: Investigadores do MIT desenvolveram um novo tipo de robô macio vestível, com uma forma semelhante a uma banana e capacidade de deteção integrada. Esta investigação demonstra o potencial de aplicação de robôs macios na interação humano-máquina, reabilitação médica e dispositivos vestíveis, cuja estrutura flexível e deteção integrada oferecem possibilidades para uma interação física mais natural e segura. (Fonte: Ronald_vanLoon)
Avanços na tecnologia robótica impulsionada por IA: Recentemente, foram demonstrados nas redes sociais vários avanços na tecnologia robótica, geralmente potenciados por IA ou relacionados com ela: 1. SR-02: Uma “montada robótica” quadrúpede capaz de transportar quatro pessoas. 2. SnapBot: Um robô com pernas capaz de se transformar. 3. Matic: Um robô que imita o sistema visual FSD da Tesla para limpeza doméstica. 4. micropsi: Startup alemã desenvolve sistema de IA que permite aos robôs lidar com tarefas imprevisíveis. 5. Boston Dynamics Spot: Cão robô a ser testado em ambiente natural. 6. Corrida de robôs humanoides: Demonstração da capacidade de movimento de robôs humanoides. 7. Braço robótico a escrever à mão: Demonstração da capacidade de manipulação fina de robôs. (Fonte: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)
