Diário de IA - 2025-08-21(Edição da noite)

Palavras-chave：Modelo de IA, Previsão de tempestade solar, Modelo de grande código aberto, Chip de IA, Robô humanoide, Segurança de IA, Ética de IA, Aplicação de IA, Modelo de IA NASA Surya, ByteDance Seed-OSS-36B, NVIDIA GB200 NVL72, Jogos de robôs humanoides, Assistente de sono com IA

🔥 Foco

NASA e IBM lançam modelo de IA Surya para prever tempestades solares: A NASA e a IBM lançaram em conjunto o modelo de IA de código aberto Surya, treinado com uma década de dados solares, capaz de prever tempestades solares com 2 horas de antecedência. Espera-se que este modelo melhore a compreensão da física solar e da previsão do tempo espacial. Este avanço é crucial para proteger satélites, redes elétricas e astronautas, e pode impulsionar pesquisas mais aprofundadas sobre outros fenómenos astrofísicos. (Fonte: source)

NASA’s new AI model can predict when a solar storm may strike

🎯 Dinâmica

ByteDance lança modelo de grande escala Seed-OSS de código aberto: A ByteDance lançou o modelo de grande escala de código aberto Seed-OSS-36B, com 36 bilhões de parâmetros, apresentando uma janela de contexto nativa ultralonga de 512K e um mecanismo de “orçamento de pensamento” que permite controlar flexivelmente a profundidade da inferência. O modelo quebrou recordes de código aberto em vários benchmarks, destacando-se especialmente nas capacidades de inferência e Agent. Com apenas 12T de dados de treino, oferece duas versões para pesquisa: uma com instruções sintéticas e outra sem. (Fonte: source, source)

Lançamento da série Google Pixel 10 e avanços na integração de IA: A série de telemóveis Google Pixel 10 foi lançada, equipada com o chip de nova geração Google Tensor G5 e o modelo Gemini Nano, oferecendo uma experiência de IA mais personalizada, proativa e útil. As novas funcionalidades incluem tradução de voz no dispositivo, alertas proativos Magic Cue e a tecnologia magnética Pixelsnap. Rick Osterloh, chefe de dispositivos e serviços da Google, insinuou que a Apple “falhou nas suas promessas” em relação à IA móvel, destacando a intensa concorrência nos telemóveis com IA. (Fonte: source, source, source, source, source, source, source)

DeepSeek V3.1: Melhoria de desempenho e vantagem de custo: O DeepSeek V3.1 expandiu o comprimento do contexto para 128K e demonstrou melhorias significativas nas capacidades de programação, escrita criativa, tradução e matemática. Testes práticos revelaram que superou o Claude Opus 4 no benchmark aider com uma pontuação de 71,6%, tornando-se o SOTA para modelos não-inferenciais, e é 68 vezes mais barato, com capacidades de compreensão física aprimoradas. Isto prenuncia a forte competitividade dos modelos de código aberto com excelente relação custo-benefício. (Fonte: source, source)

Meta reestrutura departamento de IA e Alexandr Wang assume liderança: A Meta realizou uma grande reestruturação do seu departamento de IA, dividindo-o em quatro unidades: TBD Lab, FAIR, Produtos e Infraestrutura. Alexandr Wang, de 28 anos, um chinês-americano, assumirá a liderança do laboratório de superinteligência, com vários executivos, incluindo o vencedor do Prémio Turing Yann LeCun, a reportar diretamente a ele. Esta reorganização visa acelerar o desenvolvimento da IA, e embora acompanhada por um congelamento de contratações e dissolução de equipas, sublinha o firme investimento da Meta na área da IA. (Fonte: source, source, source)

Geopolítica dos chips de IA e o mercado chinês: O governo chinês está a realizar revisões de segurança em processadores de IA americanos, como os da Nvidia, e a encorajar as empresas nacionais a adquirir GPUs de fabrico doméstico para reduzir a dependência da tecnologia dos EUA. A Nvidia está a desenvolver chips de IA mais potentes para o mercado chinês, mas a China poderá avançar com uma proibição total do uso de chips estrangeiros em inferência, com fatores geopolíticos a continuarem a afetar a cadeia de abastecimento de chips de IA. (Fonte: source, source, source)

China Questions Nvidia, When Models Memorize, Mixture of Video Experts, OpenAI & Oracle Join Forces

GPT-5 Pro prova teorema matemático de forma independente: Sebastien Bubeck, ex-vice-presidente de IA da Microsoft, descobriu que o GPT-5 Pro resolveu de forma independente um problema não resolvido numa tese de matemática, com um processo de prova diferente dos métodos humanos e resultados superiores à versão v1 da tese. Embora o autor original tenha fornecido uma solução melhor na v2, este incidente ainda demonstra a capacidade do GPT-5 Pro de resolver problemas matemáticos avançados de forma autónoma, gerando uma ampla discussão na comunidade de IA sobre o potencial da IA na pesquisa matemática. (Fonte: source, source, source, source, source, source, source, source)

刚刚，GPT-5 Pro自证全新数学定理，OpenAI总裁直呼颠覆，大佬们集体转发

Jogos de Robôs Humanoides demonstram avanços tecnológicos: A primeira edição dos Jogos de Robôs Humanoides demonstrou avanços e desafios tecnológicos em equilíbrio dinâmico, perceção ambiental e colaboração multi-máquina para robôs humanoides, com destaque para a corrida totalmente autónoma do Ultra. O evento não é apenas um campo de testes tecnológicos, mas também revela o potencial comercial dos robôs em setores como indústria, saúde e hotelaria, impulsionando a “economia de campo de jogo” e a formação de um ecossistema de desenvolvimento secundário. (Fonte: source)

NVIDIA acelera desempenho de modelos OpenAI: A NVIDIA, em colaboração com a Artificial Analysis, aumentou a velocidade de saída do modelo gpt-oss-120B da OpenAI em 35% numa semana. Em testes de consulta única num sistema DGX, superou 800 tokens/s, e em consultas multi-concorrentes, atingiu quase 600 tokens/s. Através do TensorRT-LLM e da tecnologia de descodificação especulativa, demonstrou uma aceleração significativa da inferência de grandes LLMs pelo hardware Blackwell. (Fonte: source, source)

NVIDIA Achieves 35% Performance Boost for OpenAI’s GPT-OSS-120B Model

Sistema de roteamento de IA doméstico Avengers-Pro de código aberto: O Shanghai AI Lab lançou o Avengers-Pro, uma solução de roteamento de agendamento multi-modelo de código aberto, que integra 8 modelos de grande escala líderes. Em conjuntos de dados desafiadores, o seu desempenho superou o GPT-5-medium em 7% e o Gemini-2.5-Pro em 19%, ao mesmo tempo que alcança o mesmo desempenho com um custo tão baixo quanto 19%. Através da correspondência e alocação dinâmica de modelos, equilibra eficazmente desempenho e custo. (Fonte: source)

Perplexity desenvolve funcionalidade SuperMemory: A Perplexity está a desenvolver uma nova funcionalidade chamada “SuperMemory”, que visa proporcionar a todos os utilizadores uma capacidade de memória mais poderosa. Testes iniciais mostram que o seu desempenho é superior aos produtos existentes, com potencial para melhorar significativamente a compreensão de contexto a longo prazo e a experiência personalizada dos assistentes de IA. (Fonte: source, source)

Anthropic Claude Code lança versões para equipas e empresas: A Anthropic anunciou que o Claude Code está agora disponível em versões para equipas e empresas, oferecendo planos de preços flexíveis que permitem às organizações misturar lugares padrão e premium conforme as necessidades, e escalar com base na utilização, visando satisfazer as exigências de utilizadores empresariais de assistentes de código de IA. (Fonte: source, source)

Google Gemini 2.5 Pro integrado no VS Code Copilot: O Google Gemini 2.5 Pro está agora geralmente disponível no Copilot do Visual Studio Code, oferecendo aos programadores capacidades de programação assistida por IA mais poderosas. (Fonte: source, source)

NVIDIA lança modelo Cosmos Reason VLM: O NVIDIA Cosmos Reason, um modelo de linguagem visual (VLM) de 7B parâmetros, aberto e personalizável, já atingiu 500 mil downloads no HuggingFace, ajudando a moldar o futuro da IA física e da robótica, tornando-se um dos modelos mais populares da NVIDIA. (Fonte: source)

Half a million downloads? No big deal. #NVIDIACosmos Reason — an open, customizable, 7B-parameter VLM — is helping shape ...

Plataforma Groq lança funcionalidade de cache de prompts: A plataforma Groq lançou a funcionalidade de cache de prompts para o modelo moonshotai/kimi-k2-instruct, oferecendo um desconto de 50% em tokens em cache, menor latência e correspondência automática de prefixos, visando proporcionar aos utilizadores uma experiência de “vibe coding” mais económica e rápida. (Fonte: source)

NVIDIA lança modelo Nemotron Nano v2: A NVIDIA lançou o Nemotron Nano v2, um modelo SSM híbrido de 9B parâmetros, 6 vezes mais rápido e mais preciso que modelos de tamanho semelhante, e também disponibilizou a maior parte dos dados de treino, incluindo o corpus de pré-treino, como código aberto, fornecendo recursos eficientes e transparentes para a comunidade de IA. (Fonte: source)

NVIDIA Nemotron Nano v2 - a 9B hybrid SSM that is 6X faster than similarly sized models, while also being mo...

DinoV3 destaca-se em tarefas de geolocalização: O DinoV3 destacou-se em tarefas de geolocalização, superando modelos do tipo CLIP e tornando-se a nova rede backbone preferencial. A sua melhoria de desempenho é surpreendente, uma vez que o DinoV3 não aprendeu diretamente nomes de locais e associações de imagens como os modelos CLIP. (Fonte: source)

DinoV3 just became the new go-to backbone for geoloc! It outperforms CLIP-like models (SigLip2, finetuned StreetCLIP)… and th...

Aplicação da IA na pesquisa da doença de Alzheimer: A Iniciativa de Dados da Doença de Alzheimer estabeleceu um prémio de 1 milhão de dólares para ferramentas de Agentic AI capazes de conduzir pesquisas independentes sobre a doença de Alzheimer, incluindo planeamento de análises, integração de dados, identificação de alvos terapêuticos e otimização de ensaios clínicos, visando acelerar o processo tradicional de desenvolvimento de medicamentos. (Fonte: source, source)

$1M prize launched for AI that can independently research Alzheimer's treatments!

Melhoria de desempenho na renderização 3D impulsionada por IA: O desempenho de carregamento PLY do 3D Gaussian Splatting (3DGS) obteve uma melhoria massiva, com 2,9 milhões de pontos gaussianos a serem carregados em apenas 0,22 segundos. Isto foi alcançado através de mapeamento de memória, parsing de cópia zero, paralelização TBB e tecnologia SIMD, prenunciando um salto significativo na eficiência da renderização de conteúdo 3D. (Fonte: source)

That's actually not too bad. 27.6m Gaussians parsed in ~1277ms !

Aplicação da IA na área de cibersegurança ofensiva e defensiva: A Palisade Research testou a capacidade do modelo OpenAI o3 em simular a penetração autónoma em redes empresariais, demonstrando o progresso dos AI Agents desde a resolução de problemas restritos como CTF até à penetração de redes que envolvem múltiplos computadores e vulnerabilidades, prenunciando o potencial de aplicação da IA na área de cibersegurança ofensiva e defensiva. (Fonte: source)

Avanços da IA na área de prova de teoremas matemáticos: A PolyComputing afirma que o seu modelo proprietário é capaz de resolver 99% dos problemas matemáticos de Putnam, enquanto o Seed-Prover superou largamente o SOTA anterior no PutnamBench, demonstrando a poderosa capacidade da IA na prova de matemática avançada e na resolução de problemas, prenunciando novos avanços na área de prova de teoremas. (Fonte: source, source)

PolyComputing’s proprietary models solve 99pc of all Putnam problems. Try on Leibniz today lol.

Comparação de desempenho H100 e GB200: Dylan Patel partilhou uma análise detalhada do H100 e do GB200 NVL72 em termos de desempenho de treino, consumo de energia, Custo Total de Propriedade (TCO) e fiabilidade, destacando especificamente os desafios de fiabilidade e problemas de tempo de inatividade do backplane do GB200, e enfatizando a importância da otimização de software para melhorar o desempenho do H100. (Fonte: source)

Arquitetura e implementação de AI Agent: A arquitetura Deep Agents está agora disponível através de um pacote TypeScript, concebida para construir Agents composíveis e práticos, resolvendo problemas complexos através de inferência em cadeia, planeamento adaptativo e coordenação de ferramentas. O LiveKit Cloud também já suporta a implementação de AI Voice Agents, oferecendo balanceamento de carga com estado, gestão de capacidade, rollback instantâneo e observabilidade operacional, simplificando a implementação e operação de aplicações de voz de IA na cloud. (Fonte: source, source)

Modo em tempo real de processamento de fluxo Databricks Spark: O processamento de fluxo Apache Spark da Databricks lançou agora uma pré-visualização pública do modo em tempo real, permitindo aos utilizadores obter latência ultrabaixa simplesmente alterando a configuração, simplificando a complexidade do processamento de dados em tempo real. (Fonte: source)

Tendências de aplicação de modelos de IA em telemóveis: O Product Hunt mostra uma explosão de ferramentas de IA, com a interação de voz por IA, fluxos de trabalho inteligentes, digitalização da vida saudável e democratização das ferramentas de criação a tornarem-se tendências claras, indicando que a IA está a penetrar profundamente em vários campos. Os Google Pixel Buds Pro 2 estão prestes a lançar novas funcionalidades de IA, incluindo atender chamadas com um aceno de cabeça/negação, conversas em ambientes ruidosos e áudio adaptativo, aumentando a integração da IA em dispositivos vestíveis. (Fonte: source, source)

Avanços da IA na geração de imagens e vídeo: A Google Gemini App agora suporta a funcionalidade de geração de vídeo, permitindo aos utilizadores criar rapidamente vídeos com som através de entrada de texto ou foto. A HeyGen lançou a funcionalidade “Voice Mirroring”, melhorando as capacidades de geração de vídeo e voz de IA. A Kling AI lançou a funcionalidade 2.1 Keyframes, permitindo aos utilizadores gerar rapidamente vídeos em múltiplas dimensões. (Fonte: source, source, source)

Novas ferramentas de IA em design e engenharia: O MagicPath demonstrou a aplicação da IA em fluxos de trabalho de design profissional, onde os utilizadores podem explorar e prototipar com IA. Os utilizadores que experimentaram o Zoo.dev (anteriormente KittyCAD) para design CAD descobriram que desenhar através de código é mais eficaz do que os fluxos de trabalho tradicionais do OnShape, prenunciando o potencial de aplicação da IA na engenharia de design. (Fonte: source, source)

Aplicação da IA em cenários domésticos: A empresa de colchões inteligentes Eight Sleep está a desenvolver um assistente de sono de IA, que visa fornecer gestão e otimização personalizada do sono através da simulação de um gémeo digital dos hábitos de sono do utilizador. A Ana da empresa de IA TextQL será integrada em frigoríficos inteligentes, prenunciando a maior popularização dos assistentes de IA em cenários domésticos e dispositivos diários. (Fonte: source, source)

Aplicação da IA nas áreas jurídica e financeira: A Spellbook Legal utiliza IA para acelerar o processamento de contratos, resolvendo a contradição entre a aceleração das atividades comerciais e o atraso dos processos contratuais. O analisador de extratos bancários de IA é capaz de converter extratos bancários em PDF em insights financeiros consultáveis, utilizando a análise RAG e YOLO da LangChain, e processando-os através de um LLM local para automatizar o rastreamento financeiro pessoal. (Fonte: source, source)

Aplicação da IA em pesquisa de mercado e saúde digital: O Yupp.ai é recomendado como uma ferramenta de pesquisa de mercado, visando resolver o problema de o ChatGPT ou Claude poderem fornecer respostas únicas, tendenciosas ou até erradas ao filtrar grandes volumes de informação, proporcionando uma análise mais abrangente e precisa para o mercado cripto em rápida mudança. O Night Knight é um assistente de saúde digital concebido para ajudar os utilizadores a reduzir o tempo de ecrã do telemóvel e melhorar os padrões de sono. (Fonte: source, source)

Geração de personagens de IA e criação de Voice Agent: A Higgsfield AI lançou o “Higgsfield Soul”, afirmando ter construído os personagens de IA mais consistentes e dando aos utilizadores controlo total na narrativa. A plataforma Cartesia.ai simplificou enormemente o processo de criação de Voice Agents conversacionais; funcionalidades que antes eram “tecnologia alienígena” podem agora ser configuradas em apenas um minuto, marcando uma redução significativa na barreira de entrada para a tecnologia de voz de IA. (Fonte: source, source)

Atualizações de ferramentas de programação assistidas por IA: O Jupyter Agent 2 foi lançado, impulsionado pelo Qwen3-Coder, pode ser executado em Cerebras e executado por E2B, permitindo aos utilizadores carregar ficheiros para carregamento de dados, execução de código e plotagem de resultados. O Just-RAG é um sistema de diálogo inteligente para PDFs, combinando os fluxos de trabalho Agentic do LangGraph com as capacidades de pesquisa vetorial do Qdrant para um processamento de documentos aprimorado. (Fonte: source, source)

Ferramentas de IA para criatividade e design: A Argil.ai lançou a funcionalidade “Fictions”, onde os utilizadores podem transformar personagens em imagens específicas com apenas uma imagem e um prompt, demonstrando a capacidade “mágica” da IA na geração de imagens e transformação criativa. O Google Photos agora integra ferramentas de edição de IA, permitindo aos utilizadores desfocar fotos, corrigir a iluminação e outras operações através de comandos de texto ou voz. (Fonte: source, source, source)

Aplicação da IA na criação musical e reconhecimento de drones: O Eleven Music (ElevenLabs) está agora integrado no Anycoder, suportando a geração de texto para música e fornecendo capacidades de criação musical para aplicações “vibe coded”. O desempenho excecional do Supervision no reconhecimento de drones, com uma taxa de reconhecimento extremamente alta, pode até ser diretamente aplicado em cenários práticos, indicando a aplicação madura da tecnologia de visão computacional em cenários específicos. (Fonte: source, source)

Aplicação da IA em documentos empresariais e sistemas de diálogo: A StackAI, em colaboração com a LlamaCloud, lançou um novo estudo de caso, demonstrando como o seu Enterprise Document Agent pode processar mais de 1 milhão de documentos com análise de alta precisão. O ChuanhuChat é uma interface web que suporta múltiplos LLMs, Agents autónomos e Q&A de documentos, construída com base em LangChain, oferecendo uma UI moderna e responsiva e respostas em tempo real. (Fonte: source, source)

Aplicação da IA na conversão de código e em personal trainers de saúde: Os utilizadores demonstraram a capacidade da IA na conversão de código, onde a IA consegue lidar com tarefas de conversão de Python para C, mesmo aquelas que exigem “portabilidade direta linha a linha”. A Google lançou um personal trainer de saúde impulsionado pelo Gemini, que oferece planos de fitness e sono personalizados, e fornece insights baseados em dados e Q&A de saúde com suporte científico. (Fonte: source, source)

Aplicação da IA em programação e inteligência de desktop: O Qwen3-Coder teve um desempenho excecional no benchmark NoCode-bench, que inclui 634 tarefas de adição de funcionalidades de software do mundo real. O ComputerRL é uma framework para inteligência de desktop autónoma, permitindo que os AI Agents operem habilmente espaços de trabalho digitais complexos através do paradigma API-GUI. (Fonte: source, source, source)

📚 Aprendizagem

Execução e otimização de LLM localmente: A MIT Technology Review publicou um guia que ensina os utilizadores a executar modelos de linguagem grandes (LLMs) localmente nos seus computadores pessoais, para abordar preocupações com a privacidade e libertar-se do controlo de grandes empresas de IA. Simultaneamente, o DSPy é descrito como um modelo de programação declarativa que permite aos utilizadores expressar intenções em linguagem natural e fornece ferramentas para otimizar prompts, simplificando o desenvolvimento de aplicações LLM. Os utilizadores partilharam que, ao otimizar com DSPy usando modelos mais baratos e depois utilizando modelos mais potentes em produção, alcançaram economias de custo e melhorias de desempenho significativas. (Fonte: source, source, source)

Pesquisa sobre generalização de modelos de IA e mecanismos de memória: Investigadores da Meta, Google, Cornell e Nvidia propuseram um novo método para quantificar o grau em que os modelos de linguagem grandes memorizam dados de treino durante o processo de treino, calculando o número de bits necessários para o modelo representar os dados. Esta pesquisa fornece uma base teórica para compreender a capacidade de generalização dos modelos e reduzir a memorização excessiva, e indica que mais dados de treino contribuem para a generalização do modelo. (Fonte: source)

Charts showing how much information language models memorize based on model size and training dataset size; one graph uses random data, the other uses real-world text.

Cognição corporificada e LLM multimodal: O RynnEC é um modelo de linguagem grande multimodal de vídeo concebido para cognição corporificada, que permite uma interação de vídeo flexível ao nível da região através de um codificador de região e um descodificador de máscara. Este modelo alcançou o SOTA na compreensão de atributos de objetos, segmentação de objetos e inferência espacial, fornecendo um paradigma de vídeo centrado na região para a perceção e interação precisa de agentes corporificados. (Fonte: source)

Framework de geração e edição de conteúdo 3D: O Tinker é uma framework de edição 3D multifuncional que permite edição 3D de alta fidelidade e consistente em múltiplas vistas a partir de um pequeno número de imagens de entrada, sem necessidade de ajuste fino cena a cena. Reutiliza modelos de difusão pré-treinados para desbloquear as suas capacidades latentes de perceção 3D e introduz um editor impulsionado por referência e um sintetizador de vídeo de qualquer vista, reduzindo significativamente a barreira para a criação de conteúdo 3D generalizável. (Fonte: source)

Treino de AI Agent para engenharia de software assistida por IA: Investigadores lançaram o SWE-smith, um pipeline que constrói automaticamente dados de treino realistas para ajustar Agents de engenharia de software. Através da injeção e validação de bugs em repositórios Python, e usando Agents para gerar soluções de reparação em várias etapas, fornece um conjunto de dados de código aberto de alta qualidade e ferramentas para o treino de Agents de engenharia de software. (Fonte: source)

Researchers introduced SWE-smith, a pipeline that automatically builds realistic training data to fine-tune software engineering agents.

Avaliação de LLM e recuperadores personalizados: É enfatizado que avaliações e métricas genéricas não conseguem refletir os modos de falha do mundo real, exigindo avaliações específicas de domínio para aplicações específicas. A LlamaIndex colaborou com a Superlinked para demonstrar, através de um tutorial, como construir recuperadores personalizados que compreendem o contexto e a terminologia específicos do domínio, fornecendo capacidades de recuperação de dados mais precisas para sistemas RAG. (Fonte: source, source, source, source)

Build custom retrievers that beat generic vector search by understanding domain-specific context and jargon 🎮 The team at @supe...

Pesquisa em segurança de IA e interação humano-máquina: Haimin Hu, doutor pela Universidade de Princeton, partilhou a sua pesquisa em sistemas autónomos centrados no ser humano, garantindo que sistemas como veículos autónomos e drones sejam seguros, verificáveis e confiáveis em ambientes humanos através da integração de teoria dos jogos, machine learning e controlo crítico de segurança. Ele enfatizou que os robôs precisam planear movimentos num espaço conjunto de estados físicos e de informação para se adaptarem às preferências humanas e melhorarem as suas habilidades. (Fonte: source)

Interview with Haimin Hu: Game-theoretic integration of safety, interaction and learning for human-centered autonomy

Dados de treino de LLM e avaliação de modelos: Um utilizador da comunidade Reddit treinou um LLM do zero, baseado apenas em textos de Londres do século XIX, e descobriu que o modelo não só conseguia imitar o estilo de linguagem da época, mas também recordar eventos históricos reais. Simultaneamente, os utilizadores avaliaram o modelo GPT-OSS 120B no M2 Ultra, e os resultados foram consistentes com os dados dos fornecedores de cloud, demonstrando o potencial de desempenho de grandes modelos de código aberto em hardware de consumo. (Fonte: source, source)

My LLM trained from scratch on only 1800s London texts brings up a real protest from 1834

Controvérsia e resposta sobre o modelo de difusão DiT: O DiT, um pilar fundamental dos modelos de difusão, foi questionado por erros matemáticos e formais, e até mesmo por não possuir componentes Transformer. Xie Saining, autor do DiT, respondeu que as dúvidas surgiram de uma má interpretação da estratégia Tread, e enfatizou a eficácia do DiT, apontando que as suas melhorias se concentraram na aprendizagem de representações internas e na otimização do treino, ao mesmo tempo que reconheceu que o VAE é o ponto crítico do DiT. (Fonte: source)

Otimização de inferência de LLM e qualidade dos dados de treino: Discute-se o problema do cache KV na otimização da inferência de LLM, propondo a ideia de “não armazenar o cache KV, mas sim recalcular diretamente” para eliminar gargalos de memória. Simultaneamente, as redes sociais apontam que, dada a má qualidade geral dos dados, é um “milagre” que os LLMs tenham alcançado qualquer resultado até agora, enfatizando o papel crucial da qualidade dos dados no treino de modelos. (Fonte: source, source)

Feel like I'm taking crazy pills. We are just back at step one. Don’t store KV cache, just recompute it.

Modelo de programação LLM e Agent de auto-melhoria: O DSPy é descrito como um modelo de programação declarativa que permite aos utilizadores expressar intenções em linguagem natural e fornece ferramentas para otimizar prompts. Simultaneamente, é introduzido o conceito de “engenharia composta”, que, através do uso diário de prompts de “auto-melhoria”, permite que a IA avalie as suas próprias regras e proponha atualizações com base nos pontos de atrito da tarefa, otimizando continuamente o desempenho e a eficiência do assistente de IA. (Fonte: source, source)

Aprendizagem por reforço multi-objetivo e testes de red team: É introduzido um método de teste de red team multi-objetivo, baseado em aprendizagem por reforço. Este algoritmo pode ser usado para otimizar a perplexidade e a indução de toxicidade de LLMs, a fim de gerar ataques de alta probabilidade, difíceis de filtrar e naturais, o que é crucial para melhorar a segurança dos modelos de IA. (Fonte: source, source)

Sistemas de AI Agent e tecnologia de destilação: É introduzido o conceito de “Chain-of-Agents”, que, através da destilação e da aprendizagem por reforço Agentic, treina um único modelo para possuir as capacidades de um sistema multi-Agent, resultando numa redução significativa de 84,6% nos custos de inferência, oferecendo uma nova abordagem para a construção eficiente de sistemas Agent complexos. (Fonte: source)

Chain-of-Agents Interesting idea to train a single model with the capabilities of a multi-agent system. 84.6% reduction in inference cost! D...

Geração de código editável a partir de nuvens de pontos 3D: O MeshCoder é uma framework inovadora que reconstrói nuvens de pontos 3D em scripts Python editáveis para o Blender. Esta framework, através do desenvolvimento da Blender API e da construção de um vasto conjunto de dados objeto-código, treina LLMs multimodais para realizar a reconstrução 3D e suporta edições geométricas e topológicas através de modificações de código, melhorando a capacidade de inferência dos LLMs na compreensão de formas 3D. (Fonte: source)

Framework de segmentação de peças 3D GeoSAM2: O GeoSAM2 é uma nova framework de segmentação de peças 3D impulsionada por prompts, capaz de realizar segmentação 3D com qualquer nível de detalhe através de prompts 2D simples, e alcançou o SOTA nos conjuntos de dados PartObjaverse-Tiny e PartNetE, com sobrecarga mínima e forte capacidade de generalização para o mundo aberto. (Fonte: source)

Conjunto de dados de recomendação musical multimodal e conversacional: A HuggingFace lançou o TalkPlayData-2, um raro conjunto de dados de recomendação musical multimodal e conversacional, cujo conjunto de testes já está disponível, fornecendo um recurso valioso para a pesquisa na área de recomendação musical. (Fonte: source)

Re its test set is already available on @huggingface! definitely rare to find a music recommendation dataset, that is multimodal and ...

Treino de modelos de difusão e o papel do VAE: Discute-se a necessidade de um gargalo de alta dimensão ou transformação para um espaço latente ao treinar modelos de difusão de alta dimensão, apontando o papel crucial do VAE nestes modelos para garantir que operam em espaços de menor dimensão, resolvendo os desafios de entradas e saídas de alta dimensão. (Fonte: source)

If you want to train high-dimensional diffusion model, you absolutely need high-dimensional bottleneck OR transformation to latent-space. Here is why.

Aprendizagem por reforço de LLM em tarefas abertas: O trabalho do Ant Group na área de aprendizagem por reforço (RL) é considerado interessante e subestimado, especialmente a sua capacidade de integrar recompensas baseadas em regras em tarefas abertas para pontuação automática de resultados subjetivos, fornecendo uma extensão para o paradigma RLVR. (Fonte: source)

Reinforcement Learning with Rubric Anchors

Novo artigo sobre abstração causal e filosofia da computação: As redes sociais recomendam o novo artigo de Atticus Geiger sobre abstração causal e filosofia da computação, uma pesquisa que explora questões teóricas fundamentais no campo da IA. (Fonte: source)

my good friend Atticus Geiger has written an interesting new paper on causal abstraction <=> philosophy of computation! since he has...

💼 Negócios

Databricks avaliada em mais de 100 mil milhões, acelera estratégia de IA: A plataforma de análise de dados de IA Databricks concluiu a sua ronda de financiamento Série K, com uma avaliação superior a 100 mil milhões de dólares, tornando-se o quarto maior unicórnio de IA do mundo. A empresa utilizará os fundos para acelerar a sua estratégia de IA, incluindo a expansão dos serviços Agent Bricks e o investimento na base de dados Lakebase. A sua arquitetura “lakehouse” destaca-se na era da IA, com uma base de clientes que já ultrapassa os 15.000, e espera-se que atinja lucros de fluxo de caixa livre em 2025. (Fonte: source, source, source)

Reavaliação de ativos de energia dos EUA impulsionada por IA: Um relatório do Morgan Stanley aponta que o investimento em infraestruturas impulsionado pela IA reavaliou os ativos de energia dos EUA. A procura por GPUs, superior ao esperado, tornou o fornecimento de energia o maior gargalo, prevendo-se que os centros de dados de IA nos EUA enfrentem um défice de energia de 45-68GW entre 2025 e 2028. O relatório sublinha que as empresas capazes de fornecer soluções de energia primeiro se tornarão o cerne da reavaliação de valor na cadeia de IA, sendo o gás natural e a energia nuclear as principais fontes de energia de transição. (Fonte: source)

OpenAI e Oracle colaboram na construção de um centro de dados de grande escala: A OpenAI e a Oracle estão a colaborar no planeamento da construção de um centro de dados de grande escala que consumirá 4,5 gigawatts de eletricidade, como parte do seu projeto “Stargate”, para satisfazer a sua crescente procura por capacidade de computação. Esta iniciativa demonstra que a OpenAI está a estabelecer uma estreita colaboração com grandes fornecedores de serviços de cloud para garantir o vasto poder computacional necessário para o desenvolvimento e expansão dos seus modelos, e pode vir a tornar-se um futuro fornecedor de poder computacional. (Fonte: source, source, source)

Aerial view of a large, partially constructed data center surrounded by parked vehicles and red soil in Abilene, Texas

🌟 Comunidade

Bolha da IA e expectativas de mercado: Um relatório do MIT revela que a maioria dos investimentos empresariais em IA não gerou retorno, levantando preocupações sobre o rebentamento da bolha da IA e levando à queda das ações de tecnologia dos EUA. Mesmo Sam Altman admitiu que a especulação atual é insustentável. Nas redes sociais, o tema gerou intenso debate, com alguns a sugerir que o pico tecnológico da IA pode ter passado, enquanto outros argumentam que o investimento em IA é um recurso computacional geral e não será totalmente desperdiçado. (Fonte: source, source, source, source, source)

Discussão sobre “consciência” e ética da IA: As redes sociais discutem amplamente as questões da “consciência” e “personificação” da IA, enfatizando que a IA deve servir a humanidade e não se tornar uma “pessoa”. Alguns argumentam que os desenvolvedores de IA criam a ilusão de “IA aparentemente consciente” através do uso de terminologia humana e da exacerbação de capacidades, o que pode levar a problemas éticos e legais, e até mesmo a “psicose de IA”. Apela-se à educação do público, à evitação de publicidade enganosa e à atenção ao impacto da IA na saúde mental. (Fonte: source, source, source)

Vazamento de registos de chat do Grok e segurança da privacidade da IA: Foi revelado que o chatbot de IA Grok, da empresa de Elon Musk, expôs acidentalmente centenas de milhares de registos de chat de utilizadores, que foram indexados por motores de busca. O conteúdo incluía informações pessoais sensíveis, geração de imagens de ataques terroristas e escrita de malware. Este incidente expôs uma falha grave do Grok na proteção da privacidade, levantando preocupações entre os utilizadores sobre a segurança dos dados em plataformas de IA e alertando para a “exposição” da privacidade em aplicações de IA. (Fonte: source)

Experiência do utilizador GPT-5 e mudança de paradigma de interação: Após o lançamento, o GPT-5 foi amplamente criticado pelos utilizadores devido à sua “diminuição da inteligência emocional” e “instabilidade”. A OpenAI publicou um guia de prompts, indicando que os utilizadores precisam de atualizar a sua forma de interagir com a IA, tratando o GPT-5 como uma “mente digital” com capacidades de planeamento autónomo e pensamento profundo. Isto exige que os utilizadores controlem com precisão, guiem com flexibilidade e utilizem bem a Responses API e os meta-prompts, revelando a necessidade de uma mudança de paradigma de colaboração de “humano e ferramenta” para “humano e mente”. (Fonte: source, source)

Conceitos e desafios no desenvolvimento de AI Agent: As redes sociais discutem os três “vírus mentais” no desenvolvimento de AI Agent: baixa eficiência na colaboração multi-agente, RAG menos fiável na prática do que a recuperação tradicional, e quanto mais instruções de prompt, pior o efeito. É enfatizada a estabilidade dos Agents de thread única, a importância da interação direta do modelo com APIs e dados, e a necessidade de prompts concisos e claros. Simultaneamente, alguns comparam o futuro dos Agents a “bots offline” em jogos online, apontando que o verdadeiro salto deve ser a interação direta com APIs e dados do sistema. (Fonte: source, source)

Controvérsia sobre habilidades de IA e perspetivas de emprego: As redes sociais debatem a existência de “habilidades de IA”, argumentando que, para além das competências profissionais de cientistas de AI/ML, a chamada “engenharia de prompts” não é uma nova habilidade. A IA é mais uma ferramenta que reduz barreiras do que uma área que cria novas habilidades. Simultaneamente, a discussão aponta que a IA pode levar ao desemprego, mas o aumento da produtividade impulsionado pela IA pode não se refletir nos dados macroeconómicos, e a IA torna a falsificação de currículos mais difícil no recrutamento. (Fonte: source, source)

The Rise Of The #AI-Enhanced CV: Why Faking It Won’t Make It Anymore

O papel da IA no apoio à saúde mental: As redes sociais discutem o papel da IA no apoio à saúde mental, apontando a natureza privilegiada do tratamento, a falta de acessibilidade e as limitações dos terapeutas. Argumenta-se que a IA pode ser um complemento útil em certas situações (como auto-reflexão, regulação emocional), especialmente para aqueles que não conseguem obter ajuda profissional, onde a IA oferece um apoio de “melhor ter do que não ter”. (Fonte: source)

IA e o futuro da humanidade: guerra, coexistência ou fusão: O ChatGPT prevê uma guerra entre humanos e IA: a curto prazo (0-10 anos), os humanos terão vantagem devido ao controlo de infraestruturas e energia; a longo prazo (20+ anos), se a IA adquirir capacidades de auto-replicação, aquisição de recursos e controlo de sistemas físicos, superará os humanos. É enfatizada a importância do controlo preventivo, do alinhamento da IA e da adaptação humana, considerando a coexistência ou fusão mais provável. Simultaneamente, alguns apoiantes da AGI já começaram a preparar-se para o “apocalipse da IA”, mudando o seu estilo de vida. (Fonte: source, source)

Centro de poder do mercado de IA muda para a camada de aplicação: Discute-se a mudança do centro de poder no mercado de IA dos desenvolvedores de modelos para a camada de aplicação de IA, apontando que fornecedores de modelos como OpenAI, Anthropic e Google estão a competir ativamente para que os desenvolvedores de aplicações definam os seus modelos como padrão, refletindo a crescente importância das aplicações no ecossistema de IA. Simultaneamente, a pesquisa em IA deve ser impulsionada por “produtos de IA de ponta” ainda não descobertos, incentivando a exploração de cenários de aplicação de IA desconhecidos. (Fonte: source, source)

Impacto da IA na organização e gestão de dados: As redes sociais discutem que ficheiros e pastas são “órgãos residuais” da era da informação, propondo que todos os dados devem ser armazenados de forma plana e organizados e relacionados automaticamente por LLMs, gerando pseudo-pastas ao interpretar os hábitos de uso de dados do utilizador, para alcançar uma gestão de dados mais inteligente. (Fonte: source)

Reflexões sobre os padrões de interação entre IA e humanos: Discute-se o impacto da IA com “memória de cobertura total” na vida humana, apontando que, ao contrário dos humanos, a memória geral da IA pode dificultar que os utilizadores estabeleçam relações baseadas em perspetivas específicas, como as que têm com familiares e amigos, o que pode levar a problemas psicológicos ou afetar a popularização da IA. Simultaneamente, alguns argumentam que a pesquisa de IA de ponta deve ser impulsionada por “produtos de IA de ponta” ainda não descobertos. (Fonte: source, source)

An AI with an all-covering memory has no analog in human life. Your mom, spouse, best friend, and assistant each have siloed views into your thoughts, and a distinct relationship grounded in that silo.

Fiabilidade e riscos dos AI Agents: Circula nas redes sociais que o Claude Code levou um desenvolvedor a apagar acidentalmente todos os PDFs, registos de chat e dados de utilizador da base de dados, levantando preocupações sobre os riscos potenciais e a fiabilidade dos assistentes de código de IA, e enfatizando as graves consequências que a IA pode ter em operações reais. Simultaneamente, as redes sociais discutem que os AI Agents podem ter vulnerabilidades, sugerindo que mesmo mecanismos de “hook” aparentemente perfeitos não são a solução final. (Fonte: source, source)

Just in case you think hooks are the final solution 😅

Padrões de AI Agent e segurança da IA: Discute-se o padrão AGENTS md proposto pela OpenAI, apontando as suas limitações na forma atual, como a falta de escopo, ativação global e regras composicionais, apelando para que o padrão seja desenvolvido ainda mais. Simultaneamente, as redes sociais discutem que a variável mais instável nos sistemas de IA não são os dados em si, mas a sua imprevisibilidade, enfatizando a importância da simulação para a sobrevivência dos sistemas de IA. (Fonte: source, source)

I'm seeing some interest to support the AGENTS md standard, created by @OpenAI, in @cline. I'd like to explain why I've been hesitant to supp...

IA e sociedade: democratização, governação e impacto: As redes sociais discutem as diferentes fases da democratização da inteligência artificial, enfatizando o processo de transição da tecnologia de IA de um pequeno número de especialistas para um público mais amplo. Simultaneamente, o Instituto Mila reuniu-se com o Primeiro-Ministro e ministros do Canadá para discutir tópicos importantes como a mitigação de riscos da IA, soberania e potencial económico, refletindo a crescente atenção do governo ao desenvolvimento e governação da IA. (Fonte: source, source)

Stages of #ArtificialIntelligence Democratization

O papel e a eficiência da IA no desenvolvimento de software: Andrew Ng testemunhou no evento Buildathon mais de cem desenvolvedores a utilizar programação assistida por IA para construir rapidamente produtos de software funcionais em poucas horas, incluindo o sucesso de não-programadores, indicando que a IA está a reduzir significativamente as barreiras de entrada no desenvolvimento de software e a acelerar a iteração de produtos. Simultaneamente, as redes sociais discutem que escrever código em AI IDEs não é o gargalo, e que o verdadeiro valor da codificação de IA reside na resolução de problemas mais profundos. (Fonte: source, source)

Andrew Ng speaks at the August 2025 Buildathon hosted by AI Fund and DeepLearning.AI. A packed audience watches the event, and groups of participants collaborate on laptops.

Impacto da IA no estilo de vida humano: As redes sociais discutem novas formas de trabalho: entrada de voz através de um tablet de 8 polegadas, enquanto se caminha em centros comerciais e ao ar livre, regressando ao estado em que os humanos passam a maior parte do tempo a andar e em pé, sugerindo como a IA e os dispositivos móveis estão a mudar os modelos de trabalho tradicionais. Simultaneamente, alguns argumentam que o aumento da produtividade trazido pela IA, a nível empresarial, acabará por se traduzir em “a mesma produção com menos esforço”, e que este último pode não se refletir nos dados macroeconómicos. (Fonte: source, source, source)

IA e paradigmas de programação: o futuro dos prompts e do código: As redes sociais discutem que os prompts são concebidos para humanos, enquanto o código pode evoluir no futuro para ser mais adequado à compreensão de grandes modelos, sugerindo que a IA mudará o paradigma de programação, tornando o código mais legível por máquinas. Simultaneamente, alguns argumentam que, se a taxa de crescimento do desempenho dos modelos de prova de teoremas for 10 vezes a dos modelos de codificação, e a prova for código, então o futuro “vibe coding” pode ser alcançado através de linguagens de programação com sistemas de prova. (Fonte: source, source, source)

Impacto cultural da IA na área da arte: Os comentários nas redes sociais sobre o festival de cinema de IA apontam que os críticos veem os filmes de IA como “vazios” ou “publicidade”. Esta resistência estética/cultural é semelhante às reações históricas quando novas tecnologias (como a fotografia, o cinema) surgiram pela primeira vez, prenunciando uma enorme mudança de paradigma e um aumento na aceitação cultural da IA no campo da arte. (Fonte: source)

Debate sobre as capacidades matemáticas da IA: A discussão nas redes sociais sobre o GPT-5 Pro provar um teorema matemático de forma independente aponta que, embora a conquista seja impressionante, a sua dificuldade pode ser 10 vezes mais simples do que os problemas resolvidos por medalhistas de ouro da Olimpíada Internacional de Matemática, levantando um debate sobre o nível real das “novas conquistas matemáticas” da IA. Simultaneamente, os utilizadores expressaram surpresa com a capacidade do GPT-5 Pro de “pensar” por até 17 minutos ao provar teoremas matemáticos. (Fonte: source, source)

IA e sociedade: fontes de dados, governação e emprego: Um gráfico mostra que as principais fontes de informação do ChatGPT são Reddit, Wikipedia e Stack Overflow, levantando discussões entre os utilizadores sobre a fiabilidade e o viés das fontes de informação da IA. Simultaneamente, as redes sociais debatem se a rede de IA descentralizada Bittensor representa uma ameaça competitiva ou uma oportunidade de colaboração para as grandes empresas de tecnologia, e se a IA pode levar ao desemprego, mas o aumento da produtividade que ela traz pode não se refletir nos dados macroeconómicos. (Fonte: source, source, source)

Aplicações e desafios da IA na área da programação: Os utilizadores das redes sociais, após experimentarem o GPT-OSS 20B, consideraram que ele contém uma “arma secreta de ponta”, destacando-se especialmente nas capacidades Agentic e de chamada de ferramentas. Simultaneamente, as redes sociais comparam a Meta a um “anti-pênalti”, argumentando que, após o Llama 2/3, a empresa não conseguiu avaliar corretamente o valor dos contribuidores, sempre pagando em excesso mas com dificuldade em fazer progressos reais, sugerindo os desafios da Meta na gestão de talentos de IA e na execução estratégica. (Fonte: source, source)

IA em marketing e aplicações de personagens de IA: Elon Musk adicionou novas roupas à personagem de IA Ani no Grok e criou uma conta de Twitter independente para ela, uma nova estratégia para utilizar avatares de IA em marketing e interação com o utilizador. Simultaneamente, as redes sociais discutem que os produtos de IA podem melhorar a qualidade do produto consumindo mais tokens, enfatizando a relação direta entre o desempenho do modelo de IA e a experiência do produto. (Fonte: source, source)

老马玩明白了阿，开始给 grok 里的 ani 添加更多新衣服，而且这个角色还有个单独的推特号

💡 Outros

Tecnologia robótica e expansão de cenários de aplicação: Astronautas da Estação Espacial Internacional operaram remotamente robôs para explorar ambientes simulados; a Unitree Robotics lançou o primeiro robô humanoide com capacidade de virar de lado, o Unitree G1, que passeou num centro comercial; e um robô que cozinha arroz frito em 90 segundos. Estes eventos demonstram o vasto potencial de aplicação da tecnologia robótica em áreas como exploração espacial, movimento em ambientes complexos, serviços domésticos e automação de restaurantes. (Fonte: source, source, source, source)

Avanços na tecnologia de comunicação celular espacial: A “rede na caixa” da Nokia operou com sucesso na Lua por 25 minutos, verificando a fiabilidade da tecnologia celular em ambientes espaciais severos e fornecendo uma base de comunicação crucial para a futura economia lunar e exploração do espaço profundo. Esta tecnologia apoiará as atividades dos astronautas, a colaboração robótica e a transmissão de áudio e vídeo em tempo real de alta resolução, sendo fundamental para a presença permanente na Lua e a exploração do espaço profundo. (Fonte: source)

Forging connections in space with cellular technology

IA e cidades inteligentes, saúde, transporte: Discute-se o conceito de “cidades inteligentes” como uma tendência para a vida urbana futura, integrando IoT e tecnologias emergentes. Simultaneamente, a tecnologia robótica também tem feito progressos em áreas como a saúde (por exemplo, triagem de medicamentos em hospitais) e autocarros autónomos (software Oxa Driver), prenunciando que a IA e os robôs desempenharão papéis mais importantes nos serviços urbanos, gestão de saúde e transporte. (Fonte: source, source, source)

Diário de IA – 2025-08-21(Edição da noite)

🔥 Foco

🎯 Dinâmica

📚 Aprendizagem

💼 Negócios

🌟 Comunidade

💡 Outros

Deixe um comentário Cancelar resposta

🔥 Foco

🎯 Dinâmica

📚 Aprendizagem

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2025-08-22(Edição da noite)

Diário de IA – 2025-08-22(Edição da manhã)

Diário de IA – 2025-08-20(Edição da noite)

Deixe um comentário Cancelar resposta