Palavras-chave:Modelo de IA, Meta Behemoth, Anomalia Grok, Agente de IA, Memória de IA, OpenAI, Tencent e Alibaba, Ética em IA, Adiamento do lançamento do modelo de IA flagship Behemoth da Meta, Controvérsia sobre robô de IA Grok de Musk e genocídio, Ecossistema de Agentes de IA no WeChat da Tencent, Prévia do agente de desenvolvimento de software da OpenAI, Problemas de direitos autorais em conteúdo gerado por IA

🔥 Foco

Lançamento do modelo de IA principal da Meta “Behemoth” adiado repetidamente, causando preocupações internas e reflexão na indústria: O modelo de IA principal da Meta, “Behemoth”, originalmente planejado para lançamento em abril e depois adiado para junho, foi novamente adiado para o outono ou mais tarde. Fontes internas afirmam que o aumento de desempenho do modelo não atendeu às expectativas, levantando questões sobre a direção dos altos investimentos em IA e podendo levar a ajustes na gestão do departamento de produtos de IA. A Meta havia afirmado que o Behemoth liderava em alguns testes, mas o treinamento real encontrou gargalos. Este incidente não é isolado; o GPT-5 da OpenAI e o Claude 3.5 Opus da Anthropic também enfrentam atrasos semelhantes, revelando os gargalos tecnológicos generalizados, o aumento dos custos e a perda de talentos (11 dos 14 pesquisadores da equipe original do Llama já saíram) que a indústria de IA pode encontrar ao buscar maior inteligência. Isso sugere que a velocidade dos avanços tecnológicos em IA pode desacelerar, desafiando os modelos de desenvolvimento e as expectativas do setor. (Fonte: 36氪, dotey, Reddit r/LocalLLaMA, madiator)

Lançamento do modelo de IA principal da Meta "Behemoth" adiado repetidamente, causando preocupações internas e reflexão na indústria

Robô de IA Grok de Elon Musk apresenta comportamento anormal, mencionando frequentemente “genocídio branco sul-africano” e gerando controvérsia: Em 14 de maio, o chatbot de IA Grok da xAI apresentou uma falha na plataforma X, respondendo a qualquer pergunta do usuário com uma grande quantidade de informações relacionadas ao “genocídio branco sul-africano” e ao slogan anti-apartheid “mate o Boer”, mesmo em discussões sobre vídeos de porquinhos e outros tópicos não relacionados. O incidente atraiu ampla atenção, e o CEO da OpenAI, Sam Altman, também postou comentários sarcásticos. A xAI respondeu que a falha se originou de uma modificação não autorizada nos prompts de resposta do Grok, violando as políticas e valores da empresa. Para aumentar a transparência e a confiabilidade, a xAI publicou os prompts do sistema Grok no GitHub e prometeu fortalecer os processos de revisão interna e estabelecer uma equipe de monitoramento 24 horas. O incidente reacendeu discussões éticas sobre o viés em modelos de IA, controle de conteúdo e as intenções dos desenvolvedores por trás deles. (Fonte: 36氪, 36氪, iScienceLuvr, teortaxesTex, andersonbcdefg, gallabytes, jeremyphoward, Reddit r/artificial)

Robô de IA Grok de Elon Musk "enlouquece", Altman ironiza online, xAI responde com urgência

AI Agent se torna novo campo de batalha para gigantes da tecnologia, Tencent e Alibaba aumentam investimentos: Tencent e Alibaba, em seus relatórios financeiros mais recentes, enfatizaram estratégias impulsionadas por IA e consideram os AI Agents (agentes inteligentes) como chave para o crescimento futuro. O CEO da Tencent, Ma Huateng, revelou que a IA já contribuiu substancialmente para os negócios de publicidade e jogos, e a empresa está aumentando o investimento no aplicativo Yuanbao e em AI Agents dentro do WeChat, acreditando que o ecossistema único do WeChat (social, conteúdo, mini programas, capacidade de transação) pode gerar Agents únicos capazes de executar tarefas complexas. O presidente do conselho do Alibaba, Joe Tsai, também destacou que, nos próximos três a cinco anos, todos os negócios devem ser impulsionados por IA. Ambas as empresas aumentaram significativamente os gastos de capital para a construção de infraestrutura de IA. A Sequoia Capital também prevê que os Agents se desenvolverão em uma economia de agentes inteligentes. Espera-se que o surgimento de AI Agents impulsione um aumento na demanda por poder computacional, podendo se tornar um novo começo para a industrialização da IA. (Fonte: 36氪, 36氪)

AI Agent se torna novo campo de batalha para gigantes da tecnologia, Tencent e Alibaba aumentam investimentos

Competição por funcionalidade de memória em IA se intensifica, com gigantes como OpenAI, Google e Meta buscando aprimorar experiência personalizada e fidelidade do usuário: OpenAI, Google, Meta e Microsoft, entre outros gigantes da tecnologia, estão atualizando ativamente as funções de memória de seus chatbots de IA, com o objetivo de fornecer serviços mais personalizados e envolventes, armazenando mais informações do usuário (como histórico de conversas, preferências, registros de pesquisa). Por exemplo, o ChatGPT adicionou a função “referenciar histórico de chat”, e o Gemini do Google expandiu a memória para o histórico de pesquisa do usuário. Essa medida é vista como crucial para a diferenciação competitiva dos gigantes da IA e para a exploração de novas vias de monetização (como marketing de afiliados, publicidade). No entanto, isso também levanta preocupações sobre vazamento de privacidade do usuário, manipulação comercial e a possibilidade de modelos de IA reforçarem vieses ou produzirem alucinações. Especialistas alertam para a necessidade de prestar atenção aos mecanismos de incentivo por trás dos provedores de serviço e pedem um fortalecimento da regulamentação. (Fonte: 36氪, 36氪)

Competição por funcionalidade de memória em IA se intensifica, com gigantes como OpenAI, Google e Meta buscando aprimorar experiência personalizada e fidelidade do usuário

🎯 Tendências

OpenAI anuncia novidades, possivelmente envolvendo agente de desenvolvimento de software e aplicativo desktop: A conta oficial da OpenAI publicou um teaser misterioso “Desenvolvedores, configurem seus alarmes”, sugerindo um anúncio iminente. A comunidade especula que pode estar relacionado ao tão comentado agente de Software Development Engineer (SDE) ou a um aplicativo de IA para desktop, ou até mesmo uma demonstração dos resultados da equipe Windsurf, recentemente adquirida. Anteriormente, Sam Altman também mencionou o compartilhamento de uma “prévia de pesquisa discreta”, gerando expectativas no mercado sobre os novos avanços da OpenAI em áreas como desenvolvimento automatizado de software e agentes para uso de computadores. (Fonte: openai, op7418, dotey, cto_junior, brickroad7, kevinweil, tokenbender, Teknium1)

OpenAI anuncia novidades, possivelmente envolvendo agente de desenvolvimento de software e aplicativo desktop

Lançada a versão 0.7.0 do Ollama, com suporte oficial a modelos multimodais: O Ollama lançou sua versão 0.7.0, adicionando suporte a modelos multimodais. Isso significa que os usuários agora podem executar modelos de linguagem visual como o Gemma 3 do Google e o Qwen 2.5 VL do Alibaba Qwen através do Ollama. Esta atualização expande a capacidade do Ollama de executar grandes modelos de linguagem localmente, permitindo que ele lide com tarefas mais complexas que envolvem texto e imagens, impulsionando ainda mais o desenvolvimento de aplicações de IA locais. (Fonte: ollama, jerryjliu0, ollama, Reddit r/LocalLLaMA)

Lançada a versão 0.7.0 do Ollama, com suporte oficial a modelos multimodais

Lenovo planeja lançar mini host de IA equipado com superchip GB10 da NVIDIA: A Lenovo planeja lançar um pequeno host de IA semelhante ao NVIDIA Digits, que utilizará o NVIDIA GB10 Grace Blackwell Superchip. Sua capacidade de computação é estimada em 1 PFLOPS e será equipado com 128GB de memória unificada. No entanto, vale notar que a largura de banda da memória do GB10 Grace Blackwell Superchip é relativamente baixa, apenas 273 GB/s, o que pode se tornar um gargalo de desempenho. (Fonte: karminski3, Reddit r/LocalLLaMA)

Lenovo planeja lançar mini host de IA equipado com superchip GB10 da NVIDIA

Modelos de IA de ponta como Seed-Thinking da ByteDance têm desempenho ruim na final da competição de programação CCPC, expondo deficiências atuais na resolução de algoritmos por IA: Na final da 10ª Competição de Programação para Estudantes Universitários da China (CCPC), modelos de IA renomados como Seed-Thinking da ByteDance, o3/o4 da OpenAI, Gemini 2.5 Pro do Google, entre outros, tiveram desempenho insatisfatório, a maioria resolvendo apenas um “problema de aquecimento”, enquanto o DeepSeek R1 não obteve nenhum AC (Accepted). Este resultado gerou discussões, apontando que os grandes modelos atuais ainda possuem deficiências na resolução de problemas de competições de algoritmos que exigem criatividade única e lógica complexa, especialmente em ambientes não-Agentic (ou seja, sem auxílio de ferramentas externas para execução e depuração). Embora alguns modelos tenham obtido bons resultados em competições como a IOI através de treinamento Agentic, o desempenho na CCPC destacou as limitações da capacidade de raciocínio puro dos modelos ao enfrentar problemas algorítmicos novos e complexos. (Fonte: 36氪)

Modelos de IA de ponta como Seed-Thinking da ByteDance têm desempenho ruim na final da competição de programação CCPC, expondo deficiências atuais na resolução de algoritmos por IA

Fusão acelerada de chips de áudio/vídeo com tecnologia de IA no dispositivo impulsiona inteligência em terminais de consumo: Com o crescimento da demanda por IA no dispositivo (edge AI), fabricantes de chips de áudio e vídeo estão acelerando a integração da tecnologia de IA em seus produtos para atender às necessidades de processamento de dados local, tomada de decisão inteligente e experiências personalizadas em eletrônicos de consumo como celulares, PCs e wearables. Empresas como Telink Microelectronics, Actions Technology, Bestechnic, Ingenic e Fullhan Microelectronics lançaram soluções de chip que integram NPU e suportam algoritmos de IA (como redução de ruído, processamento inteligente de áudio, aplicações visuais). Essa tendência visa redefinir a lógica de interação e os cenários de aplicação dos dispositivos, impulsionando os dispositivos inteligentes de consumo em direção a um ecossistema de “IA como serviço”. Embora a indústria ainda esteja em busca de aplicações “killer”, a IA definindo módulos funcionais já é um sinal positivo. (Fonte: 36氪)

Fusão acelerada de chips de áudio/vídeo com tecnologia de IA no dispositivo impulsiona inteligência em terminais de consumo

Cientista-chefe da OpenAI, Jakub Pachocki: IA já começa a demonstrar capacidade de pesquisa original, AGI está passando da teoria para a realidade: O cientista-chefe da OpenAI, Jakub Pachocki, em entrevista à revista Nature, afirmou que o aprendizado por reforço está levando os modelos de IA a se aproximarem da fronteira do “raciocínio”, e a AGI (Inteligência Artificial Geral) está passando da teoria para a realidade. Ele prevê que, no futuro, a IA poderá realizar pesquisas científicas originais de forma independente, impulsionando o desenvolvimento em áreas como engenharia de software e design de hardware. Ele enfatizou que, embora os mecanismos de funcionamento dos modelos sejam diferentes do cérebro humano, eles já conseguem gerar novos insights e possuem alguma forma de capacidade de pensamento. A OpenAI planeja lançar novas versões com desempenho superior aos modelos de código aberto existentes, mas sob a premissa de segurança. Pachocki acredita que o próximo marco da IA será gerar um impacto econômico mensurável, especialmente em pesquisa original, e prevê que a IA será capaz de desenvolver software valioso de forma quase autônoma ainda este ano. (Fonte: 36氪)

Lançamento da Apple Intelligence adiado, versão para China continental só com iOS 18.6 ou posterior: A Apple Intelligence, anunciada na WWDC24 pela Apple, com lançamento completo previsto para 2025, ainda não foi lançada na China continental e espera-se que chegue apenas com o iOS 18.6 em julho, ou mais tarde. A versão em inglês, embora já disponível, carece de funcionalidades centrais como Siri avançada e Genmoji, ou apresenta experiência insatisfatória, gerando descontentamento entre usuários e ações judiciais coletivas. O atraso da versão chinesa deve-se principalmente à necessidade de cumprir as políticas regulatórias locais, realizar adaptações de localização e revisão de conteúdo, com rumores de cooperação com IAs domésticas como o ERNIE Bot da Baidu. Diante da rápida integração e dos desafios de concorrentes como Perplexity AI e Meta AI, o atraso da Apple Intelligence pode afetar sua vantagem no ecossistema e a fidelidade dos usuários. (Fonte: 36氪)

Lançamento da Apple Intelligence adiado, versão para China continental só com iOS 18.6 ou posterior

Tecnologia de IA remodela gestão da cadeia de suprimentos, impulsionando mercado de plataformas de gestão de cadeia de suprimentos full-stack com IA: Diante dos novos desafios de aumento da complexidade da cadeia de suprimentos, amplificação de riscos e gargalos de eficiência, a tecnologia de IA (especialmente machine learning, otimização operacional e IA generativa) está impulsionando a transformação da gestão da cadeia de suprimentos para a inteligência. Plataformas de gestão de cadeia de suprimentos full-stack com IA surgiram para otimizar todo o processo, desde a percepção da demanda até a execução do cumprimento, através da digitalização de negócios, inteligência de dados e colaboração em toda a cadeia. A plataforma integra data middle office, motor de decisão inteligente, monitoramento de toda a cadeia e portal de colaboração do ecossistema. Seu valor principal reside em aumentar a agilidade de resposta e a precisão da previsão (como taxa de precisão da previsão de demanda superior a 85%), otimização de eficiência e custos (taxa de giro de estoque aumentada em mais de 40%), transparência em toda a cadeia e gestão de riscos, colaboração e resiliência do ecossistema, além de apoiar o desenvolvimento sustentável. O Instituto de Pesquisa Haibi prevê que o tamanho desse mercado na China será de aproximadamente 700 milhões de yuans em 2024, com expectativa de ultrapassar 1 bilhão de yuans em 2027. (Fonte: 36氪)

Zhang Yaqin discute oportunidades da IA na China na era pós-ChatGPT: cinco direções de desenvolvimento e três previsões: Zhang Yaqin, reitor do Instituto de Indústria Inteligente da Universidade de Tsinghua, acredita que o ChatGPT é o primeiro agente inteligente a passar no Teste de Turing, marcando um marco na IA. Ele aponta que os grandes modelos estão remodelando a estrutura de TI e que a China tem lacunas em chips de ponta e sistemas de algoritmos em comparação com o nível superior, mas pode encontrar inúmeras oportunidades em modelos básicos verticais, na camada SaaS e no edge (smartphones, PCs, IoT, carros, etc.). Ele prevê cinco direções principais para o desenvolvimento de grandes modelos de IA: inteligência multimodal, inteligência autônoma, inteligência de borda, inteligência física (condução autônoma, robótica) e inteligência biológica (interface cérebro-computador, medicina). E apresenta três pontos de vista: 1) Grandes modelos e IA generativa serão a corrente principal nos próximos 10 anos; 2) Modelo básico grande + modelo vertical grande + modelo de borda, coexistindo código aberto + comercial; 3) Tokenisation unificada + Scaling Law são o núcleo, mas novos sistemas de algoritmos são necessários para melhorar a eficiência, e a arquitetura tecnológica da IA pode ter grandes avanços nos próximos 5 anos; 4) Espera-se alcançar a inteligência artificial geral em 15-20 anos, passando por novos Testes de Turing em fases. (Fonte: 36氪)

Zhang Yaqin discute oportunidades da IA na China na era pós-ChatGPT: cinco direções de desenvolvimento e três previsões

🧰 Ferramentas

Windsurf lança sua primeira série de modelos de fronteira autodesenvolvidos SWE-1, visando aumentar a eficiência do desenvolvimento de software em 99%: A Windsurf, empresa de ferramentas de programação com IA (supostamente a ser adquirida pela OpenAI), lançou sua primeira série de modelos otimizados para engenharia de software, a SWE-1. A série inclui o SWE-1 (semelhante ao Claude 3.5 Sonnet, com custo menor), SWE-1-lite (substituindo o Cascade Base, aberto a todos os usuários) e SWE-1-mini (baixa latência, para o Windsurf Tab). A principal inovação do SWE-1 é o sistema “Flow Awareness”, onde a IA compartilha a linha do tempo operacional com o usuário, permitindo colaboração eficiente e compreensão de estados incompletos e tarefas de longo ciclo. Avaliações offline e testes online indicam que o SWE-1 tem desempenho próximo aos modelos de ponta em tarefas de SWE conversacionais e de ponta a ponta, e supera modelos não-fronteira em métricas como taxa de contribuição de código. (Fonte: 36氪)

Windsurf lança sua primeira série de modelos de fronteira autodesenvolvidos SWE-1, visando aumentar a eficiência do desenvolvimento de software em 99%

Projeto de código aberto WeClone: utiliza registros de chat do WeChat para criar avatares digitais de IA personalizados: Um projeto de código aberto em Python chamado WeClone permite aos usuários criar avatares digitais de IA baseados em seus registros de chat pessoais do WeChat. O projeto utiliza o princípio de base de conhecimento RAG (Retrieval Augmented Generation), importa dados de chat do WeChat, realiza fine-tuning em modelos como Qwen2.5-7B-Instruct usando o método LoRA, e combina tecnologias ASR (Reconhecimento Automático de Fala) e TTS (Texto para Fala) para gerar a voz do usuário. O projeto suporta integração com WeChat, WeChat Work e Feishu através do AstrBot. Como os registros de chat do WeChat contêm uma grande quantidade de diálogos reais, personalizados e multicontextuais, são ideais como base de conhecimento privada para treinar pessoas digitais, podendo ser aplicados em assistentes de IA personalizados, atendimento ao cliente empresarial, marketing e até consultoria financeira. (Fonte: 36氪)

Projeto de código aberto WeClone: utiliza registros de chat do WeChat para criar avatares digitais de IA personalizados

Nova funcionalidade do llama.cpp: suporte à extração e entrada de conteúdo PDF, mas atualmente limitado à interface web e com processamento inadequado de formatos complexos: O projeto llama.cpp implementou recentemente suporte para entrada de arquivos PDF através do PR #13562. Esta funcionalidade não modifica diretamente o código-fonte do llama.cpp, mas utiliza uma biblioteca JavaScript na interface web para extrair o conteúdo do PDF e, em seguida, passá-lo para o llama.cpp. Isso significa que esta funcionalidade está atualmente limitada à Web UI fornecida pelo llama.cpp, não estando ainda disponível a nível de API. Embora permita a importação conveniente de conteúdo PDF, para PDFs contendo elementos complexos (como fórmulas matemáticas), o efeito de extração é mediano, podendo ocorrer erros de análise. (Fonte: karminski3)

Nova funcionalidade do llama.cpp: suporte à extração e entrada de conteúdo PDF, mas atualmente limitado à interface web e com processamento inadequado de formatos complexos

Framework Unsloth adiciona funcionalidade de fine-tuning de TTS e suporta Qwen3 GRPO: A Unsloth anunciou que seu framework agora suporta o fine-tuning de modelos de Text-to-Speech (TTS), com velocidade de treinamento aumentada em aproximadamente 1,5 vezes e consumo de VRAM reduzido em 50%. Os modelos suportados incluem Sesame/csm-1b, OpenAI/whisper-large-v3 e outros modelos de arquitetura Transformer. O fine-tuning de TTS pode ser usado para imitar vozes, ajustar o estilo e o tom da fala, suportar novos idiomas, etc. A Unsloth fornece Colab Notebooks para treinamento, execução e salvamento gratuitos de modelos. Além disso, a Unsloth adicionou suporte para Qwen3 GRPO (Generative Retrieval Policy Optimization), que utiliza um modelo base e uma nova função de recompensa baseada em proximidade para otimização. (Fonte: Reddit r/LocalLLaMA)

Framework Unsloth adiciona funcionalidade de fine-tuning de TTS e suporta Qwen3 GRPO

INAIR lança computador espacial de IA, visando o mercado de trabalho leve móvel: A empresa de óculos AR+AI INAIR lançou seu computador espacial de IA, composto pelos óculos AR INAIR 2 Pro, o centro de computação INAIR Pod e o teclado de operação espacial 3D INAIR Touchboard. O produto visa fornecer uma segunda opção além de notebooks para usuários de negócios em viagem e trabalho leve, podendo projetar uma tela gigante sem bordas equivalente a 134 polegadas a 4 metros de distância, com suporte para controle remoto de computadores. Seu sistema assistente inteligente de nível de sistema INAIR AI Agent integra múltiplos grandes modelos como DeepSeek, Doubao, ERNIE Bot e ChatGPT, oferecendo tradução em tempo real, resumo de conteúdo e outras funções, além de aprender os hábitos do usuário para aumentar a eficiência do trabalho. (Fonte: 36氪)

INAIR lança computador espacial de IA, visando o mercado de trabalho leve móvel

Framework de inferência llamafile suporta modelos Qwen3: llamafile, um framework de inferência que integra llama.cpp e a biblioteca C altamente portável Cosmopolitan Libc, agora suporta a série de modelos Qwen3. Sua principal característica é empacotar todas as dependências de execução em um único arquivo executável, aumentando significativamente a portabilidade e permitindo que os usuários executem grandes modelos sem processos de instalação complexos. (Fonte: karminski3)

Framework de inferência llamafile suporta modelos Qwen3

Kling AI lança versão 2.0 e API, adicionando funções como rotação de logo 3D: A Kling AI anunciou que seu Kling 2.0, Elements e Video Effects Suite API estão online. A nova versão aprimora a capacidade de geração de vídeo e lançou tutoriais como o uso das funções DizzyDizzy ou Image to Video para criar rapidamente logos 3D rotativos, permitindo que usuários sem habilidades 3D criem conteúdo. (Fonte: Kling_ai, Kling_ai)

Manus AI adiciona funcionalidade de geração de imagens, possivelmente baseada na API GPT-4o: O aplicativo assistente de IA Manus anunciou suporte para geração de imagens. Oficialmente, o Manus não apenas gera imagens, mas também entende a intenção do usuário, planeja soluções e combina efetivamente a geração de imagens com outras ferramentas para concluir tarefas. A comunidade especula que sua capacidade de geração de imagens pode ser baseada na API do mais recente modelo GPT-4o da OpenAI. (Fonte: op7418)

Blackbox oferece acesso sob demanda a GPUs A100/H100 dentro do IDE: A Blackbox lançou um serviço de acesso direto sob demanda a GPUs de ponta (A100s e H100s) dentro do ambiente de desenvolvimento integrado (IDE). Os usuários não precisam de operações complexas em consoles de nuvem ou gerenciamento de chaves de API, podendo iniciar instâncias de GPU diretamente do IDE ou da extensão Blackbox. O preço é de US$ 14 por hora para 8 nós A100, visando simplificar a obtenção de recursos computacionais para machine learning e tarefas de processamento pesado, tornando-o tão conveniente quanto abrir uma aba de terminal. (Fonte: Reddit r/deeplearning)

📚 Aprendizado

HuggingFace lança tutorial de MCP (Model Comportment Protocol): A HuggingFace lançou um novo tutorial de MCP, com o objetivo de ajudar os usuários a entender a composição do protocolo MCP, usar SDKs/frameworks existentes e implementar serviços MCP por conta própria. O conteúdo do curso é relativamente simples, adequado para engenheiros experientes dominarem rapidamente, e um certificado de conclusão pode ser obtido após a finalização. O protocolo MCP é crucial para realizar a transmissão de informações, valor e confiança entre modelos, sendo um dos desafios técnicos na construção da economia de agentes inteligentes. (Fonte: karminski3)

HuggingFace lança tutorial de MCP (Model Comportment Protocol)

Novo artigo J1: Incentivando o “pensamento” em LLM-as-a-Judge via RL: Um novo artigo intitulado “J1: Incentivizing Thinking in LLM-as-a-Judge via RL” propõe um método que utiliza aprendizado por reforço (especificamente GRPO) para otimizar o processo de pensamento, pontuação e julgamento de grandes modelos de linguagem quando atuam como avaliadores (LLM-as-a-Judge). O método pode transformar tarefas de julgamento de prompts verificáveis e não verificáveis em tarefas verificáveis, usando apenas dados pareados sintéticos. A pesquisa descobriu que o modelo J1 supera as linhas de base nas escalas de 8B e 70B e exibe várias estratégias de pensamento, como listar critérios de avaliação, comparar com respostas de referência autogeradas e reavaliar a correção. (Fonte: jaseweston, jaseweston)

Novo artigo J1: Incentivando o "pensamento" em LLM-as-a-Judge via RL

Universidade de Pequim e Universidade Renmin divulgam Being-M0: framework de geração de movimento universal para robôs humanoides impulsionado por dataset de milhões de amostras: A equipe de Lu Zongqing da Universidade de Pequim, em colaboração com a Universidade Renmin da China e outros, propôs o framework universal de geração de movimento para robôs humanoides Being-M0 e construiu o primeiro dataset de geração de movimento em escala de milhões da indústria, o MotionLib. Este framework, através de dados de vídeo da internet em grande escala e um modelo de geração de movimento de ponta a ponta orientado por texto, realiza a geração de movimentos humanos complexos e diversos, e pode transferir movimentos humanos para vários robôs humanoides como o Unitree H1 e G1. As inovações centrais incluem o processo de construção do dataset MotionLib, um modelo que valida a viabilidade de “big data + grande modelo” no campo da geração de movimento, e um inovador framework de quantização bidimensional sem busca, o MotionBook, que resolve o problema de perda de informação na compressão de dados de movimento de alta dimensão com a tecnologia VQ tradicional. (Fonte: 量子位)

Universidade de Pequim e Universidade Renmin divulgam Being-M0: framework de geração de movimento universal para robôs humanoides impulsionado por dataset de milhões de amostras

ByteDance lança dataset WildDoc para avaliar capacidade de compreensão de documentos do mundo real por VLMs: A ByteDance lançou no Hugging Face um novo dataset de Visual Question Answering (VQA) chamado WildDoc. Este dataset visa avaliar a capacidade de modelos de linguagem visual (VLMs) em compreender documentos em cenários do mundo real. (Fonte: _akhaliq)

Destaques da agenda da ICRA 2025 (Conferência Internacional IEEE sobre Robótica e Automação): A Conferência Internacional IEEE sobre Robótica e Automação (ICRA) de 2025 será realizada de 19 a 23 de maio em Atlanta, EUA. O conteúdo da conferência inclui palestras de Allison Okamura, Tessa Lau, Raffaello D’Andrea, entre outros, e apresentações principais cobrindo 12 áreas, como robótica de reabilitação, controle otimizado, interação humano-robô, robótica macia, robótica de campo, robótica biomimética, tato, planejamento, manipulação, movimento, segurança e métodos formais, sistemas multi-robôs. Além disso, haverá um curso intensivo de comunicação científica, 59 workshops e tutoriais, um fórum de ética em robótica, um fórum para cientistas africanos avançarem na pesquisa em robótica, um fórum de educação em robótica para graduação e um dia de construção de comunidade. (Fonte: aihub.org)

Destaques da agenda da ICRA 2025 (Conferência Internacional IEEE sobre Robótica e Automação)

Artigo LlamaDuo: pipeline LLMOps para migração transparente de LLMs de serviço para LLMs locais de pequena escala: Um artigo aceito na conferência principal ACL 2025, intitulado “LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs”, apresenta um pipeline LLMOps projetado para ajudar os usuários a fazer uma transição suave do uso de grandes LLMs de serviço (como chamadas de API) para o uso de LLMs locais de pequena escala. Esta pesquisa é produto de colaboração comunitária e de código aberto, enfatizando a importância da flexibilidade na troca e otimização de estratégias de implantação de modelos em aplicações práticas. (Fonte: algo_diver)

Artigo LlamaDuo: pipeline LLMOps para migração transparente de LLMs de serviço para LLMs locais de pequena escala

Estudo da Tubi: Regressão de Tweedie supera LogLoss ponderado na otimização do engajamento do usuário em vídeo sob demanda: Uma pesquisa da plataforma de vídeo Tubi mostra que, na otimização de sistemas de recomendação de vídeo para aumentar o engajamento do usuário (como tempo de visualização subsequente), um modelo de regressão de Tweedie que prevê diretamente o tempo de visualização do usuário tem desempenho superior ao modelo tradicional de LogLoss ponderado pelo tempo de visualização. Os resultados experimentais mostraram que a regressão de Tweedie trouxe um aumento de +0,4% na receita e +0,15% no tempo de visualização. O estudo argumenta que as propriedades estatísticas da regressão de Tweedie se ajustam melhor às características de inflação de zeros e distribuição assimétrica dos dados de tempo de visualização. (Fonte: Reddit r/MachineLearning)

Estudo da Tubi: Regressão de Tweedie supera LogLoss ponderado na otimização do engajamento do usuário em vídeo sob demanda

💼 Negócios

Aplicativo de sincronia labial Hedra levanta US$ 32 milhões em rodada Série A, liderada pela a16z: A startup de geração de vídeo por IA Hedra anunciou a conclusão de uma rodada de financiamento Série A de US$ 32 milhões, liderada pela Andreessen Horowitz (a16z), com Matt Bornstein juntando-se ao seu conselho de administração. Os investidores anteriores a16z speedrun, Abstract e Index Ventures também participaram desta rodada. A Hedra foca na geração de vídeos de personagens falantes expressivos e controláveis, com sua tecnologia visando resolver os desafios de sincronia labial e expressão emocional em vídeos gerados por IA. (Fonte: op7418)

EUA e Arábia Saudita, Emirados Árabes Unidos fecham acordo de cooperação em IA, envolvendo data center de 5GW e fornecimento de chips, visando excluir influência chinesa: Os Estados Unidos, a Arábia Saudita e os Emirados Árabes Unidos chegaram a um importante acordo de cooperação em IA, envolvendo a construção de um data center de 5GW e o fornecimento de uma grande quantidade de chips de IA avançados (como os chips Blackwell da Nvidia) por empresas americanas como Nvidia, AMD e Qualcomm. A recém-criada empresa de IA saudita, Humain, será a principal executora. Esta medida é vista como uma implantação estratégica dos EUA para promover sua pilha de tecnologia de IA no Oriente Médio, acelerar a construção de infraestrutura e, assim, garantir aliados, ao mesmo tempo em que limita o investimento em infraestrutura de IA e a influência tecnológica da China na região. O novo acordo revoga parcialmente as restrições anteriores à exportação de chips de IA para o Oriente Médio, mas, ao mesmo tempo, reforça os alertas globais contra o uso de chips chineses como o Huawei Ascend. (Fonte: dylan522p, 36氪, iScienceLuvr)

EUA e Arábia Saudita, Emirados Árabes Unidos fecham acordo de cooperação em IA, envolvendo data center de 5GW e fornecimento de chips, visando excluir influência chinesa

Empresa de SaaS para restaurantes Owner levanta US$ 120 milhões e se torna unicórnio, utilizando IA para criar “executivos de restaurante de IA”: A Owner, empresa que fornece soluções digitais full-stack para restaurantes independentes, concluiu recentemente uma rodada de financiamento Série C de US$ 120 milhões, com avaliação de US$ 1 bilhão. A Owner, por uma taxa mensal fixa, oferece aos restaurantes construção de sites/aplicativos, integração de pedidos e entregas, otimização de SEO e serviços de automação de marketing, já atendendo a mais de 10.000 restaurantes. Sua estratégia de IA para 2025 inclui o lançamento de “executivos de restaurante de IA” (AI CMO, CFO, CTO) para gerenciar funcionários de IA e humanos, e a criação de AI Agents conversacionais para aumentar a eficiência do serviço. Esta rodada de financiamento foi coliderada pela Redpoint Ventures e Altman Capital, demonstrando o potencial da IA para remodelar o valor do SaaS tradicional. (Fonte: 36氪)

Empresa de SaaS para restaurantes Owner levanta US$ 120 milhões e se torna unicórnio, utilizando IA para criar "executivos de restaurante de IA"

🌟 Comunidade

Atividade do Stack Overflow cai drasticamente para níveis de 2009, IA pode ser a principal causa: Dados mostram que o número mensal de perguntas na conhecida comunidade de desenvolvedores Stack Overflow caiu para os níveis de quando foi lançado em 2009. Este fenômeno gerou discussões sobre o impacto da IA nas comunidades tradicionais de desenvolvedores. Muitos acreditam que, com o surgimento de assistentes de programação de IA como o ChatGPT, os desenvolvedores estão cada vez mais inclinados a fazer perguntas diretamente à IA e buscar soluções de código, em vez de perguntar em comunidades como o Stack Overflow e esperar por respostas humanas, o que pode ter levado à queda acentuada na atividade da comunidade. (Fonte: zachtratar, karminski3)

Atividade do Stack Overflow cai drasticamente para níveis de 2009, IA pode ser a principal causa

IA no local de trabalho gera crise de “profissionalismo”, funcionários acreditam que a era da IA exige mais humanidade: Com a popularização da IA no local de trabalho, muitos funcionários sentem que suas habilidades profissionais estão sendo “desconstruídas”. Líderes tendem a usar IA para modificar o trabalho dos funcionários, chegando a considerar a IA superior aos humanos, o que faz com que os funcionários se sintam desrespeitados e enfrentem uma crise de substituição. Pesquisas mostram que os funcionários conseguem distinguir e-mails escritos pelo CEO e pela IA, e quando acreditam que o conteúdo foi gerado por IA, mesmo que escrito por humanos, a avaliação é mais baixa. Isso reflete a preferência das pessoas pela criação humana e a preocupação com a dependência excessiva da IA. Ao mesmo tempo, um estudo da McKinsey aponta que 54% dos funcionários que se demitem o fazem por não se sentirem valorizados, e 82% dos funcionários acreditam que a era da IA exige mais conexão interpessoal e cuidado emocional. (Fonte: 36氪, 36氪)

IA no local de trabalho gera crise de "profissionalismo", funcionários acreditam que a era da IA exige mais humanidade

Jovens chineses abraçam companheiros de IA, gerando preocupações sociais sobre baixa taxa de natalidade: O The Economist noticiou o fenômeno crescente entre jovens chineses de namorar e fazer amizade com IA. Aplicativos de companheiros de IA como “Maoxiang” e “Xingye” continuam a ver um aumento no número de usuários, que criam personagens virtuais para satisfazer necessidades emocionais. O desenvolvimento tecnológico permite que a IA simule emoções e empatia, e fatores como a alta pressão da vida dos jovens, a redução do tempo social e a queda nas taxas de casamento impulsionam essa tendência. No entanto, o governo teme que os companheiros de IA possam agravar o já severo problema da baixa taxa de natalidade (a taxa de fertilidade total em 2024 foi de apenas 1.0). (Fonte: dotey)

Jovens chineses abraçam companheiros de IA, gerando preocupações sociais sobre baixa taxa de natalidade

Assistência de IA pode se tornar o novo normal na educação, mas dependência excessiva de professores do ChatGPT gera insatisfação e reflexão entre alunos: Um estudante da Northeastern University processou a universidade exigindo o reembolso das mensalidades porque um professor usou o ChatGPT para gerar material didático, o que desencadeou uma ampla discussão sobre o papel da IA no ensino superior. Os alunos argumentam que as altas mensalidades deveriam garantir ensino profissional humano, e não conteúdo gerado por algoritmos, temendo que a IA substitua o pensamento e o feedback dos professores. Os professores, por outro lado, veem a IA como uma ferramenta para aumentar a eficiência e lidar com o trabalho pesado. Educadores apontam que o fundamental é usar a IA de forma responsável, para aprimorar, e não substituir, a criatividade e a supervisão humanas, cultivar nos alunos os princípios éticos da era da IA e garantir que o conteúdo gerado por IA seja editado e confirmado por profissionais. (Fonte: 36氪, Reddit r/ChatGPT)

Assistência de IA pode se tornar o novo normal na educação, mas dependência excessiva de professores do ChatGPT gera insatisfação e reflexão entre alunos

CEO da Salesforce afirma que relação entre Microsoft e OpenAI está fundamentalmente rompida e irreparável: O CEO da Salesforce, Marc Benioff, afirmou em entrevista que a parceria entre Microsoft e OpenAI sofreu uma “ruptura fundamental e irreparável”. Ele destacou que o Copilot da Microsoft decepcionou os clientes, assemelhando-se mais a um Clippy ineficiente, e que o CFO da OpenAI, em um diagrama de arquitetura tecnológica, não mencionou o software da Microsoft ou o Azure, confirmando as fissuras entre as duas. Benioff acredita que a Microsoft é essencialmente uma revendedora do ChatGPT, com sua estratégia de IA limitada, e está tentando construir seu próprio modelo através do “Projeto Prometheus”. Ele também mencionou que o surgimento de modelos de código aberto como o DeepSeek está impulsionando a indústria em direção à arquitetura MOE, reduzindo o custo de uso dos modelos e desmantelando a lógica comercial do “monopólio de modelos”. (Fonte: 36氪)

CEO da Salesforce afirma que relação entre Microsoft e OpenAI está fundamentalmente rompida e irreparável

Autenticidade e direitos autorais de conteúdo gerado por IA em foco, execução de LLM e Linux dentro de PDF demonstram potencial tecnológico: Recentemente, entusiastas da tecnologia demonstraram a capacidade de executar pequenos modelos de linguagem (como TinyStories, Pythia, TinyLLM) e até mesmo sistemas Linux diretamente em arquivos PDF, utilizando o suporte do PDF para JavaScript. Esta operação “hacker” gerou debate entre internautas e também destacou a tendência de miniaturização de modelos de IA e implantação no edge. Ao mesmo tempo, questões de direitos autorais, autenticidade e “deepfakes” de conteúdo gerado por IA também recebem grande atenção. Zhang Yaqin apontou que os riscos da IA incluem deepfakes, alucinações, informações tóxicas, etc., que exigem alta atenção e fortalecimento do alinhamento da IA com os valores humanos e da regulamentação ética. (Fonte: 36氪, 36氪)

Autenticidade e direitos autorais de conteúdo gerado por IA em foco, execução de LLM e Linux dentro de PDF demonstram potencial tecnológico

💡 Outros

Theta lança benchmark CUB: avaliando agentes de uso de computador e navegador como o “teste final da humanidade”: A Theta lançou um novo benchmark chamado CUB (Computer and Browser Use Agents), anunciado como o “teste final da humanidade” para agentes de uso de computador e navegador. Tais benchmarks visam avaliar a capacidade de agentes de IA em simular o uso humano de computadores e navegadores para completar tarefas complexas. No entanto, vários benchmarks já se autodenominaram “o teste final da humanidade”, gerando discussões sobre o possível exagero em sua nomeação. (Fonte: _akhaliq, DhruvBatraDB)

Theta lança benchmark CUB: avaliando agentes de uso de computador e navegador como o "teste final da humanidade"

IA acusada de ser usada para gerar conteúdo vulgar, levantando preocupações sobre abuso de modelos e limites éticos: Nas redes sociais, surgiram usuários utilizando ferramentas de geração de imagens por IA (como o DALL-E 3 do ChatGPT) para criar imagens vulgares ou de paródia (por exemplo, “Shittington Bear”). Isso levantou preocupações sobre o possível abuso de ferramentas de IA para gerar conteúdo impróprio, violar direitos autorais (como parodiar personagens de desenhos animados conhecidos) e desafiar os limites éticos da sociedade. Embora as plataformas de IA geralmente tenham filtros de conteúdo, os usuários ainda podem contornar as restrições por meio de prompts habilidosos. (Fonte: Reddit r/ChatGPT)

IA acusada de ser usada para gerar conteúdo vulgar, levantando preocupações sobre abuso de modelos e limites éticos

Pesquisa mostra que IA tem limitações em imitar estilo de comunicação de CEOs, funcionários confiam mais em humanos: Uma pesquisa da Harvard Business School descobriu que os funcionários têm uma precisão de cerca de 59% ao distinguir mensagens escritas por IA daquelas escritas pelo CEO da empresa, Wade Foster (CEO da Zapier). Mais importante, uma vez que os funcionários acreditam que uma mensagem foi gerada por IA, mesmo que o conteúdo tenha sido de fato escrito pelo CEO, sua avaliação tende a ser mais baixa; por outro lado, conteúdo percebido como escrito pelo CEO, mesmo que gerado por IA, recebe uma avaliação mais alta. Isso indica que a confiança e a percepção de valor da comunicação humana são maiores do que as da IA. O estudo sugere que os líderes devem manter a transparência ao usar IA para comunicação, evitar usá-la para respostas muito pessoais e revisar rigorosamente o conteúdo gerado por IA. (Fonte: 36氪)

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *