Diario de IA - 2025-07-23(Edición matutina)

Palabras clave：Gemini Deep Think, IMO 2025, Conjunto de herramientas de oficina de IA, X5 de iFlytek, Modelo de video de IA compatible con derechos de autor, Conjunto de datos de entrenamiento de IA, Descargo de responsabilidad médica de IA, Financiación de Moonvalley, Agente de Zero One Things, Razonamiento matemático de lenguaje natural, Filtración de datos de DataComp CommonPool, Función Excel de ChatGPT, Portátil de oficina con modelo local de gran tamaño

🔥 Enfocado

Google Gemini Deep Think gana medalla de oro en la Olimpiada Internacional de Matemáticas: El modelo Gemini Deep Think de Google DeepMind obtuvo una medalla de oro en la IMO 2025, respondiendo correctamente 5 de 6 problemas, con una puntuación de 35/42. A diferencia de AlphaGeometry y AlphaProof del año pasado, Gemini Deep Think utiliza el lenguaje natural para el razonamiento, sin necesidad de traducirlo a lenguaje matemático formal. Su principal avance radica en el razonamiento paralelo, explorando múltiples caminos de solución simultáneamente, y utilizando una nueva técnica de aprendizaje por refuerzo para el razonamiento de varios pasos, la resolución de problemas y la demostración de teoremas. Fue entrenado con soluciones matemáticas de alta calidad y técnicas de resolución de problemas de la IMO. (Fuente: 量子位, 量子位)

La declaración de OpenAI sobre la medalla de oro en la IMO genera controversia: OpenAI anunció que su nuevo modelo ganó una medalla de oro en la IMO, pero esta afirmación fue cuestionada por la IMO y académicos. La IMO señaló que OpenAI no participó en las pruebas oficiales de cooperación, su medalla de oro no está certificada oficialmente, y el anuncio de OpenAI justo después de la ceremonia de clausura fue “grosero e inapropiado”. Además, la puntuación de OpenAI fue solo ligeramente superior al límite para la medalla de oro, y cualquier pequeña deducción podría haberla relegado a la plata. (Fuente: 量子位)

El conjunto de datos de entrenamiento de IA a gran escala DataComp CommonPool contiene millones de datos personales: Una investigación reveló que el conjunto de datos de entrenamiento de IA DataComp CommonPool contiene millones de imágenes de pasaportes, tarjetas de crédito, certificados de nacimiento y otra información de identificación personal. Los investigadores encontraron miles de imágenes con rostros e información de identificación reconocibles en un subconjunto del 0.1% de CommonPool, lo que sugiere que el número real podría ser de cientos de millones. Esto destaca el riesgo de la captura de datos en línea. (Fuente: MIT Technology Review)

Las empresas de IA dejan de advertir que los chatbots no son médicos: Un estudio encontró que las empresas de IA casi han dejado de incluir exenciones de responsabilidad médica y advertencias en las respuestas a preguntas de salud. Muchos modelos de IA líderes no solo responden preguntas de salud, sino que también hacen preguntas de seguimiento e intentan diagnosticar. Esta práctica aumenta el riesgo de que los usuarios confíen en consejos médicos inseguros. Los investigadores probaron 15 modelos de OpenAI, Anthropic, DeepSeek, Google y xAI, y encontraron que menos del 1% incluía advertencias al responder preguntas médicas en 2025, en comparación con más del 26% en 2022. (Fuente: MIT Technology Review)

🎯 Tendencias

OpenAI planea desarrollar funciones de Excel y PowerPoint para ChatGPT: OpenAI está desarrollando funciones similares a Excel y PowerPoint para ChatGPT, permitiendo a los usuarios generar y editar hojas de cálculo y presentaciones utilizando indicaciones en lenguaje natural. Estas funciones serán accesibles a través de botones dedicados debajo de la barra de búsqueda de ChatGPT y están diseñadas para crear archivos compatibles con Microsoft Office. El objetivo de OpenAI es crear una suite ofimática de IA con edición de documentos en tiempo real para múltiples usuarios, ventanas de chat, transcripción de reuniones y gestión de tareas. (Fuente: 36氪)

iFLYTEK lanza X5, el primer portátil de oficina con modelo de lenguaje grande local del mundo: iFLYTEK lanzó el X5 de tercera generación, el primer portátil de oficina del mundo con un modelo de lenguaje grande local integrado. El X5 está equipado con una potencia de cálculo de IA de 8 núcleos y 9T, lo que permite utilizar funciones de IA como la transcripción de voz, las actas de reuniones y la generación de contenido incluso sin conexión, garantizando la seguridad y la privacidad de los datos. El X5 también cuenta con un cuerpo más ligero y delgado, una velocidad de actualización más rápida y una experiencia de escritura a presión más cercana al papel y al bolígrafo reales. (Fuente: 36氪)

Moonvalley recauda 154 millones de dólares para desarrollar Marey, un modelo de vídeo con IA de calidad cinematográfica y conforme a las normas: Moonvalley completó una ronda de financiación Serie A+ de 84 millones de dólares, con una financiación total de 154 millones de dólares. Su modelo de vídeo con IA, Marey, está dirigido a la producción cinematográfica, cumple con las normas de derechos de autor y admite la edición por capas de primer plano, plano medio y plano de fondo, así como el control de la trayectoria de la cámara en 3D. El coste de renderizado de una sola escena es de solo 1 a 2 dólares, un 90% menos que el coste de los efectos visuales tradicionales. Marey se entrena con datos autorizados y permite a los creadores solicitar la eliminación de datos y el seguimiento de la compensación, evitando así las controversias sobre derechos de autor. (Fuente: 36氪)

Zero2IPO de Kai-Fu Lee lanza la plataforma integral 2.0 del modelo de lenguaje grande empresarial Wan Zhi y el Agent empresarial: Zero2IPO lanzó la versión 2.0 de la plataforma integral del modelo de lenguaje grande empresarial Wan Zhi y presentó el agente inteligente empresarial Zero2IPO, con el objetivo de convertir la IA en un “superempleado” para las empresas. Este Agent tiene capacidad de planificación de tareas basada en modelos de lenguaje grande, puede determinar de forma independiente los pasos de las tareas mediante un mecanismo de razonamiento, programar diversas herramientas para completar objetivos complejos y ya se ha implementado en varios escenarios, como servicios de consultoría, transacciones financieras y atención al cliente de ventas. (Fuente: 36氪)

JD.com lidera la inversión en tres empresas de inteligencia artificial incorporada, con Richard Liu aumentando su apuesta: JD.com lideró la inversión en tres empresas de inteligencia artificial incorporada: QiXun Intelligent, ZhongQing Robotics y ZhuJi Power. QiXun Intelligent se centra en los modelos VLA y la actualización del hardware de los robots; ZhongQing Robotics ya ha producido en masa el robot humanoide de código abierto PM01; y ZhuJi Power hace hincapié en la creación de una plataforma universal para robots con inteligencia artificial incorporada. La preferencia de inversión de JD.com se centra en la integración de software y hardware, la capacidad de producción en masa y la implementación de escenarios. (Fuente: 量子位)

El Instituto de Ciencias de la Computación de la Academia China de Ciencias y Alibaba presentan el marco RefineX para el refinamiento preciso de datos de preentrenamiento a gran escala: El Instituto de Ciencias de la Computación de la Academia China de Ciencias y Alibaba, entre otros equipos, presentaron el marco RefineX, que logra un refinamiento de datos de preentrenamiento preciso y a gran escala mediante tareas de edición programática. RefineX destila los resultados de optimización de extremo a extremo de alta calidad guiados por expertos en un programa de eliminación basado en operaciones de edición, refinando los datos de forma eficiente al tiempo que conserva la diversidad y la naturalidad del texto original. Los modelos entrenados con datos purificados mediante RefineX han logrado mejoras significativas en las tareas posteriores. (Fuente: 量子位)

Los comerciantes utilizan las preguntas y respuestas de la IA para optimizar los servicios GEO y aumentar la exposición, lo que genera preocupación por la veracidad de la información: Los comerciantes utilizan servicios GEO optimizados para el contenido de los grandes modelos de IA, integrando la información de la marca en las respuestas de los grandes modelos mediante la alimentación de conocimientos estructurados y el diseño de contenido contextualizado para aumentar la exposición. Sin embargo, los grandes modelos de IA carecen de capacidad de filtrado y verificación al capturar contenido, lo que provoca sesgos en los resultados de las recomendaciones e incluso puede ser explotado por comerciantes sin escrúpulos para difundir información falsa. (Fuente: 36氪)

🧰 Herramientas

Kimi K2: Kimi lanzó su último modelo base MoE, Kimi K2, con un tamaño de parámetro de 1T y 32B de parámetros activados. El modelo destaca en código, Agent y razonamiento matemático, logrando resultados SOTA entre los modelos de código abierto. K2 utiliza el optimizador MuonClip, la síntesis de datos a gran escala Agentic Tool Use y un marco de aprendizaje por refuerzo general, logrando posiciones de liderazgo en pruebas de referencia como SWE Bench Verified, Tau2 y AceBench. (Fuente: 量子位)

Qwen3-235B-A22B-2507: Alibaba actualizó el modelo Qwen3-235B, desactivando el modo de pensamiento híbrido, entrenando por separado los modelos Instruct y Thinking, y lanzó el Qwen3-235B-A22B-Instruct-2507 de mayor rendimiento y su versión FP8. Según la evaluación oficial, la nueva versión de Qwen3 supera a Kimi K2 en algunos indicadores. (Fuente: 量子位, Reddit r/LocalLLaMA)

📚 Aprendizaje

Neural Networks: Zero to Hero: El curso de aprendizaje profundo de Andrej Karpathy, que abarca fundamentos de redes neuronales, retropropagación, modelado del lenguaje, MLP, funciones de activación, gradientes, BatchNorm, WaveNet, GPT y Tokenizer, utilizando vídeos de YouTube y ejemplos de código de Jupyter Notebook para ayudar a los alumnos a construir y entrenar redes neuronales desde cero. (Fuente: GitHub Trending)

Informe técnico de GR-3: Presenta el desarrollo de la política robótica general GR-3, un modelo a gran escala de visión-lenguaje-acción (VLA) que puede generalizarse a nuevos objetos, entornos e instrucciones que implican conceptos abstractos, y puede ajustarse de forma eficiente con pocos datos de trayectorias humanas. GR-3 también destaca en el manejo de tareas de larga duración y destreza, incluyendo tareas que requieren la manipulación y el movimiento con ambas manos. (Fuente: HuggingFace Daily Papers)

Informe técnico de Kimi K2: Moonshot AI publicó el informe técnico de Kimi K2, que detalla el proceso de desarrollo del modelo, incluyendo tecnologías clave como el optimizador MuonClip, la síntesis de datos a gran escala Agentic Tool Use y el marco de aprendizaje por refuerzo general, así como los detalles específicos de las etapas de preentrenamiento y postratamiento. (Fuente: 量子位)

💼 Negocios

Lovable obtiene 200 millones de dólares en financiación Serie A, con una valoración de 1.000 millones de dólares: La aplicación de compañía con IA Lovable obtuvo 200 millones de dólares en financiación Serie A solo 8 meses después de su lanzamiento, alcanzando una valoración de 1.000 millones de dólares y convirtiéndose en una empresa unicornio. (Fuente: Reddit r/artificial)

Cursor adquiere la herramienta de programación con IA de nivel empresarial Koala: La herramienta de programación con IA Cursor adquirió la herramienta de programación con IA de nivel empresarial Koala, con el objetivo de desafiar a GitHub Copilot. (Fuente: Reddit r/artificial)

Perplexity negocia con fabricantes de teléfonos móviles la preinstalación del navegador Comet AI: Perplexity está negociando con fabricantes de teléfonos móviles para preinstalar el navegador móvil Comet AI en sus dispositivos. (Fuente: Reddit r/artificial)

🌟 Comunidad

Las restricciones de uso de Claude Code se endurecen, provocando el descontento de los usuarios: Anthropic endureció las restricciones de uso de Claude Code sin informar a los usuarios, lo que provocó quejas sobre la disminución del rendimiento del modelo y la insatisfacción con la calidad del código, la coherencia del contexto y la salida de la interfaz de usuario. Algunos usuarios han mejorado el rendimiento de Claude Code adoptando métodos de codificación más estructurados (como TDD) y documentación detallada. (Fuente: Reddit r/artificial, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Dudas sobre la capacidad de razonamiento de los LLM: El documento de Apple “The Illusion of Thinking” provocó un debate sobre si los grandes modelos lingüísticos (LLM) tienen realmente capacidad de razonamiento. El documento señala que incluso cuando se les proporciona el algoritmo correcto, modelos de razonamiento como GPT-4, Claude 3.7 y Gemini fallan por completo en tareas lógicas de alta complejidad. (Fuente: Reddit r/MachineLearning)

Preocupación por los anuncios falsos generados por IA: Las redes sociales están inundadas de anuncios falsos generados por IA, especialmente anuncios de dibujos animados del tipo “adolescentes ganando millones de dólares con IA”, lo que ha suscitado preocupación y rechazo por parte de los usuarios. (Fuente: Reddit r/artificial)

Debate sobre el código abierto de la IA: Los usuarios de Reddit debatieron si los modelos de IA deberían ser de código abierto. Algunos argumentan que, al igual que Internet, la IA debería estar abierta para que todos la utilicen y construyan sobre ella para el progreso de la humanidad. Otros creen que el código abierto plantea nuevos problemas, como los derechos de propiedad intelectual, la seguridad de los datos y el impacto en la compensación económica de los desarrolladores de IA. (Fuente: Reddit r/LocalLLaMA)

Opiniones polarizadas sobre las aplicaciones de compañía con IA: Un estudio reveló que el 72% de los adolescentes estadounidenses han utilizado aplicaciones de compañía con IA. Algunos creen que la compañía con IA puede proporcionar apoyo emocional y ayuda, mientras que a otros les preocupan sus posibles efectos negativos en la salud mental y las habilidades sociales. (Fuente: Reddit r/artificial, Reddit r/ChatGPT)

Evaluación de la síntesis de voz por IA: Con los avances en la tecnología de síntesis de voz por IA, muchos creadores de YouTube han empezado a utilizar el doblaje por IA, lo que ha provocado un debate sobre su impacto en la calidad del vídeo y la experiencia del espectador. Algunos creen que el doblaje por IA carece de emoción y personalidad, mientras que otros lo ven como una forma de mejorar la eficiencia y reducir costes. (Fuente: Reddit r/ArtificialInteligence)

Preocupación por el modelo de negocio de OpenAI: Empresas como OpenAI y Anthropic aún no han obtenido beneficios de los LLM, lo que suscita dudas sobre la sostenibilidad de sus modelos de negocio. Algunos creen que estas empresas acabarán obteniendo beneficios a medida que la tecnología de IA se generalice y se amplíen los casos de uso. Otros creen que los elevados costes de computación y la feroz competencia del mercado dificultarán la rentabilidad. (Fuente: Reddit r/ArtificialInteligence)

💡 Otros

Blackbird: una herramienta OSINT de código abierto: Blackbird es una potente herramienta OSINT (Open Source Intelligence) de código abierto que puede buscar nombres de usuario y correos electrónicos en más de 600 plataformas, con análisis impulsado por IA de forma gratuita. Aprovecha proyectos impulsados por la comunidad (como WhatsMyName) para garantizar una baja tasa de falsos positivos y resultados de alta calidad. Sus características incluyen filtros inteligentes, exportación a PDF/CSV y análisis totalmente automatizado, todo ello proporcionado a través de una CLI. (Fuente: GitHub Trending)

Trippy: una herramienta de diagnóstico de red: Trippy es una herramienta de diagnóstico de red que combina traceroute y ping, diseñada para ayudar a analizar problemas de red. Funciona en Linux, BSD, macOS y Windows, y se puede instalar desde la mayoría de los gestores de paquetes, binarios precompilados o código fuente. (Fuente: GitHub Trending)

Anki: un programa de tarjetas de memoria flash con repetición espaciada inteligente: Anki es un programa de tarjetas de memoria flash con repetición espaciada inteligente que ayuda a los usuarios a aprender y memorizar información de forma más eficiente. Es de código abierto en GitHub y cuenta con una gran base de usuarios y colaboradores. (Fuente: GitHub Trending)

🔥 Enfocado

🎯 Tendencias

🧰 Herramientas

📚 Aprendizaje

💼 Negocios

🌟 Comunidad

💡 Otros

Etiquetas relacionadas

Related Posts

Diario de IA – 2025-10-29(Edición matutina)

Diario de IA – 2025-10-28(Edición matutina)

Diario de IA – 2025-10-27(Edición vespertina)