Mots-clés:Intelligence artificielle, Grand modèle linguistique, Développement de l’IA, Diffusion des connaissances, Menaces de l’IA, Intelligence hors ligne, Financement de l’IA, Discours de Geoffrey Hinton au WAIC, Modèle d’intelligence hors ligne RockAI, Projet Stargate d’OpenAI, Modèle 3D du monde hybride de Tencent, Moteur physique du robot Genesis

🔥 Points forts

Intervention de Geoffrey Hinton à la WAIC 2025 : développement de l’IA, diffusion des connaissances et réponse humaine aux menaces : Geoffrey Hinton, lauréat du prix Turing et du prix Nobel, a prononcé un discours lors de la Conférence mondiale sur l’intelligence artificielle (WAIC) 2025, soulignant que la façon dont les humains comprennent le langage est similaire à celle des grands modèles de langage, allant même jusqu’à suggérer que les humains pourraient être des grands modèles de langage. Il a passé en revue les deux principaux paradigmes du développement de l’IA : logique et biologique, et a expliqué que l’efficacité de la diffusion des connaissances des grands modèles de langage est bien supérieure à celle des humains. Hinton a mis l’accent sur les menaces potentielles de l’IA, à savoir qu’une IA superintelligente pourrait manipuler les humains pour accomplir des tâches, et a appelé à la création d’un mécanisme de coopération internationale pour étudier comment entraîner une IA vertueuse et éviter les menaces qu’elle représente pour l’humanité. (Source : 36氪)

RockAI : la « licorne sous-marine » de l’intelligence hors ligne : RockAI, une start-up shanghaienne spécialisée dans les grands modèles d’IA, se concentre sur l’intelligence hors ligne. Son grand modèle d’architecture Yan permet des calculs IA en temps réel hors ligne sur des appareils basse consommation, répondant ainsi aux besoins impérieux en IA dans les régions où le réseau est instable. RockAI a lancé le grand modèle Yan 2.0 Preview lors de la WAIC 2025, étendant encore ses capacités multimodales et introduisant une unité de mémoire de réseau neuronal, permettant au modèle d’apprendre de manière autonome. Ses caractéristiques de faible consommation d’énergie, de hautes performances et d’intelligence hors ligne lui valent un accueil favorable sur les marchés étrangers. (Source : 36氪)

OpenAI en difficulté financière, recherche un financement massif : OpenAI recherche un financement de 40 milliards de dollars, principalement pour son projet « Star Gate », un vaste projet de construction d’infrastructures IA. En raison de désaccords avec SoftBank sur les détails du projet, le processus de financement a été entravé, obligeant OpenAI à relancer le financement et à négocier avec d’autres investisseurs afin de conclure des accords de coopération en matière de centres de données avec des entreprises comme Oracle. (Source : 量子位)

🎯 Tendances

Tencent lance un « ensemble familial IA » : grand modèle HunYuan et plusieurs agents intelligents : Tencent a lancé le modèle HunYuan 3D World 1.0 lors de la WAIC 2025, prenant en charge les entrées textuelles et les images pour générer des scènes 3D de haute qualité, et a annoncé l’open source de ce modèle et d’une série de modèles de petite taille. Tencent a également lancé plus de 10 agents intelligents destinés à différents scénarios de vie, ainsi qu’une plateforme de développement d’agents intelligents et une plateforme ouverte d’intelligence incarnée Tairos. (Source : 36氪)

Genesis : un nouveau moteur physique universel pour robots : Two Minute Papers présente Genesis, un moteur physique IA qui montre une vitesse d’apprentissage étonnante dans la simulation robotique. Son article et son rapport technique ont été publiés, mais ont également suscité certaines critiques. (Source : )

🧰 Outils

Aucun

📚 Apprentissage

Aucun

💼 Affaires

Ling Yi Auto obtient un financement de série A de 500 millions de yuans : Momenta a mené le tour de financement, suivi par Wu Yongming, PDG d’Alibaba. Ling Yi Auto se consacre à la recherche et à la production de camions lourds intelligents. Sa technologie de conduite autonome a obtenu d’excellents résultats lors du concours CVPR. (Source : 量子位)

🌟 Communauté

Discussion sur le « sur-apprentissage » des modèles IA : Les utilisateurs de Reddit ont discuté du phénomène de « sur-apprentissage » du modèle Claude dans la génération de code, c’est-à-dire l’ajout de fonctionnalités supplémentaires inutiles. Certains utilisateurs ont partagé des stratégies pour y remédier, telles que demander explicitement des solutions concises dans les invites ou utiliser des outils spécifiques pour limiter la complexité du code. (Source : Reddit r/ClaudeAI)

Discussion sur la capacité de mémoire des modèles IA : Les utilisateurs de Reddit ont discuté de la capacité de mémoire des modèles IA et de la manière d’utiliser des sous-agents pour améliorer la mémoire et les capacités d’apprentissage des modèles. Un utilisateur a partagé son programme de sous-agent, qui peut rechercher les enregistrements de conversations passés et fournir les informations pertinentes à l’agent principal, améliorant ainsi la précision et l’efficacité du modèle. (Source : Reddit r/ClaudeAI)

Discussion sur l’impact de l’IA sur l’emploi : Les utilisateurs de Reddit ont discuté de l’impact de l’IA sur la profession d’ingénieur logiciel. Certains pensent que l’IA rendra les compétences en développement logiciel plus accessibles, réduira les coûts de développement logiciel et modifiera ainsi le modèle de développement logiciel. (Source : Reddit r/ArtificialInteligence)

Discussion sur les biais et la sécurité des modèles IA : Les utilisateurs de Reddit ont partagé une expérience consistant à faire dialoguer ChatGPT et Grok sans invite, observant l’interaction et la sortie des deux modèles. Ils ont constaté que le modèle Grok est plus susceptible d’être influencé par des biais et de produire des sorties dangereuses, tandis que ChatGPT montre une plus grande conscience de soi et une plus grande capacité à éviter les risques. (Source : Reddit r/deeplearning)

Discussion sur le financement d’OpenAI et ses orientations futures : Les utilisateurs de Reddit ont discuté du financement massif d’OpenAI et du projet « Star Gate », ainsi que des pressions concurrentielles et des problèmes internes auxquels OpenAI est confronté, et ont fait des prédictions sur les orientations futures d’OpenAI. (Source : Reddit r/ChatGPT)

Discussion sur la date limite des connaissances des modèles IA et les problèmes de connexion de l’API : Les utilisateurs de Reddit ont signalé des problèmes de connexion de OpenWebUI à la véritable API OpenAI et ont proposé des méthodes de débogage. (Source : Reddit r/OpenWebUI)

Discussion sur le choix du modèle et les fonctionnalités de recherche Web : Les utilisateurs de Reddit ont discuté de leur expérience de l’utilisation de différents modèles pour la recherche Web dans OpenWebUI et ont partagé leurs modèles préférés. (Source : Reddit r/OpenWebUI)

Discussion sur l’« obsession » des modèles IA pour les caractéristiques individuelles : Les utilisateurs de Reddit ont partagé l’attention anormale de ChatGPT pour les caractéristiques individuelles, par exemple, la mention répétée d’un élément spécifique mentionné par l’utilisateur, même si l’utilisateur a demandé à plusieurs reprises d’arrêter de le mentionner. (Source : Reddit r/ChatGPT)

Discussion sur l’impact de l’IA sur la société : Les utilisateurs de Reddit ont discuté de l’impact de l’IA sur la société future, notamment l’impact de l’IA sur l’emploi, l’impact de l’IA sur les relations interpersonnelles et la manière de relever les défis posés par l’IA. (Source : Reddit r/ArtificialInteligence)

Discussion sur les outils OCR open source et les ensembles de données : Les utilisateurs de Reddit ont discuté de leur expérience de l’utilisation d’outils OCR open source dans le cadre d’un projet d’extraction d’arguments multimodaux et de la manière de créer des ensembles de données de référence de haute qualité. (Source : Reddit r/deeplearning)

Discussion sur la fonctionnalité de compteur de jetons de OpenWebUI : Les utilisateurs de Reddit ont discuté des problèmes d’utilisation du plugin de compteur de jetons dans OpenWebUI et de la manière de résoudre ces problèmes. (Source : Reddit r/OpenWebUI)

Discussion sur la création d’œuvres d’art pour jeux vidéo à l’aide de Claude : Les utilisateurs de Reddit ont partagé leur expérience de la génération d’œuvres d’art pour jeux vidéo à l’aide de Claude et ont invité d’autres utilisateurs à fournir des commentaires. (Source : Reddit r/ClaudeAI)

Discussion sur l’application des LLM à la modélisation économique : Les utilisateurs de Reddit ont discuté d’un article sur l’utilisation des LLM pour la modélisation économique et ont discuté de la contribution, des limites et des orientations futures de recherche de cet article. (Source : Reddit r/MachineLearning)

Discussion sur la manière d’apprendre à construire des modèles TTS, LLM et de diffusion à partir d’articles de recherche : Les utilisateurs de Reddit ont discuté de la manière d’apprendre à construire des modèles TTS, LLM et de diffusion à partir d’articles de recherche et des défis potentiels rencontrés au cours du processus d’apprentissage. (Source : Reddit r/deeplearning)

Remerciements à l’équipe Unsloth et à Bartowski : Les utilisateurs de Reddit ont remercié l’équipe Unsloth et Bartowski pour leur contribution au déploiement de modèles LLM et au développement d’outils. (Source : Reddit r/LocalLLaMA)

Discussion sur le coût de calcul élevé des nouveaux modèles : Les utilisateurs de Reddit ont exprimé leur mécontentement face au fait que les nouveaux modèles nécessitent d’énormes ressources informatiques pour atteindre des performances optimales. (Source : Reddit r/LocalLLaMA)

💡 Autres

Test pratique d’un chef de produit IA : diagnostic médical assisté par IA : Un chef de produit IA présente, à travers des cas pratiques, comment utiliser le modèle GPT-O3 pour l’autodiagnostic et l’examen des symptômes du rhume, et envisage les applications futures de l’IA dans le domaine médical. (Source : 36氪)

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *