10 Actualités IA Incontournables – Semaine du 14 au 20 juillet 2025
ChatGPT devient un agent exécuteur, contrats DoD à 200 M$, Thinking Machines lève 2 Md$, UE précise l’AI Act… Découvrez les 10 faits marquants de l’IA cette semaine.
10 Actualités IA Incontournables – Semaine du 14 au 20 juillet 2025

1. ChatGPT devient un Agent capable d’actions (17 juillet)
OpenAI a dévoilé ChatGPT Agent, un ordinateur virtuel intégré qui permet à l’IA de naviguer sur le web, d’exécuter du code, de remplir des formulaires ou de générer des présentations. Chaque action jugée « à risque » requiert la validation de l’utilisateur, gage de sécurité. L’agent revendique un 41,6 % sur le redoutable benchmark Humanity’s Last Exam (HLE), soit le double du précédent record.
🔍 Pourquoi c’est clé ? L’IA sort du simple dialogue et devient opérateur : automatisation de workflows, gain de productivité et nouveaux risques de sécurité.
2. Le Pentagone signe 4 contrats IA de 200 M$ chacun (14 juillet)
Le Department of Defense américain a attribué des contrats de 200 millions de dollars à OpenAI, Google, Anthropic et xAI pour industrialiser les agents IA dans la défense. Objectif : développer des workflows décisionnels et automatiser les opérations logistiques.
🛡️ Impact géopolitique : les États-Unis institutionnalisent l’IA agentique ; l’avantage technologique devient militaire.
3. Thinking Machines Lab lève 2 Md$ en seed (18 juillet)
La start-up fondée par l’ex-CTO d’OpenAI, Mira Murati, a réuni 2 milliards $ dès son premier tour, valorisée 12 Md$. Soutiens : a16z, Nvidia, AMD, Cisco, Accel et ServiceNow. La jeune pousse veut créer une IA « collaborative » multimodale.
🚀 Signal de marché : le capital-risque survalorise les profils top talent plutôt que le POC.
4. L’UE publie les lignes directrices de l’AI Act (18 juillet)
La Commission européenne a détaillé, dans un guide de 37 pages, les obligations pour les fournisseurs de modèles GPAI classés « risque systémique ». Au menu : red-teaming adversariale, documentation datasets et rapports d’incidents, sous peine d’amendes pouvant atteindre 7 % du CA mondial.
⚖️ À retenir : la conformité n’est plus optionnelle pour les modèles puissants ciblant le marché européen.
5. Benchmarks : duel serré et percée des agents
Nouveaux scores sur MMLU-Pro, GPQA Diamond, HLE, FrontierMath et LiveCodeBench :
| Benchmark | Portée | Top 1 modèle (score) | Top 2 modèle (score) | Top 3 modèle (score) | Source |
|---|---|---|---|---|---|
| MMLU-Pro | 57 disciplines, 12 000 QCM | Gemini 2.5 Pro 86.2 % | Claude Opus 4 86.1 % | o3 85.6 % | 16,20 |
| GPQA Diamond | 198 QCM post-graduate | Grok 4 86.6 % | Gemini 86.2 % | DeepSeek-R1 84.9 % | 16,61 |
| Humanity’s Last Exam | 2 500 questions texte+images | Gemini 2.5 Pro 21.64 % | o3 high 20.32 % | o3 medium 19.20 % | 70 |
| FrontierMath | 1 264 problèmes recherche math | ChatGPT Agent 27.4 % (outils) | o4-mini 6.3 % (outils) | Grok 3 5.2 % (outils) | 44,62 |
| LiveCodeBench v6 | 1 055 problèmes code | o4-mini 66 % pass@1 | Claude Opus 4 ≈ 60 % | DeepSeek-R1 ≈ 58 % | 63 |
| AIME 2024 | 15 problèmes math concours | Grok 3 93.3 % | o4-mini 93.4 % | Gemini 2.5 Pro 92 % | 15 |
📊 Tendance : la saturation des QCM pousse à des évaluations plus « réalistes » intégrant outils et environnements.
6. Google déploie Gemini 2.5 Pro dans Search et Voice (18 juillet)
Google intègre Gemini 2.5 Pro à Search AI Mode et au module d’appels « Business-Calling ». Résultat : réponses plus profondes et assistance téléphonique augmentée.
🔎 Conséquence : la recherche se mue en moteur conversationnel, menaçant le trafic SEO traditionnel.
7. xAI lance Grok 4 et « Grok for Government » (14 juillet)
Elon Musk dévoile une version fédérale de Grok 4, concluant un accord de 200 M$ avec le DoD. En interne, xAI revendique 38,6 % sur HLE (avec outils), chiffre en attente de validation.
🛰️ Enjeu : Musk s’impose dans la GovTech tandis que Grok grappille sur Gemini et Claude.
8. Cognition AI rachète Windsurf pour 2,4 Md$
Après le retrait de Google, Cognition AI absorbe Windsurf, plateforme d’édition de code IA, pour 2,4 milliards $. L’opération consolide le marché des outils développeurs.
💻 Lecture : la bataille pour les environnements de développement IA s’intensifie.
9. IA dans l’industrie : Metricool, Netflix et Delta innovent
- Metricool lance « MetriLAB AI » pour optimiser automatiquement les créations publicitaires.
- Netflix confirme l’usage de l’IA générative pour le montage et la pré-prod vidéo.

- Delta Air Lines déploie une IA pour optimiser les routes et personnaliser l’expérience passager.
✈️ Signal : l’IA gagne tous les métiers – marketing, média, transport.
10. Régulation et matériel : Fed, Nvidia H20 et super-centres IA
- Fed : Lisa D. Cook alerte sur le risque d’inégalités malgré le gain de productivité.
- Nvidia H20 : exportation vers la Chine autorisée (14 juillet), réduisant l’avantage US.
- Meta & Google : projets de super-centres IA et partenariats nucléaires pour sécuriser l’énergie.
⚡ À suivre : la course au compute devient aussi stratégique que les algorithmes.
Conclusion
La semaine du 14 au 20 juillet 2025 marque un tournant : l’IA conversationnelle prend le contrôle d’outils réels, les gouvernements investissent massivement et l’Europe affine sa régulation. Dans ce contexte d’accélération, vos organisations doivent anticiper la convergence entre performance, responsabilité et souveraineté.

Tags :
Besoin d'aide avec votre stratégie IA ?
Découvrez comment OSCAR.IA peut transformer votre présence digitale avec l'intelligence artificielle.
Demander une consultation gratuite