Un panorama frais et affûté de la course effrénée à l’intelligence artificielle, ponctué d’anecdotes concrètes, pour mieux saisir qui mène la danse en cette mi-2025.
LMArena, la Chatbot Arena version 2.0
Juin 2025 marque un tournant. Fini le classement général unique – c’est désormais la LMArena (anciennement Chatbot Arena) qui s’impose, avec sept palmarès spécialisés. Chaque modèle est testé dans son domaine de prédilection, pour évaluer avec plus de finesse ses capacités :
- Texte : rédaction, reformulation, réponses pertinentes
- Dev web : écriture, debug et explication de codes
- Analyse d’images : compréhension et description visuelle
- Recherche en ligne : synthèse d’informations fiables
- Copilot : assistance dans l’écriture de fonctions ou de complétion de code
- Génération d’images : création d’images à partir de descriptions
Pourquoi ce changement ?
Imaginez un gâteau aux mille saveurs : un simple classement général n’en montrerait qu’un goût moyen. En fractionnant, la LMArena révèle les spécialités de chaque IA, comme un sommelier appréciant les nuances d’un bon vin.
Classement global : la suprématie de Google Gemini
En haut du podium : Gemini‑2.5‑pro‑preview, un modèle impressionnant en écriture, maths et code. Derrière, OpenAI répond avec son modèle o3, excellent mais parfois un peu en retrait sur les demandes longues. Claude‑Opus‑4, d’Anthropic, s’immisce en sixième position, confirmant l’évolution rapide de sa performance.
Top 10 par catégorie
Texte
Gemini et ChatGPT se livrent une lutte serrée, souvent départagés par des subtilités stylistiques. L’écart reste très serré, chaque mot compte.

Développement web
Gemini domine toujours, mais Claude et le mystérieux DeepSeek gagnent en visibilité. À mes yeux, c’est comme voir un vieux champion partager le ring avec de nouveaux challengers — excitant à suivre.

Analyse d’images
Google et OpenAI monopolisent le top 10. Les challengers peinent à casser ce duo de choc, preuve que la vision artificielle reste techniquement exigeante.

Recherche en ligne
Perplexity tire son épingle du jeu avec Sonar, son moteur performant, mais Gemini‑2.5‑grounding de Google conserve la tête. OpenAI reste discret dans ce domaine.

Assistants de code
Ici, c’est la foire aux talents : DeepSeek, Claude, Qwen, Mistral, Gemini… Aucun ne parvient à imposer sa domination, offrant plutôt un bel équilibre, à l’image d’un relais bien rodé lors d’un marathon.

Génération d’images
OpenAI crée la surprise avec GPT‑Image‑1, qui dépasse les modèles de Google. Derrière, des options spécialisées comme Ideogram ou Stable Diffusion coexistent harmonieusement.

La mécanique du duel : comment LMArena classe les IA
La plateforme fonctionne avec des confrontations anonymes : deux modèles répondent à un même prompt et les utilisateurs choisissent celui qui les satisfait le plus. Le classement repose ensuite sur un système de notation Elo, inspiré des échecs : chaque victoire en duel contre un modèle plus performant rapporte davantage.
Ce dispositif offre une évaluation robuste, en limitant les biais liés à la réputation des modèles. Résultat : un vrai baromètre de performance, pas un simple concours de popularité.
- Voici le top 20 des IA qui dominent en juin 2025 : des surprises au classement - 5 juillet 2025
- Après des heures de jeu, cette IA semble… ressentir des émotions - 4 juillet 2025
- Deezer démasque des chansons 100 % IA : le résultat va vous étonner - 3 juillet 2025