Depuis son lancement à l’été 2025, GPT-5 voit sa popularité diminuer auprès des utilisateurs. Les derniers résultats de LMArena montrent la supériorité des modèles Claude d’Anthropic et Gemini de Google, reléguant OpenAI à une position moins favorable. Les classements par domaine révèlent également de nouveaux leaders en génération de texte, développement web, images et recherche en ligne.
Lancé à l’été 2025 comme une avancée majeure, GPT-5 voit sa popularité diminuer auprès des utilisateurs. Les classements de LMArena, basés sur des duels anonymes où chaque modèle répond aux mêmes prompts et obtient un score Elo selon les votes, reflètent cette tendance.
GPT-5 recule désormais à la huitième place, devancé par ses prédécesseurs GPT-4.5 et GPT-4o. Pendant ce temps, Anthropic et Google renforcent leur présence dans le top 10 avec plusieurs modèles. Ce recul met en évidence la montée des concurrents et l’importance d’évaluer les IA selon leurs performances spécifiques en génération de texte, développement web, création d’images et recherche en ligne.
Le classement général des modèles d’IA en octobre 2025
Le classement LMArena repose sur les votes des utilisateurs confrontés à des réponses issues de modèles différents. Cette méthode évalue les performances des IA en continu. Le principe rappelle celui d’une simulation portage salarial, qui anticipe le revenu net avant tout engagement.
GPT-5, sixième en septembre, glisse à la huitième place en octobre, dépassé par GPT-4.5 et GPT-4o. À l’inverse, Anthropic domine avec deux modèles Claude en première et deuxième positions. Google s’empare de la troisième place avec Gemini 2.5 Pro. OpenAI parvient toutefois à maintenir un modèle dans le top 10, avec o3 en neuvième position.
Voici le top 10 des modèles d’IA les plus performants selon LMArena (octobre 2025) :
Rang | Modèle |
1 | Claude Opus 4.1 « thinking » |
2 | Claude Sonnet 4.5 « thinking » |
3 | Gemini 2.5 Pro |
4 | GPT-4.5 Preview |
5 | ChatGPT-4o |
6 | Claude Opus 4.1 |
7 | Claude Sonnet 4.5 |
8 | GPT-5 « high » |
9 | o3 |
10 | Qwen3 Preview |
D’autres acteurs se positionnent plus loin dans le classement : DeepSeek (16ᵉ) et Mistral AI (34ᵉ), tandis que le modèle chinois Qwen3 occupe le dixième rang.
Les performances des modèles selon les domaines d’expertise
En se basant sur la méthodologie LMArena, les classements reposent sur des duels anonymes où chaque modèle reçoit le même prompt :
- Une victoire contre un modèle mieux classé augmente le score Elo ;
- Une défaite face à un modèle moins performant le diminue.
Les résultats sont mis à jour en temps réel. Cette approche peut permettre, à l’instar d’une SIMULATION PORTAGE SALARIAL, d’estimer avec précision les résultats.
La LMArena distingue désormais les modèles selon leurs capacités spécifiques, offrant un panorama détaillé des performances par domaine.
Pour ce qui est de la génération de texte, Gemini 2.5 Pro reste en tête, suivi des modèles Claude Opus 4.1 et Sonnet 4.5. Toutefois, GPT-5 n’apparaît qu’en huitième position, devancé par trois modèles précédents d’OpenAI.
Concernant le développement web, GPT-5 « high » domine ce classement, devant trois modèles d’Anthropic (deux Opus et un Sonnet). OpenAI conserve donc une place de choix dans ce secteur.
Quant à la génération d’images, il semble que Tencent surprend avec Hunyuan Image 3.0 en tête. Il est suivi de Gemini 2.5 Flash Image et Imagen 4.0 Ultra. Deux modèles Seedream complètent le top 5, tandis que GPT-Image glisse à la septième place.
Par rapport à la recherche web, Grok-4 conserve la première place, devant Gemini 2.5 Pro et o3. Le spécialiste Perplexity recule à la cinquième position.
Cet article vous a-t-il été utile ?
Note moyenne 0 / 5. Votants: 0


