Accueil » Les derniers classements LMArena confirment la régression de GPT-5 face à Claude et Gemini

Les derniers classements LMArena confirment la régression de GPT-5 face à Claude et Gemini

SPS rédaction

Depuis son lancement à l’été 2025, GPT-5 voit sa popularité diminuer auprès des utilisateurs. Les derniers résultats de LMArena montrent la supériorité des modèles Claude d’Anthropic et Gemini de Google, reléguant OpenAI à une position moins favorable. Les classements par domaine révèlent également de nouveaux leaders en génération de texte, développement web, images et recherche en ligne.

Lancé à l’été 2025 comme une avancée majeure, GPT-5 voit sa popularité diminuer auprès des utilisateurs. Les classements de LMArena, basés sur des duels anonymes où chaque modèle répond aux mêmes prompts et obtient un score Elo selon les votes, reflètent cette tendance.

GPT-5 recule désormais à la huitième place, devancé par ses prédécesseurs GPT-4.5 et GPT-4o. Pendant ce temps, Anthropic et Google renforcent leur présence dans le top 10 avec plusieurs modèles. Ce recul met en évidence la montée des concurrents et l’importance d’évaluer les IA selon leurs performances spécifiques en génération de texte, développement web, création d’images et recherche en ligne.

Le classement général des modèles d’IA en octobre 2025

Le classement LMArena repose sur les votes des utilisateurs confrontés à des réponses issues de modèles différents. Cette méthode évalue les performances des IA en continu. Le principe rappelle celui d’une simulation portage salarial, qui anticipe le revenu net avant tout engagement.

GPT-5, sixième en septembre, glisse à la huitième place en octobre, dépassé par GPT-4.5 et GPT-4o. À l’inverse, Anthropic domine avec deux modèles Claude en première et deuxième positions. Google s’empare de la troisième place avec Gemini 2.5 Pro. OpenAI parvient toutefois à maintenir un modèle dans le top 10, avec o3 en neuvième position.

Voici le top 10 des modèles d’IA les plus performants selon LMArena (octobre 2025) :

Rang	Modèle
1	Claude Opus 4.1 « thinking »
2	Claude Sonnet 4.5 « thinking »
3	Gemini 2.5 Pro
4	GPT-4.5 Preview
5	ChatGPT-4o
6	Claude Opus 4.1
7	Claude Sonnet 4.5
8	GPT-5 « high »
9	o3
10	Qwen3 Preview

D’autres acteurs se positionnent plus loin dans le classement : DeepSeek (16ᵉ) et Mistral AI (34ᵉ), tandis que le modèle chinois Qwen3 occupe le dixième rang.

Les performances des modèles selon les domaines d’expertise

En se basant sur la méthodologie LMArena, les classements reposent sur des duels anonymes où chaque modèle reçoit le même prompt :

Une victoire contre un modèle mieux classé augmente le score Elo ;
Une défaite face à un modèle moins performant le diminue.

Les résultats sont mis à jour en temps réel. Cette approche peut permettre, à l’instar d’une SIMULATION PORTAGE SALARIAL, d’estimer avec précision les résultats.

La LMArena distingue désormais les modèles selon leurs capacités spécifiques, offrant un panorama détaillé des performances par domaine.

Pour ce qui est de la génération de texte, Gemini 2.5 Pro reste en tête, suivi des modèles Claude Opus 4.1 et Sonnet 4.5. Toutefois, GPT-5 n’apparaît qu’en huitième position, devancé par trois modèles précédents d’OpenAI.

Concernant le développement web, GPT-5 « high » domine ce classement, devant trois modèles d’Anthropic (deux Opus et un Sonnet). OpenAI conserve donc une place de choix dans ce secteur.

Quant à la génération d’images, il semble que Tencent surprend avec Hunyuan Image 3.0 en tête. Il est suivi de Gemini 2.5 Flash Image et Imagen 4.0 Ultra. Deux modèles Seedream complètent le top 5, tandis que GPT-Image glisse à la septième place.

Par rapport à la recherche web, Grok-4 conserve la première place, devant Gemini 2.5 Pro et o3. Le spécialiste Perplexity recule à la cinquième position.

Cet article vous a-t-il été utile ?

Note moyenne 0 / 5. Votants: 0

Retrouvez ici les dernières actualités

La génération Z révolutionne les codes de la communication moderne

2 juin 2026

Malgré les préjugés tenaces sur leur rapport au travail, les jeunes actifs de la génération Z s’imposent comme des atouts stratégiques. Leur maîtrise naturelle des

Morpho bouscule la French Tech et devient une licorne atypique

29 mai 2026

Une jeune pousse spécialisée dans la finance décentralisée vient de franchir le cap symbolique du milliard de dollars de valorisation. Contrairement au parcours classique des

Les dysfonctionnements du support technique freinent considérablement l’efficacité des équipes en entreprise

27 mai 2026

Une étude récente menée pour le compte d’Atera révèle l’impact financier majeur des lenteurs du support informatique. Entre perte de temps technique et baisse de

Les derniers classements LMArena confirment la régression de GPT-5 face à Claude et Gemini

Table des matières

Le classement général des modèles d’IA en octobre 2025

Les performances des modèles selon les domaines d’expertise

Retrouvez ici les dernières actualités

La génération Z révolutionne les codes de la communication moderne

Morpho bouscule la French Tech et devient une licorne atypique

Les dysfonctionnements du support technique freinent considérablement l’efficacité des équipes en entreprise

Simulation tjm

Salaire brut net

Outils

Retrouvez-nous