Claude 3 : une nouvelle famille de modèles IA signée Anthropic

By indigo-auray

Sommaire

Anthropic lance Claude 3 : l’IA nouvelle génération

Anthropic, une entreprise spécialisée dans l’intelligence artificielle, vient de lancer Claude 3, une famille de trois modèles conçus pour répondre à un large éventail de tâches cognitives. Cette série comprend Haiku, optimisé pour la vitesse et la rentabilité, Sonnet, qui offre une approche équilibrée, et Opus, le modèle le plus intelligent de la gamme.

Opus et Sonnet sont d’ores et déjà accessibles dans 159 pays via la plateforme et l’API Claude, tandis que Haiku devrait les rejoindre prochainement. Les modèles Claude 3 excellent dans des domaines tels que le raisonnement, la compréhension de la lecture, les mathématiques, les sciences et la programmation, surpassant même leurs pairs, notamment GPT-4 et Gemini Ultra, sur la plupart des benchmarks d’évaluation courants.

Des modèles multimodaux et performants

La multimodalité est l’un des atouts majeurs des modèles Claude 3. Ils sont capables de traiter et d’interpréter une grande variété de formats visuels, tels que les photos, les graphiques, les diagrammes techniques et même les captures d’écran de code. Cette capacité les rend particulièrement adaptés à des applications nécessitant une analyse approfondie de documents complexes, comme les rapports financiers, les études scientifiques ou les brevets.

En termes de performances, les modèles Claude 3 se montrent à la hauteur des attentes. Ils obtiennent des résultats à la pointe de la technologie sur de nombreux benchmarks d’évaluation, tels que MMLU (Massive Multitask Language Understanding), GSM8K (Grade School Math 8K) pour les mathématiques de base, ainsi que sur des tâches de programmation, de raisonnement et de réponse à des questions de connaissances générales. Cette excellence dans des domaines variés témoigne de la polyvalence et de la robustesse des modèles développés par Anthropic.

Comment fonctionnent les trackers du sommeil et de la condition physique et en valent-ils la peine ?
A lire

Parmi les trois modèles de la famille Claude 3, Haiku se distingue par sa vitesse de traitement impressionnante. Capable d’analyser des articles de recherche denses comprenant jusqu’à 10 000 tokens en moins de trois secondes, il est particulièrement adapté aux applications nécessitant des réponses en temps réel, comme les chatbots et les systèmes de saisie semi-automatique. Cette rapidité d’exécution, combinée à ses performances de pointe, font de Haiku un choix de premier plan pour les entreprises souhaitant offrir une expérience utilisateur fluide et efficace.

Des améliorations significatives

Les nouveaux modèles Claude 3 ont considérablement réduit les refus inutiles grâce à une meilleure compréhension des invites complexes et des limitations de sécurité. Opus a notamment doublé sa précision par rapport à Claude 2 pour répondre à des questions complexes et ouvertes, diminuant ainsi le nombre de réponses incorrectes.

Initialement, les trois modèles offrent une fenêtre de contexte de 200 000 tokens, avec une expansion potentielle jusqu’à 1 million de tokens, ce qui les rend adaptés aux applications nécessitant un traitement de contexte long. Contrairement à la plupart des modèles de langage qui peinent à se rappeler les informations situées au milieu de longs contextes, Claude 3 Opus affiche une précision quasi parfaite, atteignant constamment plus de 99 % de rappel pour des documents allant jusqu’à 200 000 tokens.

Sora par OpenAI : l'IA vidéo bientôt accessible
A lire

Un concurrent sérieux pour GPT-4

Avec une date limite de connaissances fixée à août 2023, les modèles Claude 3 se positionnent comme de sérieux concurrents de GPT-4 en termes de performances. Bien que les tarifs de l’API soient légèrement plus élevés, avec Opus facturé à 15 $ par million de tokens en entrée et 75 $ par million de tokens en sortie, contre 10 $ et 30 $ respectivement pour GPT-4 Turbo (contexte de 128 000 tokens), Claude 3 offre des capacités supérieures et des résultats à la pointe de la technologie.

En somme, la famille de modèles Claude 3 d’Anthropic marque une avancée significative dans le domaine de l’IA, ouvrant la voie à de nouvelles applications et opportunités passionnantes.

Suivez nous sur Google News

google news