OpenAI a publié un nouveau modèle linguistique appelé o1-mini, plus fort en programmation

2024-09-12T03:00:00Z

OpenAI a publié un nouveau modèle linguistique appelé o1-mini, conçu pour être plus efficace et plus rapide que les modèles plus volumineux comme o1.

« o1-mini » excelle dans les domaines STEM[1], en particulier en mathématiques et en programmation, et offre des performances comparables à o1 sur des benchmarks tels que l’AIME et Codeforces.

1. Qu’est-ce qu’OpenAI o1-mini ?

OpenAI o1-mini est un modèle de langage performant et économique, spécialisé dans le raisonnement en sciences, technologie, ingénierie et mathématiques (STEM). Il excelle notamment en mathématiques et en programmation, rivalisant presque avec les performances d’OpenAI o1 sur des benchmarks d’évaluation tels qu’AIME et Codeforces.

2. En quoi o1-mini est-il différent des autres modèles de langage comme o1 ?

Contrairement aux grands modèles de langage pré-entraînés sur de vastes ensembles de données textuelles, o1-mini est optimisé pour le raisonnement STEM dès sa phase de pré-entraînement. Bien qu’il ne possède pas les mêmes connaissances générales qu’o1, il offre des performances comparables sur de nombreuses tâches de raisonnement, tout en étant beaucoup plus rentable.

3. Quelles sont les performances d’o1-mini en mathématiques et en programmation ?

o1-mini obtient un score de 70% au concours de mathématiques AIME, se classant parmi les 500 meilleurs lycéens américains. Sur Codeforces, il atteint un classement Elo de 1650, soit le 86ème percentile des programmeurs sur la plateforme.

4. Qu’en est-il des performances d’o1-mini dans d’autres domaines STEM ?

o1-mini surpasse GPT-4o sur certaines références académiques nécessitant un raisonnement, comme GPQA (sciences) et MATH-500.

5. Comment se compare o1-mini à GPT-4o en termes de vitesse ?

o1-mini est significativement plus rapide que GPT-4o pour les tâches de raisonnement. Par exemple, sur une question de raisonnement verbal, o1-mini a trouvé la bonne réponse 3 à 5 fois plus vite que GPT-4o.

o1-mini est un modèle linguistique puissant et rentable, optimisé pour le raisonnement STEM. Bien qu’il excelle dans ces domaines, il présente des limites en termes de connaissances factuelles non STEM et de performances dans les domaines axés sur le langage.

sources:
https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/
https://platform.openai.com/docs/guides/reasoning

  • J’utilise déjà l’IA pour la programmation
  • Je serais prêt à utiliser l’IA pour la programmation
  • Je souhaite tester cette nouvelle IA, o1-mini
0 votant

De quoi faire évoluer votre avis sur les IA en programmation? Nous en parlions:


  1. STEM (acronyme de science, technology, engineering, and mathematics), ou STIM (science, technologie, ingénierie et mathématiques) en français canadien, est un américanisme désignant quatre disciplines : science, technologie, ingénierie et mathématiques. ↩︎