L'IA Mythos d'Anthropic résout 30 % des problèmes déconcertants pour les experts humains

Une avancée majeure dans le domaine de l'IA

Claude, le créateur d'une série de modèles d'intelligence artificielle, a récemment évalué les capacités de ses systèmes, parmi lesquels Claude Mythos et Claude Opus, en bio-informatique. Les résultats de cette étude, présentée par Anthropic, sont remarquables : Mythos a démontré sa capacité à résoudre des problèmes complexes que même des experts humains ont peinés à aborder.

Des résultats impressionnants dans la bio-informatique

Dans le cadre de cette étude, une nouvelle référence a été établie sous le nom de BioMysteryBench, qui se compose de 99 questions complexes liées à la bio-informatique. Cette discipline applique des méthodes informatiques, mathématiques et statistiques à des problématiques biologiques. Parmi les questions posées, certaines étaient si difficiles qu'elles semblaient insolubles, bien que les réponses puissent être vérifiées une fois trouvées.

Galerie

Qu’est-ce qu’une IA malveillante : risques, cas concrets et défense

Un exemple de question posée était : “De quelle espèce virale le patient humain est-il infecté, d'après les données de séquençage d'ARN (RNA-seq) ?” Ici, l'IA se voit confier la tâche de résoudre un problème à partir de données et d'outils complexes, alors que la réponse correcte peut être facilement vérifiée avec un test PCR.

Performances comparatives des modèles d'IA

Sur les 99 questions, un panel d'experts a réussi à fournir des réponses à 73 d'entre elles. En comparaison, Claude Mythos a résolu 82,6 % des problèmes qui pouvaient être abordés par des humains. Pour son prédécesseur, Claude Opus 4.7, ce taux était de 78,9 %.

Article lié Optimisez Votre Espace de Travail avec les Meilleures Imprimantes Laser et de Bureau Canon

Ce qui est encore plus frappant, c'est que Mythos a également réussi à répondre à certaines des 23 questions qui avaient laissé les experts perplexes. Son taux de réussite s'élevait à 29,6 %, tandis que Claude Opus 4.7 obtenait un score de 27 %.

Les implications de ces découvertes

Anthropic a examiné les performances de Claude Opus 4.6, qui avait également résolu des problèmes jugés insolubles par les experts. Selon les chercheurs, cet écart de performance peut s'expliquer par la vaste base de connaissances intégrée dans Claude Mythos, qui contient des données sur la biologie structurale, les profils moléculaires et des méta-analyses issues de centaines de milliers d'articles.

Les experts humains, quant à eux, devaient souvent effectuer des méta-analyses ou combiner plusieurs bases de données pour obtenir des résultats similaires. Mythos, en revanche, a également développé de nouvelles techniques pour résoudre des problèmes, offrant ainsi des pistes d'inspiration pour les scientifiques.

Une approche innovante pour la résolution de problèmes

Lorsque Claude Mythos n'est pas certain d'une réponse, il combine plusieurs méthodes et fusionne les éléments de preuve de ces approches pour parvenir à une conclusion. Cela représente une avancée significative dans la manière dont l'IA peut contribuer à des domaines variés, y compris la recherche scientifique.

Article lié MacBook Air, études et jeune vie pro : pourquoi le dock devient l’accessoire qui change vraiment le bureau

Les défis de la cybersécurité

Actuellement, la sortie de Claude Mythos est limitée (sauf pour quelques organisations) en raison des préoccupations liées à la cybersécurité. Ses compétences pourraient potentiellement être exploitées par des individus malveillants pour identifier de nouvelles vulnérabilités et les exploiter, plutôt que de les signaler.

Pour illustrer ce point, il convient de mentionner qu'en utilisant Mythos, Mozilla a pu déceler 271 failles de sécurité sur Firefox, qu'il a ensuite corrigées dans une mise à jour du navigateur.

Vers de nouvelles découvertes scientifiques

Cependant, cette étude met également en lumière les capacités de Mythos dans d'autres domaines et son potentiel à contribuer positivement à l'humanité, à condition que les risques en matière de cybersécurité soient maîtrisés. Anthropic a déjà démontré les compétences de Mythos en codage, en raisonnement et en raisonnement visuel, lors du lancement du modèle Opus 4.7.

Le laboratoire a pour objectif de rendre Claude Mythos ou un modèle équivalent accessible au public une fois que les risques liés à la cybersécurité auront été atténués. Les mesures de sécurité envisagées pour Claude Mythos sont actuellement testées sur Claude Opus 4.7.

Article lié La Science Climatique : Un Consensus Fondé sur des Faits, Pas sur des Opinions

Conclusion

L'annonce de Claude Mythos a suscité un grand intérêt grâce à ses compétences en cybersécurité. Néanmoins, la récente étude d'Anthropic recentre le débat en soulignant que ce modèle d'intelligence artificielle pourrait avoir des applications très variées, y compris d'importantes découvertes scientifiques.

Pour ne rien manquer des actualités de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter : Abonnez-vous et recevez chaque matin un résumé de l'actualité tech.

popopidoux.fr

L'IA Mythos d'Anthropic résout 30 % des problèmes déconcertants pour les experts humains

Une avancée majeure dans le domaine de l'IA

Des résultats impressionnants dans la bio-informatique

Galerie

Performances comparatives des modèles d'IA

Les implications de ces découvertes

Une approche innovante pour la résolution de problèmes

Les défis de la cybersécurité

Vers de nouvelles découvertes scientifiques

Conclusion

Vous aimerez aussi

Optimisez Votre Espace de Travail avec les Meilleures Imprimantes Laser et de Bureau Canon

MacBook Air, études et jeune vie pro : pourquoi le dock devient l’accessoire qui change vraiment le bureau

La Science Climatique : Un Consensus Fondé sur des Faits, Pas sur des Opinions

Des scientifiques découvrent une molécule mystérieuse sur Pluton et la lune Titan de Saturne : 'Nous ne pouvons pas dire ce que c'est'