ChatGPT V4 dépasse la barre, SAT et peut identifier les exploits dans les contrats ETH

GPT-4, la dernière version du chatbot d’intelligence artificielle (IA), ChatGPT, peut réussir les tests du lycée et les examens de la faculté de droit avec des scores classés dans le 90e centile et dispose de nouvelles capacités de traitement qui n’étaient pas possibles avec la version précédente.
Les chiffres des résultats des tests du GPT-4 étaient partagé le 14 mars par son créateur OpenAI révélant qu’il peut également convertir des entrées d’image, audio et vidéo en texte en plus de gérer des “instructions beaucoup plus nuancées” de manière plus créative et fiable.
“Il réussit un examen du barreau simulé avec un score autour des 10% des meilleurs candidats”, a ajouté OpenAI. “En revanche, le score de GPT-3.5 se situait autour des 10 % inférieurs.”
Les chiffres montrent que GPT-4 a obtenu un score de 163 dans le 88e centile à l’examen LSAT – le test que les étudiants doivent réussir aux États-Unis pour être admis à la faculté de droit.

Le score de GPT4 le placerait en bonne position pour être admis dans l’une des 20 meilleures facultés de droit et n’est qu’à quelques points du signalé scores nécessaires pour être accepté dans des écoles prestigieuses telles que Harvard, Stanford, Princeton ou Yale.
La version précédente de ChatGPT n’a marqué que 149 sur le LSAT, ce qui la place dans les 40% inférieurs.
GPT-4 a également obtenu 298 sur 400 à l’examen uniforme du barreau – un test entrepris par des étudiants en droit récemment diplômés leur permettant d’exercer en tant qu’avocat dans n’importe quelle juridiction américaine.

L’ancienne version de ChatGPT a connu des difficultés lors de ce test, terminant dans les 10 % inférieurs avec un score de 213 sur 400.
En ce qui concerne les examens SAT Evidence-Based Reading & Writing et SAT Math passés par les lycéens américains pour mesurer leur préparation à l’université, GPT-4 a obtenu respectivement un score de 93e et 89e centile.
Le GPT-4 a également excellé dans les sciences «dures», affichant des scores centiles bien supérieurs à la moyenne en biologie AP (85-100%), chimie (71-88%) et physique 2 (66-84%).

Cependant, son score AP Calculus était assez moyen, se classant entre le 43e et le 59e centile.
Un autre domaine où GPT-4 manquait était les examens de littérature anglaise, affichant des scores entre le 8e et le 44e centile dans deux tests distincts.
OpenAI a déclaré que GPT-4 et GPT-3.5 ont passé ces tests lors des examens pratiques de 2022-2023, et qu'”aucune formation spécifique” n’a été suivie par les outils de traitement du langage :
« Nous n’avons pas suivi de formation spécifique pour ces examens. Une minorité des problèmes lors des examens ont été constatés par le modèle pendant la formation, mais nous pensons que les résultats sont représentatifs. »
Les résultats ont également suscité la peur dans la communauté Twitter.
En rapport: Comment ChatGPT affectera-t-il l’espace Web3 ? Réponses de l’industrie
Nick Almond, le fondateur de FactoryDAO dit ses 14 300 abonnés sur Twitter le 14 mars que GPT4 va « effrayer les gens » et qu’il « effondrera » le système éducatif mondial.
La théorie de l’évaluation a occupé une place importante dans ma vie pendant plusieurs années. Je tapais sur ce jour à venir il y a de nombreuses années. Je ressemblais littéralement à la manivelle résidente à l’époque.
Mais… cela signifie vraiment que tout sauf l’évaluation surveillée est terminée à partir de ce moment.
— Drnick ️² (@DrNickA) 14 mars 2023
L’ancien directeur de Coinbase, Conor Grogan, a déclaré avoir inséré un contrat intelligent Ethereum en direct dans GPT-4 et a instantanément signalé plusieurs « vulnérabilités de sécurité » et expliqué comment le code peut être exploité :
J’ai déposé un contrat Ethereum en direct dans GPT-4.
En un instant, il a mis en évidence un certain nombre de vulnérabilités de sécurité et a indiqué les zones de surface où le contrat pourrait être exploité. Il a ensuite vérifié une manière spécifique dont je pouvais exploiter le contrat pic.twitter.com/its5puakUW
– Conor (@jconorgrogan) 14 mars 2023
Des audits de contrats intelligents antérieurs sur ChatGPT ont révélé que sa première version était également capable de détecter les bogues de code dans une mesure raisonnable.
Rowan Cheung, le fondateur de la newsletter AI “The Rundown”, a partagé une vidéo de GPT transcrivant un faux site Web dessiné à la main sur un morceau de papier en code.
Je viens de regarder GPT-4 transformer un croquis dessiné à la main en un site Web fonctionnel.
C’est insensé. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) 14 mars 2023