La nouvelle version du « Voice Mode » de ChatGPT permet de reproduire de façon bluffante des discussions entre humains.
Les chercheurs continuent de faire avancer l’intelligence artificielle à pas de géant. OpenAI a ainsi présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs.
Grâce à un nouveau modèle, GPT-4o (« o » pour « omni »), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l’écrit, par la voix ou en générant des images.
Des fonctionnalités même pour les utilisateurs gratuits
Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d’abord le texte et l’image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d’usage. La nouvelle version du « Voice Mode » (mode vocal) doit arriver dans les prochaines semaines pour les abonnés. Elle permet de reproduire de façon bluffante des discussions entre humains.
Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d’un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l’interrompre.
« Tu as l’air joyeux. (…) Tu veux me dire quelle est la source de toute cette bonne humeur ? », a ainsi demandé la machine à un ingénieur d’OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est « utile et fabuleuse ». « Oh arrête, tu me fais rougir », s’est-elle exclamée en retour.
Sam Altman encense le film Her
Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l’IA générative, une révolution qui a pris de court tous les géants technologiques. Depuis, toute la Silicon Valley s’est lancée dans une course aux outils et assistants d’IA toujours plus performants. Google doit d’ailleurs présenter ses dernières innovations ce mardi, tandis que Microsoft, principal investisseur d’OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.
Dans le passé, Sam Altman, le patron d’OpenAI, avait confié adorer le film de science-fiction Her, où un homme tombe amoureux d’une IA, en conversant à l’oral avec elle. « C’était incroyablement prophétique », avait-il déclaré en septembre dernier. « Et cela nous a inspirés à plus d’un titre, (…) notamment l’idée que nous ayons tous un agent personnalisé qui essaie de nous aider. »
ChatGPT est toutefois encore loin des agents d’IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a d’ores et déjà impressionné, ou inquiété, les experts du secteur.