Dopé à l’IA, Siri, l’assistant personnel d’Apple, multiplie les nouvelles fonctionnalités. Les textes et les images générés par IA font également leur entrée dans iOS et MacOS, grâce à ChatGPT et aux programmes maison d’Apple.
Lundi 10 juin, durant sa conférence annuelle destinée aux développeurs (WWDC), Apple a annoncé d’ambitieuses fonctionnalités logicielles mues par l’intelligence artificielle (IA). Certaines seront ajoutées aux appareils de la marque à la pomme d’ici la fin de l’année, d’autres courant 2025. L’entreprise fait bien mieux que rattraper la concurrence en matière d’IA : les nouvelles fonctionnalités, regroupées sous les termes « Apple Intelligence », constituent l’une des avancées les plus franches que les logiciels iOS, iPadOS et MacOS aient connues. Mais elles seront réservées aux iPhone 15 Pro ainsi qu’aux ordinateurs et tablettes tournant avec les puces M1 au minimum, soit une petite partie seulement des appareils aujourd’hui en circulation.
Un Siri plus dégourdi
Si les évolutions de Siri sont à la hauteur des annonces d’Apple, il s’agira bien d’un « pas de géant » pour son assistant, pour reprendre les mots employés durant sa présentation. Plus besoin, pour commencer, de faire attention à employer la bonne formulation quand on s’adresse à l’assistant personnel d’Apple : Siri devrait mieux comprendre nos requêtes. Il devrait aussi être désormais capable de mener des recherches complexes à l’intérieur d’un iPhone, d’un iPad ou d’un MacBook, du type « montre-moi des photos de Stacy à New York avec un manteau rose ». Le Siri nouveau est en outre censé pouvoir piloter les applications d’un iPhone « avec des centaines de commandes différentes » : on pourra demander, par exemple, que les couleurs de la photo qu’on vient de retrouver soient vivifiées.
D’une seule commande orale, promet Apple, Siri résumera les notes prises au cours d’une réunion avant de les envoyer à un groupe de contacts par e-mail. Ou cherchera notre numéro de permis de conduire dans la galerie photo pour l’insérer dans un formulaire. Il devrait pouvoir jongler entre les applications : selon Apple, pour répondre à un ordre complexe comme « est-ce que je peux repousser ce rendez-vous d’une heure sans risque de rater le spectacle de danse de ma fille ? », Siri sera capable de retrouver l’heure du spectacle dans nos e-mails, puis de consulter notre agenda, et de s’informer sur l’état du trafic routier, avant d’apporter une réponse avisée. Enfin, pour les recherches d’informations sur Internet, Siri emploiera Chat GPT-4o, l’agent conversationnel d’OpenAI, sans surcoût.
Reste à savoir si cet assistant personnel aux ambitions renouvelées sera capable de mener à bien la grande majorité des tâches qu’on lui confiera, ou s’il échouera trop souvent pour qu’on lui fasse confiance. Dans l’esprit, le nouveau Siri paraît en tout cas beaucoup plus ambitieux que le nouvel assistant dont Google a dessiné les contours il y a quelques semaines durant sa propre conférence des développeurs.
Le Siri nouveau, en tout cas tel qu’il est voulu par Apple, a vocation à être davantage qu’un assistant vocal, mais un assistant tout court, capable de nous seconder en toutes circonstances. De fait, cette nouvelle version ne se pilotera plus seulement à la voix : il sera aussi possible de lui donner des consignes par écrit.
Des outils pour rédiger
Lorsqu’on rédigera une note, un e-mail, un texto, il sera possible sur les machines concernées de faire apparaître un outil d’aide à l’écriture pour réécrire le message dans un ton différent (amical, professionnel, concis) ou demander à ChatGPT de rédiger un brouillon depuis zéro, sur la base d’une consigne courte.
Les nouvelles fonctionnalités annoncées par Apple pourront également résumer les e-mails entrants, et y répondre de façon intelligente. Pour mieux préparer la réponse, des questions seront soumises à l’utilisateur, sous la forme d’un rapide QCM, qui serviront de base à l’écriture du message. Une des fonctionnalités les plus étonnantes : celle qui propose de n’afficher que le programme e-mails et notifications jugés prioritaires par le programme, et même de « réduire les interruptions » en ne laissant passer que les alertes importantes. Est-on prêt pour autant à prendre le risque de confier à une IA le pouvoir de bloquer, à tort, une alerte qui pourrait s’avérer importante ? Seul un test approfondi nous permettra d’en éprouver la fiabilité.
Des outils pour créer des images
Plusieurs outils mus par IA doivent permettre, sur les machines concernées, de générer des images entièrement inédites sur la base d’une simple consigne textuelle et d’y glisser le visage d’un proche – ou le sien. Ces visuels pourront ressembler à un dessin, à une image, ou à une image animée. Apple proposera aussi de créer des émojis entièrement personnalisés, afin d’illustrer un message pour lequel aucune émoticône existante ne s’impose naturellement. En outre, il sera possible, à partir de vidéos existantes, de créer un petit film en tapant une simple consigne : c’est le programme qui se chargera de monter les vidéos. Avec un talent qu’il est pour l’heure bien difficile de déterminer.
A noter : on pourra désormais enregistrer les appels vocaux sur iPhone et en obtenir une transcription automatique.
Un cadre pour la vie privée
Pour mener à bien ces tâches, l’appareil utilisera souvent ses propres programmes d’intelligence artificielle, tournant directement à l’intérieur de ses puces, afin de préserver la vie privée de ses usagers. Apple ne précise pas quel impact ces calculs auront sur l’autonomie de la batterie.
Pour certaines demandes en revanche, l’appareil devra se mettre en contact avec un centre de données Apple via une connexion Internet. Apple promet que seules les informations personnelles les plus strictement nécessaires seront envoyées à ces ordinateurs distants. Celles-ci ne devraient théoriquement être utilisées que pour traiter la demande, avant d’être immédiatement effacées. En clair : elles n’ont pas vocation à servir à entraîner les modèles d’Apple et d’OpenAI.
Des améliorations pour iOS et MacOS
Outre les annonces sur l’IA, Apple a annoncé des dizaines d’évolutions logicielles destinées à ses appareils. Deux parmi d’autres : le logiciel qui équipe les iPhone pourra désormais verrouiller une application, de telle façon qu’elle ne se débloque que lorsqu’on présente son visage au système FaceID ou qu’on saisit le mot de passe du mobile. Enfin, sur Mac, on pourra bientôt afficher l’écran de l’iPhone sur l’écran de l’ordinateur, et manipuler toutes ses applications à la souris. Pour, par exemple, glisser et déposer des fichiers de l’ordinateur vers le smartphone.