All articles

Je n’ai pas envie de discuter avec des machines à café

Amrltqt
··3 min read
Je n’ai pas envie de discuter avec des machines à café

Est-ce que dans 4 ans, on continuera à écrire "stp" à ChatGPT et on attendra tranquillement la réponse devant notre écran?


Je n'ai pas envie de discuter avec des machines à café

Est-ce que dans 4 ans, on continuera à écrire "stp" à ChatGPT et attendre la fin du petit effet streaming du contenu pour avoir nos réponses? Est-ce qu'on aura dépassé cette phase de hype autour des modèles de langages qui lâchent leur prose au compte goutte alors qu'on attend tranquillement devant notre PC ?

Dans 4 ans, j'espère qu'on pourra simplement demander un "café fort" en entrant dans la cuisine, sans avoir à formuler une commande détaillée pour que la machine démarre la préparation. Donner des ordres à ma machine à café en parlant tout haut me conviendrait bien.

Demander des choses en parlant, ça marche. L'humanité a utilisé le langage pour transmettre des ordres pendant des millénaires. Pour commander les machines, nous utilisons des langages de programmation, pratiques et formels, mais pas accessibles à tous. La solution la plus simple serait de programmer les machines pour comprendre notre langue. C'est là que les modèles de langage offrent une opportunité incroyable.

Pour une machine à café, par exemple, il faudrait qu'elle capte tout ce qu'on dit dans la pièce, comprenne qu'un ordre lui est destiné et l'exécute. Siri, Alexa et Google Assistant ont tenté cette approche, mais les avancées récentes d'OpenAI et Google montrent des progrès bien plus prometteurs.

C'est tout à fait possible que dans 4 ans, des produits qui embarquent peu de technologie aujourd'hui soient équipés de capacités à comprendre le langage naturel pour extraire les ordres pertinents.

Ca me paraît impossible pour une machine de traiter un flux audio en continu pour en extraire l'ordre à réaliser. La réalité d'un environnement aussi complexe qu'une cuisine dépasse le simple décodage du langage humain

Pour réaliser cet exploit, la machine devra certainement :

  • Identifier une personne dans la cuisine (ou dans un périmètre acceptable)
  • Capter et analyser toutes les conversations de cette personne
  • Filtrer le contenu non pertinent pour ses actions possibles
  • Identifier et paramétrer l'ordre adressé
  • Vérifier que la personne donnant l'ordre a l'autorisation nécessaire
  • Et pourquoi pas, confirmer en utilisant elle-même le langage humain.

Il faudra une bonne compréhension du langage naturel. Merci aux modèles de langage. Mais surtout, il faudra beaucoup de code pour intégrer toutes ces fonctionnalités et tout la prise en compte du contexte nécessaire à l'exécution de l'ordre.

Nous ne nous contenterons certainement pas de parler aux machines et n'attendrons pas patiemment qu'elles nous répondent. Les interactions devront être immédiates et leurs réponses instantanées pour être efficaces. Aujourd'hui, les modèles de langage et leur capacité à générer du contenu en streaming sont impressionnants. Mais je parie que cette petite tendance disparaîtra aussi vite qu'elle est apparue.

Stay in the loop

Get new articles delivered directly to your inbox. No spam, unsubscribe anytime.