Déplacez-vous, Siri! Des chercheurs développent un chatbot basé sur l’improvisation –

  • FrançaisFrançais



  • À quoi ressembleraient les conversations avec Alexa si elle était une habituée de The Second City?

    Jonathan May, responsable de la recherche à l’USC Information Sciences Institute (ISI) et professeur assistant de recherche en informatique à la Viterbi School of Engineering de l’USC, explore cette question avec Justin Cho, un analyste programmeur ISI et futur doctorat USC Viterbi. étudiant, dans le cadre de leur projet SPOLIN (Selected Pairs Of Learnable ImprovisatioN). Leur recherche intègre des dialogues d’improvisation dans des chatbots pour produire des interactions plus engageantes.

    La collection de recherche SPOLIN est composée de plus de 68 000 paires de dialogues en anglais, ou dialogues conversationnels d’une réponse rapide et ultérieure. Ces paires modélisent le oui et les dialogues, un principe fondamental de l’improvisation qui encourage des conversations plus fondées et plus pertinentes. Après avoir rassemblé les données, Cho et May ont construit SpolinBot, un agent d’improvisation programmé avec la première collection de oui et de recherche suffisamment grande pour former un chatbot.

    Le document de recherche du projet, «Grounding Conversations with Improvised Dialogues», a été présenté le 6 juillet à la conférence de l’Association of Computational Linguistics, tenue du 5 au 10 juillet.

    Trouver un terrain d’entente

    May cherchait de nouvelles idées de recherche dans son travail. Son amour pour l’analyse du langage l’avait conduit à travailler sur des projets de traitement du langage naturel (PNL), et il a commencé à rechercher des formes de données plus intéressantes avec lesquelles il pourrait travailler.

    «J’avais fait un peu d’improvisation à l’université et je me languissais pour ces jours-là», dit-il. «Puis un ami qui faisait partie de ma troupe d’improvisation universitaire a suggéré qu’il serait pratique d’avoir un robot« oui et »avec lequel pratiquer, et cela m’a inspiré – ce ne serait pas simplement amusant de créer un robot qui peut improviser, ce serait pratique! “

    Plus May explorait cette idée en profondeur, plus il la trouvait valable. Oui – et c’est un pilier de l’improvisation qui incite un participant à accepter la réalité qu’un autre participant dit («oui») et ensuite à construire sur cette réalité en fournissant des informations supplémentaires («et»). Cette technique est essentielle pour établir un terrain d’entente dans l’interaction. Comme l’a dit May, “Oui – et c’est la façon dont la communauté d’improvisation dit” ancrage “.”

    Les oui et les oui sont importants car ils aident les participants à construire une réalité ensemble. Dans les scripts de films, par exemple, peut-être 10 à 11% des lignes peuvent être considérées comme oui-et, alors que dans l’improvisation, au moins 25% des lignes sont oui-et. En effet, contrairement aux films, qui ont des décors et des personnages déjà établis pour le public, les improvisateurs agissent sans scène, sans accessoires ou sans réalité objective.

    «Parce que les scènes d’improvisation sont construites à partir de presque aucune réalité établie, le dialogue qui a lieu dans l’improvisation tente activement d’atteindre des hypothèses et une compréhension mutuelles», a déclaré Cho. “Cela rend le dialogue dans l’improvisation plus intéressant que la plupart des dialogues ordinaires, qui ont généralement lieu avec de nombreuses hypothèses déjà en place (du bon sens, des signaux visuels, etc.).”

    Mais trouver une source pour extraire le dialogue d’improvisation était un défi. Au départ, May et Cho ont examiné des ensembles de dialogues typiques tels que des scripts de films et des collections de sous-titres, mais ces sources ne contenaient pas assez de oui-et à mien. De plus, il peut être difficile de trouver des improvisations enregistrées, et encore moins transcrites.

    Le robot d’impro de quartier convivial

    Avant de rendre visite à l’USC en tant qu’étudiant d’échange à l’automne 2018, Cho a contacté May pour s’enquérir des projets de recherche en PNL auxquels il pourrait participer.

    «J’étais intéressé par la façon dont cela touchait à un créneau que je ne connaissais pas, et j’étais particulièrement intrigué par le fait qu’il y avait peu ou pas de travail préalable dans ce domaine», a déclaré Cho. «J’étais accro quand Jon a dit que notre projet répondrait à une question qui n’a même pas encore été posée: la question de savoir comment la modélisation de l’improvisation à travers le oui et l’acte peut contribuer à améliorer les systèmes de dialogue.

    Cho a étudié plusieurs approches pour collecter des données d’improvisation. Il est finalement tombé sur Spontaneanation, un podcast d’improvisation animé par l’acteur et comédien prolifique Paul F.Tompkins qui s’est déroulé de 2015 à 2019.

    Avec ses épisodes à thème ouvert, environ 30 bonnes minutes d’improvisation continue, des enregistrements de haute qualité et une taille substantielle, Spontaneanation était la source idéale pour extraire des oui-et -s pour le projet. Le duo a introduit ses données Spontaneanation dans un programme et SpolinBot est né.

    “L’une des parties intéressantes du projet est que nous avons trouvé un moyen d’utiliser simplement l’improvisation”, a expliqué May. “Spontaneanation était une excellente ressource pour nous, mais elle est assez petite pour les ensembles de données; nous n’avons obtenu qu’environ 10 000 oui-ets. Mais nous avons utilisé ces oui-et pour créer un classificateur (programme) qui peut examiner de nouvelles lignes de dialogue et déterminer s’ils sont oui et oui. »

    Travailler avec des dialogues d’improvisation a d’abord aidé les chercheurs à trouver des oui-et d’autres sources, car la plupart des données SPOLIN proviennent de scripts et de sous-titres de films. “En fin de compte, le corpus SPOLIN contient plus de cinq fois plus de oui-et de sources non-improvisées que d’improvisation, mais nous n’avons pu obtenir ces oui-et qu’en commençant par l’improvisation”, a déclaré May.

    SpolinBot dispose de quelques contrôles qui peuvent affiner ses réponses, les faisant passer de sûres et ennuyeuses à drôles et farfelues, et génère également cinq options de réponse parmi lesquelles les utilisateurs peuvent choisir pour poursuivre la conversation.

    SpolinBot #Goals

    Le duo a beaucoup de projets pour SpolinBot, ainsi que d’étendre ses capacités de conversation au-delà des oui-ets. “Nous voulons explorer d’autres facteurs qui rendent l’improvisation intéressante, comme la construction de personnages, la construction de scènes, ‘si cela (généralement une anomalie intéressante) est vrai, qu’est-ce qui est également vrai?’ Et les rappels (faisant référence aux objets / événements mentionnés dans les tours de dialogue précédents) », a déclaré Cho. “Nous avons un long chemin à parcourir, et cela me rend plus enthousiaste pour ce que je peux explorer tout au long de mon doctorat et au-delà.”

    May a fait écho aux sentiments de Cho. “En fin de compte, nous voulons construire un bon partenaire de conversation et un bon partenaire créatif”, a-t-il déclaré, notant que même dans l’improvisation, oui et ne marquent que le début d’une conversation. «Les bots d’aujourd’hui, y compris SpolinBot, ne sont pas très bons pour maintenir le fil de la conversation. Il devrait y avoir un sentiment que les deux participants ne se contentent pas d’établir une réalité, mais font également l’expérience de cette réalité ensemble.

    Ce dernier point est essentiel, car, comme l’a expliqué May, un bon partenaire devrait être un égal, non subordonné à la manière d’Alexa et de Siri. «J’aimerais que mon partenaire prenne des décisions et réfléchisse avec moi», a-t-il déclaré. «Nous devrions en fin de compte être en mesure de récolter les avantages du travail d’équipe et de la coopération dont les humains ont longtemps bénéficié en travaillant ensemble. Et le partenaire virtuel a l’avantage supplémentaire d’être bien meilleur et plus rapide en mathématiques que moi, et de ne pas avoir besoin de manger! “

    Source

    N'oubliez pas de voter pour cet article !
    1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
    Loading...

    Laisser un commentaire

    Votre adresse de messagerie ne sera pas publiée.