Benjamin Piwowarski - Représentations continues pour l'Accès à l'Information
Benjamin Piwowarski, LIP6 (Sorbonne Université), le vendredi 11 juin 2021
Le diaporama est disponible ici.
Résumé:
Le domaine de l'accès à l'information correspond aux modèles et technologies permettant aux utilisateurs d'interagir avec des systèmes automatiques afin de trouver l'information qu'ils recherchent. Les applications sont la recherche de documents/site web, le résumé automatique, l'extraction d'information et bien d'autres. Ces dernières années, porté par les succès des réseaux de neurones artificiels, le domaine à l'accès à l'information a connu une révolution dans ses techniques.
L'exposé abordera tout d'abord l'évolution de la représentation dans ce domaine (représentations continues), avant d'aborder la façon dont les réseaux de neurones l'exploitent - en particulier les réseaux dits de convolution, récurrents et plus récemment les réseaux basés sur l'utilisation de mémoires (et en particulier les "Transformers"). J'illustrerai avec des applications concrètes (recherche d'information, extraction d'information et génération de texte pour le résumé) ces avancées.
Bio
Benjamin Piwowarski est un chargé de recherche CNRS au LIP6 (Sorbonne Université). Son domaine de recherche est celui de l'accès à l'information, traitement automatique du langage naturel et de l'apprentissage statistique appliqué, en particulier l’apprentissage de représentations. Il a travaillé sur la recherche d'information XML (thèse 1999-2003), sur les bases de données XML (post-doctorat 2004-06 à l'université du Chili), sur l'analyse des interactions entre un utilisateur et un moteur de recherche (Yahoo! 2006-08) et sur l'application du formalisme mathématique de la physique quantique aux modèles d'accès à l'information (2008-11). Ses intérêts actuels portent sur (l’apprentissage de) représentation de données textuelles/sociales pour l'accès à l'information, et en particulier les applications à la représentation des mots ancrée dans le réel (grounding), le résumé automatique, l'extraction d'information et la recommandation.