Vient de paraître : Le traitement des locutions en génération automatique de texte multilingue. (Mémoire de maîtrise)

Dubé, Michaelle (2021) Le traitement des locutions en génération automatique de texte multilingue.
Département de linguistique et de traduction, Université de Montréal. [PDF (2,6Mo)].

La locution est peu étudiée en génération automatique de texte (GAT). Syntaxiquement, elle forme un syntagme, alors que sémantiquement, elle ne constitue qu’une seule unité. Le présent mémoire propose un traitement des locutions en GAT multilingue qui permet d’isoler les constituants de la locution tout en conservant le sens global de celle-ci. Pour ce faire, nous avons élaboré une solution flexible à base de patrons universels d’arbres de dépendances syntaxiques vers lesquels pointent des patrons de locutions propres au français (Pausé, 2017). Notre traitement a été effectué dans le réalisateur de texte profond multilingue GenDR à l’aide des données du Réseau lexical du français (RL-fr). Ce travail a abouti à la création de 36 règles de lexicalisation par patron (indépendantes de la langue) et à un dictionnaire lexical pour les locutions du français. Notre implémentation couvre 2 846 locutions du RL-fr (soit 97,5 %), avec une précision de 97,7 %.

Mots-clés : locution, expression polylexicale, génération automatique de texte, lexicalisation, théorie Sens-Texte, réalisation linguistique.

Comments are closed.