Liens d’équivalence dans les ressources terminologiques multilingues

Responsables: Marie-Claude L’Homme et Guy Lapalme (RALI)

Ce projet est financé par le Conseil de recherches en sciences humaines (CRSH).

Sauf exception, les ressources terminologiques (dictionnaires spécialisés et banques de terminologie) accordent peu de place à la description du fonctionnement linguistique des termes. Ce constat s’applique aussi bien aux ressources terminologiques monolingues qu’aux ressources bilingues et multilingues. Ce projet contribue à une réflexion nécessaire à la mise au point de ressources terminologiques multilingues tenant compte des propriétés linguistiques des termes, notamment, des propriétés syntaxico-sémantiques. Plus spécifiquement, nous nous penchons sur les liens d’équivalence interlinguistique partagés par les termes de nature prédicative (verbes, adjectifs et noms prédicatifs), qui sont moins bien décrits par la terminologie. La terminologie s’étant jusqu’ici surtout intéressée aux termes dénotant des entités (ordinateur, données, ozone, etc.), elle fait l’impasse sur les termes prédicatifs (réchauffement, configurer, compatible) dont la caractéristique est de faire appel à des arguments (réchauffement de X, X configure Y, X est compatible avec Y). Notre travail s’appuie sur le modèle des Frame sémantiques, FS (Fillmore 1977, 1982; Fillmore and Atkins 1992) et s’inspire de la méthodologie visant à appliquer les FS dans la ressource FrameNet (Atkins et al. 2003; Fillmore 2003a; Ruppenhofer et al. 2006). La méthode « FrameNet » comprend une annotation contextuelle préalable des propriétés syntaxico-sémantiques des unités lexicales. Notre projet comporte également des objectifs appliqués. Il mettra à l’épreuve une méthodologie d’analyse manuelle que nous avons élaborée pour le français en l’étendant à d’autres langues, notamment à l’anglais et à l’espagnol. Par ailleurs, nous adapterons les stratégies informatiques que nous avons conçues et qui offrent de bons résultats mais qui restent pour l’instant confinées au français. L’extension à de nouvelles langues entraînera des modifications importantes dans la manière d’aborder le problème de leur traitement automatique. Nous devrons adapter les méthodes au traitement de corpus de langues différentes ou, mieux encore, nous les rendrons non dépendantes d’une langue spécifique (cela devient possible avec des méthodes d’apprentissage).