Bienvenue

Bienvenue à l’Observatoire de linguistique Sens-Texte

L’approche adoptée par l’Observatoire de linguistique Sens-Texte (OLST) pour appréhender le lexique (général et spécialisé) est originale à plus d’un titre et vise à intégrer trois objectifs.

  • Mener une réflexion théorique nécessaire à la description de cet objet complexe que constitue le lexique.
  • Développer et diffuser des ressources monolingues et multilingues (des bases de données lexicales et terminologiques, des corpus de textes).
  • Mettre au point des stratégies assurant un transfert de ses travaux vers des applications (en enseignement, notamment).

La programmation de recherche s’articule autour de plusieurs axes principaux et vise à fournir des regards différents sur le lexique, correspondant aux différents domaines couverts par les membres de l’équipe.

Lexicologie et lexicographie

Lexicologie et lexicographie

Il s’agit de l’axe « théorique » unificateur, autour duquel gravitent la plupart des projets en cours et à venir de l’équipe. En s’appuyant sur les acquis de projets de lexicologie et lexicographie antérieurs, quatre thèmes de recherche sont privilégiés : 1) méthodologie lexicographique et terminographique, 2) structure de graphes des lexiques informatisés, 3) perspective multilingue (français, anglais, coréen, espagnol et mandarin), 4) rôle du lexique dans l’interface sémantique-syntaxe.

Le Framed DiCoEnviro

Terminographie

Trois thèmes ont une importance particulière pour l’avancement de nos travaux en ce domaine et, de façon plus générale, pour la recherche en terminologie et terminographie : 1) modélisation des liens sémantiques entre termes, 2) connexion entre lexiques de spécialités et lexiques généraux, 3) terminographie multilingue.

Traitement des corpus

Cet axe concerne l’accès aux données linguistiques; il alimente donc la plupart de nos travaux de recherche. Nous privilégions les trois thèmes suivants : 1) structuration automatique et semi-automatique des données terminologiques, 2) annotation formelle des corpus, 3) identification et description du lexique transdisciplinaire.

Didactiques des langues

Les recherches et collaborations antérieures dans ce domaine se développent autour d’au moins trois thèmes : 1) enseignement et apprentissage des connaissances lexicales à base de modèles lexicaux riches, 2) conception et validation d’activités d’apprentissage des connaissances lexicales, 3) outils didactiques fondés sur les modèles lexicaux pour l’enseignement du lexique.

Applications documentaires

Les ressources documentaires au sens large peuvent inclure aussi bien des documents textuels que des ressources visuelles, audio, ou audio-visuelles. Pour les documents textuels en format numérique, le traitement automatique de la langue (TAL) et les techniques de fouille de documents (text mining) sont des outils précieux pour exploiter le contenu des documents.

L’application documentaire du TAL est donc en forte croissance depuis le début des années 1990, avec l’avènement et la démocratisation du web.
Cet axe de recherche à l’OLST vise deux objectifs :

  1. développer des outils et des ressources pour exploiter de manière plus efficace le contenu linguistique des ressources documentaires
  2. exploiter des technologies existantes à des fins d’exploration ou de gestion de ressources documentaires

Pour les autres types de données (visuelles, etc.) le traitement linguistique peut quand même s’avérer intéressant lorsqu’il est appliqué aux métadonnées associées à ces ressources. Ces types de documents sont donc parfois le sujet des projets de recherche des membres.

Depuis 2003-2004, l’équipe met un accent particulier sur la diffusion libre des ressources mises au point par l’équipe. Ces ressources sont de différentes natures : 1) ressources lexicales renfermant des descriptions formelles complètes portant sur le lexique général et certains lexiques spécialisés (ex. informatique, environnement); 2) des corpus de nature générale et spécialisés ainsi que différents outils permettant de les exploiter (ex. extracteurs de terminologie, concordanciers); 3) ressources didactiques  et modules d’interrogation permettant d’exploiter les systèmes lexicaux généraux et spécialisés formels mis au point par l’équipe de manière conviviale.

L’Observatoire de linguistique Sens-Texte (OLST) a été créé en 1997 au Département de linguistique et de traduction de l’Université de Montréal. Il a été dirigé par Igor Mel’čuk puis par Alain Polguère. Son directeur actuel est François Lareau. Les travaux menés à l’OLST relèvent de trois disciplines langagières souvent pratiquées de façon autonome : la linguistique, la terminologie et la didactique. L’OLST présente l’originalité de regrouper trois catégories de chercheurs qu’unit un même intérêt pour la modélisation formelle des phénomènes linguistiques. Sans se situer tous dans le strict cadre notionnel de théorie linguistique Sens-Texte (qui a donné son nom au groupe de recherche), les travaux menés à l’OLST gravitent autour d’une même approche générale, d’une façon à la fois souple (évolution des fondements théoriques et méthodologiques) et cohérente (convergence au niveau des buts de recherche et de la vision générale de la langue).

Entre 2004 et 2008, l’OLST a bénéficié d’une subvention d’équipe octroyée par le Fonds de recherche sur la société et la culture du Québec (FQRSC). La subvention a été renouvelée pour deux périodes additionnelles de quatre ans (2008-2012 et 2013-2017).