Axe 5

Analyse sémantique computationnelle (resp. A. Nazarenko, LIPN Paris 13)

Dans le champ de la linguistique computationnelle, l’axe 5 met l’accent sur l’analyse sémantique et son application dans divers outils d’accès au contenu (ex. extraction d‘information, indexation, résumé), qui peuvent reposer sur des représentations sémantiques différentes. Des modèles, des méthodes et calculs et – dans certains cas – des outils ont été proposés pour décrire et modéliser différents phénomènes sémantiques mais ces phénomènes ont généralement été considérés isolément et avec des modèles de calculs hétérogènes. Le défi consiste à évaluer ces différents modèles sémantiques, à les opérationnaliser et à les intégrer pour produire des analyses sémantiques riches, couvrantes et cohérents, de la même manière que l’on a pu produire des analyseurs syntaxiques à la fois robuste et de bonne qualité.

L’objectif est d’intensifier la recherche sur l’intégration des modèles et méthodes sémantiques par la collaboration de différentes équipes de linguistique computationnelle (Alpage, Lattice, LIPN, LPP-P3) et la confrontation de leurs résultats hétérogènes sur l’analyse syntaxique, l’analyse textuelle, l’analyse et le traitement de corpus, le raisonnement inférentiel basé sur les textes, l’acquisition de connaissances à partir de textes, l’apprentissage automatique et les outils d’accès aux contenus textuels.

L’axe 5 met l’accent sur l’analyse du français mais une attention particulière est portée à l’identification de méthodes indépendantes de la langue qui permettent d’analyser une large palettes de langues pour lesquelles des ressources sont disponibles. C’est en effet une approche prometteuse pour équiper des langues peu outillées qui sont utilisées dans les axes 2 et 3.

L’axe s’intéresse à la langue écrite et orale. Les besoins d’analyse de la langue parlée augmentent et l’un des défis à relever consiste à intégrer dans l’analyse sémantique des traits de l’oral comme les dysfluences pour compenser la faiblesse de la qualité des résultats obtenus sur des transcriptions de l’oral.

L’axe comporte 6 sous-axes :

·       Perspective historique et réflexive (HP)

·       Analyses spécifiques sur les traitements sémantiques (SSP)

·       Méthodes d’acquisition de connaissances (KA)

·       Apprentissage semi-supervisé (SSL)

·       Approches intégratives (IA)

·       Applications: vers un accès enrichi aux contenus textuels (APP)

Listes des opérations de recherche en cours :

Perspective historique et réflexive (HP)

  • Théories du sens et TAL (HP1, resp. J. Léon)

Analyses spécifiques sur les traitements sémantiques (SSP)

  • Traits spécifiques à l’oral pour le traitement sémantique (SSP2, resp. M. Adda-Decker)
  • Filtrage des emplois non discursifs des connecteurs (SSP3, resp. L. Danlos)
  • Annotation syntaxique profonde (SSP4, resp. M. Candito)

Méthodes d’acquisition de connaissances (KA)

  • Induction automatique de patrons lexico-grammaticaux représentatifs à partir de textes (KA2, resp. T. Poibeau)
  • Acquisition de connaissances de domaine à partir de textes (KA3, resp. A. Nazarenko)

Apprentissage semi-supervisé (SSL)

  • Apport de l’analyse syntaxique à l’extraction d’information : adaptation au domaine et apprentissage multi-objectif (SSL3, resp. J. Le Roux)

Approches intégratives (IA)

  • Plateforme d’annotation (IA1)

Applications: vers un accès enrichi aux contenus textuels (APP)

  • Conception et développement de nouvelles méthodes d'accès au contenu textuel (APP2, resp. H. Zargayouna)