Présentation de L’INRIA – LORIA

Le Loria, Laboratoire lorrain de Recherche en Informatique et ses Applications est une Unité Mixte de Recherche (UMR 7503), commune à plusieurs établissements : le CNRS, l’Université de Lorraine et Inria. Le Loria a pour mission la recherche fondamentale et appliquée en sciences informatiques et ce, depuis sa création, en 1997.

MULTISPEECH est une équipe-projet commune de l’Université de Lorraine, d’Inria et du CNRS. Elle fait partie du département D4 « Traitement automatique des langues et des connaissances » du LORIA. Ses recherches concernent le traitement de la parole, avec une attention particulière pour les aspects multisources (séparation de sources, reconnaissance robuste de la parole), multilingues (apprentissage de langues étrangères) et multimodaux (synthèse audiovisuelle). Le programme de recherche est structuré selon 3 axes:

  • la modélisation explicite de la parole qui exploite sa dimension physique,
  • la modélisation statistique de la parole qui repose sur des techniques d’apprentissage automatique telles que les modèles bayésiens (HMM-GMM) et réseaux de neurones profonds (DNN),
  • la prise en compte des incertitudes liées à la forte variabilité du signal de parole et à l’imperfection des modèles.

Le projet « Contexte sémantique pour le débruitage à l’aide de DNN »

illustration_MMT_LoriaDans les conditions d’un cockpit d’avion, l’acquisition audio est l’un des défis les plus durs à relever pour avoir une reconnaissance de la parole (RAP) performante. Une grande partie du succès repose sur l’aptitude à atténuer les bruits ambiants dans le signal et à les prendre en compte dans le modèle acoustique utilisé par la RAP.

L’objectif principal du projet est de concevoir un système de débruitage performant pour la reconnaissance de la parole dans un cockpit d’avion. Les travaux proposés pour atteindre cet objectif porteront sur deux axes principaux:

  • une première partie de l’étude sera consacrée à des techniques innovantes de traitement de la parole et du bruit. L’étape de débruitage sera analysée en fonction de ses limites connues et améliorée en utilisant des concepts émergents pour la robustesse au bruit.
  • une deuxième partie sera consacrée à l’étude novatrice de la prise en compte de la sémantique à travers les représentations prédictives qui capturent les caractéristiques sémantiques des mots et de leur contexte. Des recherches seront menées sur la combinaison des informations sémantiques avec des informations issues du débruitage en vue d’améliorer la reconnaissance de la parole.