A T M S Advanced Technologies For Medicine and Signals

A T M S مخبر البحث في التكنولوجيات المتقدمة في الإشارة و الطب

Traitement audio-visuel et détection

 

imag

 

L’intégration des informations visuelles aux informations acoustiques en vue de leur exploitation pour la reconnaissance automatique bimodale de la parole ou du locuteur reste un sujet scientifique qui a fait l’objet de plusieurs études depuis des années. Si cette exploitation est fort séduisante, la problématique qu'elle soulève est, cependant, loin d'être triviale. Tout d'abord, se pose la question du niveau d'intégration : est-ce le niveau de données ou celui de résultats? Puis il y a les phénomènes de décalage temporel entre la réalisation auditive et la réalisation visuelle d'un phonème par exemple. Ensuite intervient le problème d'adaptation des contributions des modalités acoustique et visuelle selon leur fiabilité relative. Enfin se pose la question de la pertinence de l'utilisation, pour le traitement du signal visuel de parole.

Les problématiques liées à ce domaine restent encore nombreuses et les recherches actuelles se focalisent à l’exploration et la présentation de nouvelles techniques pour analyser les informations liées à la présence d'un humain dans un enregistrement audiovisuel numérique. Les domaines applicatifs liés concernent bien évidemment la sécurité (identification de personnes, vidéosurveillance, systèmes d’accès sécurisés, suivi de personne à domicile), les médias (contrôle des temps de parole, indexation automatique) et l’industrie des loisirs numériques (appareils photos « intelligents » par exemple) mais aussi l'assistance aux personnes en détresse ou la communication homme-machine.

Dans la littérature disponible dans ce domaine, la plupart des approches traite le problème en le divisant en deux sous problèmes de synthèse. Le premier est la synthèse de la parole acoustique et l'autre étant la génération d'animation faciale correspondante. Mais, cela ne garantit pas une parfaite synchronisation et cohérence de la parole audio-visuelle. Plusieurs chercheurs ont tenté de pallier cet inconvénient, en proposant des approches de synthèse de la parole acoustique-visuelle basées sur la sélection naturelle des unités synchrones bimodales. L'idée principale derrière ces techniques de synthèse est de garder l'association naturelle entre la modalité acoustique et visuelle intacte.

Aussi, d’autres grands thèmes abordés dans la littérature portent sur l'analyse du visage, du locuteur et des informations gestuelles. De plus, le problème d'acquisition de corpus audio-visuels et la préparation de la base de données pour les systèmes de reconnaissance reste encore un sujet d’actualité. En fait, les différents aspects de la sélection d'unités bimodales qui ont besoin d'être optimisées pour une bonne synthèse devront être bien détaillés afin de, convenablement atteindre l'objectif de synthétiser la dynamique de la parole raisonnablement bien et concevoir ainsi des systèmes de reconnaissance plus performant que les systèmes standards basés sur une seule modalité.

Par ailleurs, un programme de recherche au sein de l’unité de recherche ATMS sur le traitement du signal de parole a été engagé depuis le début des années 2000. Quatre axes de recherches ont été ouverts et qui concernent le traitement du signal de parole et notamment l’analyse, la reconnaissance, la synthèse et le débruitage du signal de parole.

Les thématiques de recherche ouvrent de nouvelles perspectives, compte tenu de la différence considérable existante entre la commande manuelle et la commande vocale. Nous avons donné également beaucoup d’intérêt aux applications biomédicales telles que l’audiométrie vocale, qui est un diagnostic indispensable pour le dépistage des surdités ainsi qu’aux tests de rééducation cliniques.

Dans ce domaine de recherche, nous avons un état d’avancement significatif et des connaissances requises à travers l’encadrement de PFE, Mastères et Thèses nouvelles. Aussi, divers résultats des travaux dans ce domaine de recherche ont été publiés dans des conférences nationales et internationales ainsi dans des journaux scientifiques.

L’unité de recherche ATMS a donné aussi beaucoup d’importances sur le domaine de reconnaissance des documents et ce l’objectif de concevoir des systèmes garantissant la migration du support papier vers le support électronique qui représente une grande révolution et qui a fait apparaître de nouveaux acteurs et de nouvelles fonctionnalités. D'énormes corpus de documents numérisés sous ses différentes formes (manuscrit, imprimé, graphique, images, documents composites, etc.) sont mis à disposition pour les systèmes de recherche documentaires intégrés dans les bibliothèques numériques ou virtuelles. Mais la numérisation seule ne suffit plus. Il faut absolument qu'elle cohabite avec le développement d'outils informatiques destinés à améliorer les conditions d’accès et de recherche. Ceci fait l’objet du projet iBook qui vise à définir un système intelligent de recherche documentaire utile pour une meilleure exploitation des documents archivés. En effet le projet i-book est la composition de deux sous projets intitulés : i-Library et l’i-Bag.

D’un autre côté, notre unité de recherche ATMS s’est investiguée dans le domaine de l’analyse d’images appliquée à la détection d’objets et de surface. Ceci trouve ses applications dans le domaine de la vidéosurveillance qui a connu une très forte expansion ces dernières années. Dans les applications de vidéosurveillance, l’aspect multi-caméras commence à jouer un rôle important. Non seulement les objets en mouvement doivent être segmentés et suivis, mais la machine doit être capable de reconnaître un même objet qui sort puis refait son apparition dans le champ d’une caméra, ou qui passe du champ d’une caméra à celui d’une autre caméra.

Parallèlement, des recherches récentes ont été lancées dans les domaines de reconnaissance du locuteur, du visage et aussi dans la reconnaissance audiovisuelle de la parole dans des milieux bruités. Les travaux inhérents à ces recherches sont en cours avec des degrés d’avancement plus ou moins important.

 

Technologie avancée en Imagerie médicale;
Télédétection et imagerie satellite;
Traitement audio-visuel et détection;
Cryptographie et Biométrie;

 

  Evénements Importants