Parole Arabe

1. Reconnaissance automatique de la parole continue en Arabe standard
Le sujet traité porte sur le décodage acoustico-phonétique et la reconnaissance automatique de la parole en Arabe standard. Les objectifs fixés étaient de réaliser un module de décodage acoustico-phonétique de l'Arabe standard en parole continue, évaluer le module de décodage pour l'intégrer dans un système de reconnaissance de phrases.
Pour atteindre ces objectifs, on a été amené à : étudier et dégager les particularités phonétiques de l'Arabe, réaliser le corpus DJOUMA (DJOUmal MAqroua : phrases lues en arabe) de 50 phrases phonétiquement équilibrées prononcées par 11 locuteurs, analyser phonétiquement les phrases du corpus. réaliser un système de décodage phonétique de l'Arabe baptisé SAPHA.(Système Acoustico-PHonétique de l'Arabe) Les phases les plus importantes du système sont : la segmentation du signal en grandes classes phonétiques, l'extraction des indices phonétiques pertinents à la reconnaissance, l'identification phonétique en utilisant des techniques d'intelligence artificielle. Par la suite, on s'est intéressé à l'étiquetage manuel du corpus et l'évaluation automatique des performances du système, l'étude linguistique de la langue et la conception d'un système de reconnaissance de phrases appelé MARS (Modern Arabic Recognition Système).

2. Construction d'un lexique en Arabe Standard Moderne
Dans le domaine des Nouvelles Technologies de l’Information et de la Communication (NTIC), le traitement linguistique de l'information tient une place importante. Pour un meilleur traitement, il est nécessaire d'atteindre une taille de vocabulaire (ou lexique) suffisamment importante. Le lexique comprend les conjugaisons des verbes et les genres et nombres des noms et adjectifs.
La langue arabe possède un système morphologique régulier basé sur la notion de la racine qui constitue le pilier du dictionnaire arabe. Une racine est un mot primitif composé de 2, 3, 4 ou 5 consonnes. A cette racine est attachée une idée générale qui se propage dans les formes qui en dérivent. La formation du mot se fait par modification des voyelles ou par annexion de lettres additionnelles.
Le sujet à pour but la construction automatique d'un lexique arabe nécessaire à une machine à dicter. Cette construction s'obtient à l'aide d'un conjugeur de verbes et un dérivateur de noms à partir d'une liste de racines auxquelles sont associées les informations relatives à la génération. Les changements concernant l'assimilation et la dissimilation seront résolus à l'aide de règles.
Par ailleurs, une interface conviviale est nécessaire pour la saisie des particules et des mots particuliers de la langue. Le système ainsi réalisé trouve son application dans le domaine de la synthèse et la reconnaissance vocale, la traduction automatique et les systèmes de recherche d'information sur Internet.
Mots clés : Traitement du langage naturel, Analyse morpho-syntaxique, Phonologie. Reconnaissance de la parole, Arabe Moderne Standard, Base de données, système d'information linguistique


Catégorie : - Intelligence & Coopération
Page lue 4811 fois