Thierry SPRIET
Maître de Conférences en Informatique
Parcours Universitaire
DEA Mathématiques et Informatique de la faculté de Sciences de Luminy, Aix-Marseille II en 1987
Doctorat Informatique de l'Université d'Avignon et des Pays de Vaucluse (UAPV) en Janvier 1993
Maître de conférence à l'UAPV depuis Septembre 1994
Expériences Professionnelles
1994-1996 : Responsable du DESS Informatique Double Compétence
1996-1999 : Responsable du DESS Informatique "Communication Homme Machine"
2002-2005 : Directeur du département enseignement Informatique de l'université
2005-2012 : Directeur du Centre de Ressources Informatiques de l'Université d'Avignon
2012-2015 : Vice-président aux Systèmes d'Information
depuis 2005 : Chargé de mission Technologie de l'Information et de la Communication pour l'Enseignement
Travaux de recherche
Historiquement, mes travaux de recherches ont débuté par l'étude de problèmes liés au Traitement Automatique de la Parole. C'est dans ce cadre, qu'après mon DEA, je me suis intéressé à l'intégration de connaissances linguistiques dans les systèmes de reconnaissance de la parole continue. Puis mes travaux se sont basés sur l'approche stochastique du Traitement Automatique des Langages Naturels et l'acquisition et l'intégration de connaissances explicites dans de tels systèmes. En parallèle, lors de l'encadrement d'étudiants de DEA, DRT et doctorat, ainsi que pour des contrats de recherche spécifiques, j'ai eu l'occasion d'aborder des problèmes connexes tels que l'inversion de modèles articulatoires ou la formalisation lexicale. L'ensemble des travaux que j'ai menés, ou auxquels j'ai participé pour la partie modélisation stochastique.
De par mon implication dans les TICe et dans l'administration de mon établissement, ma recherche change de cadre pour se diriger vers les TICe et les sciences de l'éducation. Après une première publication en 2006 sur le déploiement d'un dispositif d'apprentissage en ligne pour le c2i, je compte orienter mes travaux sur l'utilisation du langage naturel dans les dispositifs numériques d'apprentissage, rejoignant ainsi l'ensemble de mes domaines de recherche.
1 - Problèmes étudiés dans le cadre du traitement de la parole
Les travaux classés sous cette rubrique sont étroitement liés aux recherches effectuées dans le cadre de l'étude des bruits et du traitement automatique du langage naturel écrit. Ils utilisent largement les outils développés pour l'apprentissage automatique de connaissances numériques et symboliques. Problèmes abordés :
- Décodage acoustico-phonétique de la parole au moyen de techniques stochastiques, neuromimétiques et de règles modélisant explicitement les connaissances.
- Élaboration et conception de modèles de langage pour le traitement automatique du langage naturel.
- Inversion de modèles de production pour la reconnaissance de la parole.
- Réalisation de systèmes hybrides de reconnaissance de la parole (modèles probabilistes + réseaux neuromimétiques + connaissances explicites + arbres de décisions).
- Travaux sur l’analyse des noms propres, des mots étrangers et des sigles pour la modélisation dulangage naturel. Élaboration et conception de mixture de modèles thématiques pour la modélisation des actes de dialogues.
2 - Problèmes étudiés dans le cadre de l'apprentissage automatique
Dans le domaine de l'apprentissage automatique, nos travaux consistent, d'une part, à réaliser des outils utilisables pour le traitement de bruits divers et du langage naturel (parole, textes informatisés, reconnaissance de caractères, étiquetage des acides aminés dans les structures d'ADN...) et, d'autre part, à élaborer de nouvelles techniques d'acquisition de connaissances numériques et symboliques.
- Modèles stochastiques (HMM) et modèles mixtes (HMM et règles de connaissances) pour l'acquisition automatique et le traitement d'informations diverses (acoustico-phonétiques, articulatoires, phonologiques, lexicales, morphologiques, syntaxiques, sémantiques, musicales, etc.).
3 - Problèmes étudiés dans le cadre du traitement du langage écrit
Les travaux concernant le traitement automatique du langage naturel écrit permettent de modéliser des phénomènes linguistiques que l'on rencontre sous des formes semblables en reconnaissance de la parole. Toutefois, les activités relevant spécifiquement de ce domaine s'appliquent à des problèmes précis et font appel à diverses techniques de représentation et de traitement des connaissances (modèles de Markov multigrammes ou multi-classes, règles de connaissances, etc.).
Problèmes abordés :
- Étiquetage automatique de textes (syntaxe, morphologie, sémantique...) au moyen de modèles de Markov et de règles.
- Intégration de règles de connaissances dans un modèle de langage probabiliste.
- Combinaison d'approches numériques et symboliques en TALN.
- Élaboration de procédures d'évaluation de modèles probabilistes.
- Accès aux bases de données textuelles au moyen de requêtes en langage naturel.
- Correction orthographique en contexte (mots, accords, accents, etc.).
- Réalisation d'un système de réaccentuation de textes en Français (AAA).
- Réalisation d'un système probabiliste d'étiquetage syntaxique de corpus (TagSta).
- Réalisation d'un système mixte (probabiliste et connaissances) d'étiquetage syntaxique de corpus (ECSta).
• Réalisation d'une boîte à outils pour la vérification de corpus, de dictionnaires et de modèles probabilistes