SténoMédia / Stentor

Deux nouveaux mots pour changer la vie des sténotypistes francophones !

SténoMédia


La rencontre de la sténotypie, de l'informatique et de l'ingénierie linguistique.

Stentor


 Pour répondre aux exigences qui s'imposent aujourd'hui à la profession de sténotypiste, nous avons développé le logiciel Stentor qui vous apportera une efficacité sans égale.

Les atouts


Dans un milieu hautement concurrentiel, ce gain de productivité vous permettra de dégager de meilleures marges tout en proposant des tarifs attractifs.

HISTORIQUE


 

La transcription de la sténotypie est une problématique assez proche de celle de la reconnaissance de la parole. Avec d'un coté près de 15 ans de recherche dans les meilleurs laboratoires français en traitement automatique du langage naturel et, de l'autre, plus de 30 ans d'expérience internationale en sténotypie, nous avons une approche très pratique des problèmes des sténotypistes.

Le projet, lancé en 2003, a permis d'établir une première maquette en 2005. Devant les excellents résultats obtenus, nous avons décidé de commercialiser le logiciel. En 2007, lorsque la première version stable a été réalisée, la société SténoMédia a été créée pour en assurer la commercialisation.

SténoMédia est le fruit de la rencontre d'une sténotypiste riche d'une expérience internationale et de deux chercheurs en traitement automatique du langage naturel.

Les deux principaux buts de la société sont :

- Adapter les dernières découvertes scientifiques en reconnaissance de la parole au monde de la sténotypie
- Proposer une solution performante et économique pour les sténotypistes désirant s'équiper ou changer de logiciel

L'ÉQUIPE DE STÉNOMÉDIA


Simone Bardot

Sténotypiste de conférences
diplômée AFSC

SON PARCOURS

Sténotypiste de conférences diplômée AFSC en 1976 avec mention « Très bien », Simone Bardot a acquis une grande expérience de la sténotypie dans les plus grandes institutions (ONU New York, Tribunal pénal international de La Haye, Tribunal international de la mer, Banque mondiale…) comme dans l'entreprise (conseils d'administration, comités d'entreprise, colloques, réunions techniques…), le monde politique et l'arbitrage international.

Membre de l'association des sténotypistes américains (National Court Reporters Association), elle a participé aux "Conventions" de Boston, San Diego, Orlando, New York et Philadelphie. Toujours dans le but d'approfondir sa connaissance du monde de la transcription, était présente aux congrès Intersténo d'Amsterdam, Lausanne (où elle a remporté le 2ème Prix au Championnat mondial de Sténotypie, Catégorie A, en 1998), Rome, Paris, Gand.

La création de SténoMédia est née de cette riche expérience internationale et de la volonté d'offrir un outil moderne et performant aux sténotypistes francophones d'abord mais également d'autres langues, quelle que soit la méthode de sténotypie qu'ils utilisent.

Yannick Estève

Chercheur en modélisation du langage et traitement automatique de la parole.

SON PARCOURS

Professor of Computer Science

My main research interests are language modeling and speech recognition.
I have studied Computer Science at the Faculty of Sciences of Luminy (Marseille, France). I obtained my PhD on 2002, under the direction of Professor Renato De Mori, at the Computer Science Labs (LIA) of the University of Avignon (Avignon, France), in association with France Telecom R&D (FTRD).

I am currently working on audio document indexation, low latency ASR combination, advanced error analysis, spoken language understanding, low resources language processing, embedded ASR systems, speaker and role recognition, spontaneous speech, automatic processing of document collections ...

Courses (old and current ones)

Relational database
Network
C language
Logic programmation
Software development tools
Technical and scientific expression
Language modelling for speech recognition
Spoken language understanding
Knowledge representation

Thierry Spriet

Chercheur en modélisation du langage et traitement automatique de la parole.

SON PARCOURS

Maître de Conférences en Informatique

 

Parcours Universitaire

DEA Mathématiques et Informatique de la faculté de Sciences de Luminy, Aix-Marseille II en 1987

Doctorat Informatique de l'Université d'Avignon et des Pays de Vaucluse (UAPV) en Janvier 1993

Maître de conférence à l'UAPV depuis Septembre 1994

 

Expériences Professionnelles

1994-1996 : Responsable du DESS Informatique Double Compétence

1996-1999 : Responsable du DESS Informatique "Communication Homme Machine"

2002-2005 : Directeur du département enseignement Informatique de l'université

2005-2012 : Directeur du Centre de Ressources Informatiques de l'Université d'Avignon

2012-2015     : Vice-président aux Systèmes d'Information

depuis 2005 : Chargé de mission Technologie de l'Information et de la Communication pour l'Enseignement

 

Travaux de recherche

Historiquement, mes travaux de recherches ont débuté par l'étude de problèmes liés au Traitement Automatique de la Parole. C'est dans ce cadre, qu'après mon DEA, je me suis intéressé à l'intégration de connaissances linguistiques dans les systèmes de reconnaissance de la parole continue. Puis mes travaux se sont basés sur l'approche stochastique du Traitement Automatique des Langages Naturels et l'acquisition et l'intégration de connaissances explicites dans de tels systèmes. En parallèle, lors de l'encadrement d'étudiants de DEA, DRT et doctorat, ainsi que pour des contrats de recherche spécifiques, j'ai eu l'occasion d'aborder des problèmes connexes tels que l'inversion de modèles articulatoires ou la formalisation lexicale. L'ensemble des travaux que j'ai menés, ou auxquels j'ai participé pour la partie modélisation stochastique.

De par mon implication dans les TICe et dans l'administration de mon établissement, ma recherche change de cadre pour se diriger vers les TICe et les sciences de l'éducation. Après une première publication en 2006 sur le déploiement d'un dispositif d'apprentissage en ligne pour le c2i, je compte orienter mes travaux sur l'utilisation du langage naturel dans les dispositifs numériques d'apprentissage, rejoignant ainsi l'ensemble de mes domaines de recherche.

1 - Problèmes étudiés dans le cadre du traitement de la parole

Les travaux classés sous cette rubrique sont étroitement liés aux recherches effectuées dans le cadre de l'étude des bruits et du traitement automatique du langage naturel écrit. Ils utilisent largement les outils développés pour l'apprentissage automatique de connaissances numériques et symboliques. Problèmes abordés :

  • Décodage acoustico-phonétique de la parole au moyen de techniques stochastiques, neuromimétiques et de règles modélisant explicitement les connaissances.
  • Élaboration et conception de modèles de langage pour le traitement automatique du langage naturel.
  • Inversion de modèles de production pour la reconnaissance de la parole.
  • Réalisation de systèmes hybrides de reconnaissance de la parole (modèles probabilistes + réseaux neuromimétiques + connaissances explicites + arbres de décisions).
  •  Travaux sur l’analyse des noms propres, des mots étrangers et des sigles pour la modélisation dulangage naturel. Élaboration et conception de mixture de modèles thématiques pour la modélisation des actes de dialogues.

    2 - Problèmes étudiés dans le cadre de l'apprentissage automatique

    Dans le domaine de l'apprentissage automatique, nos travaux consistent, d'une part, à réaliser des outils utilisables pour le traitement de bruits divers et du langage naturel (parole, textes informatisés, reconnaissance de caractères, étiquetage des acides aminés dans les structures d'ADN...) et, d'autre part, à élaborer de nouvelles techniques d'acquisition de connaissances numériques et symboliques.

    • Modèles stochastiques (HMM) et modèles mixtes (HMM et règles de connaissances) pour l'acquisition automatique et le traitement d'informations diverses (acoustico-phonétiques, articulatoires, phonologiques, lexicales, morphologiques, syntaxiques, sémantiques, musicales, etc.).

    3 - Problèmes étudiés dans le cadre du traitement du langage écrit

    Les travaux concernant le traitement automatique du langage naturel écrit permettent de modéliser des phénomènes linguistiques que l'on rencontre sous des formes semblables en reconnaissance de la parole. Toutefois, les activités relevant spécifiquement de ce domaine s'appliquent à des problèmes précis et font appel à diverses techniques de représentation et de traitement des connaissances (modèles de Markov multigrammes ou multi-classes, règles de connaissances, etc.).

    Problèmes abordés :

    • Étiquetage automatique de textes (syntaxe, morphologie, sémantique...) au moyen de modèles de Markov et de règles.
    • Intégration de règles de connaissances dans un modèle de langage probabiliste.
    • Combinaison d'approches numériques et symboliques en TALN.
    • Élaboration de procédures d'évaluation de modèles probabilistes.
    • Accès aux bases de données textuelles au moyen de requêtes en langage naturel.
    • Correction orthographique en contexte (mots, accords, accents, etc.).
    • Réalisation d'un système de réaccentuation de textes en Français (AAA).
    • Réalisation d'un système probabiliste d'étiquetage syntaxique de corpus (TagSta).
    • Réalisation d'un système mixte (probabiliste et connaissances) d'étiquetage syntaxique de corpus (ECSta).

    • Réalisation d'une boîte à outils pour la vérification de corpus, de dictionnaires et de modèles probabilistes