Joseph Mariani

Aller à la navigation Aller à la recherche

Joseph-Jean Mariani, dit Joseph Mariani (né le 1er février 1950), est un chercheur français en informatique pionnier du traitement de la parole.

Joseph Mariani
Description de l'image Photo-JM4.png.
Naissance (74 ans)
Profession
chercheur en informatique

Formation et carrière

Après l'obtention d'un diplôme de docteur ingénieur en 1977, Joseph Mariani devient Docteur es Sciences de l'Université Pierre-et-Marie-Curie en 1982. Il rejoint le Centre national de la recherche scientifique (CNRS) en 1978 dans le Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur (LIMSI) à Orsay comme chargé de recherche, puis dirige le groupe «Communication Parlée » de 1982 à 1985. Il part ensuite aux États-Unis de 1985 à 1986 comme chercheur invité au IBM T.J. Watson Research Center (Yorktown Heights, NY, USA). De retour en France, il anime de 1987 à 2001 le Département « Communication Homme-Machine  » du LIMSI, dont il est le directeur de 1989 à 2000 . Plus tard, il est nommé Directeur du Département « Technologie de l'Information et de la Communication » au Ministère de la recherche. Au sein du Ministère, il met en place les programmes Techno-Langue et Techno-Vision sur le développement et l'évaluation des technologies dans ces deux domaines.

Parallèlement, il est nommé Président de l'European Language Resources Association (ELRA) et siège au conseil d'administration de différents organismes comme l'ANFr, IGN, l'OST ou l'INRIA. Il a participé à la création de nombreuses associations et conférences internationales comme ELSNET, COCOSDA, ESCA/ISCA, ELRA et LREC. Dès le début de sa carrière, Jospeh Mariani a été récompensé pour son activité dans le domaine du traitement de la parole. En 1985, il est lauréat du prix « Science et Défense  » et co-lauréat du prix du Ministère de l'Industrie « Transfert Recherche-Industrie  ». Son activité au service de l'ISCA a été reconnue par la prestigieuse "ISCA Special Service Medal" en 1999, distinction dont il est à ce jour un des trois seuls récipiendaires.

De 2006, et jusqu'en décembre 2013, il exerce les fonctions de directeur de l'Institut des technologies Multilingues et Multimédias de l'Information (IMMI) qui est une Unité Mixte Internationale du CNRS créé dans le cadre du programme Quaero, où collaborent le LIMSI, l'Institut de Technologie de Karlsruhe (KIT) et l'Université d'Aix-la-Chapelle (RWTH). En février 2016, il est nommé chercheur émérite du CNRS.

Domaine de recherche

Les activités de recherche de Joseph concernent principalement la communication Homme-Machine, à la fois orale et écrite, dans une perspective de traitement automatique de la langue.

Au début de sa carrière il se consacre à la reconnaissance automatique de la parole et au traitement du signal[1].

Dès le début des années 1980, Joseph Mariani propose dans le cadre des activités d'évaluation conduites par le groupe de travail RSG10 de l'OTAN, l'appellation de « paradigme d'évaluation » pour désigner une campagne d'évaluation ouverte en mode quantitatif boîte noire avec des mesures de performance sur des données communes, suivie d'un atelier de synthèse, que l'on désigne maintenant sous le nom de tâche partagée (« shared task ») d'évaluation. Rappelons que le paradigme d'évaluation a permis de faire progresser de manière continue les programmes de traitement de la parole pour donner SIRI, Cortana et Google Voice.

En 1987, il développe HAMLET, un prototype d'un des premiers systèmes de dictée vocale, appelé à l'époque "voice activated typewriter"[2].

Il est impliqué dans la reprise des activités d'évaluation en traitement automatique de la parole au NIST[3] et du texte[4] aux États-Unis en 1987. En 1994, il organise avec Robert Martin alors directeur de l'Institut National de la Langue Française (INaLF), la première campagne d'évaluation ouverte francophone sur l'écrit pour les analyseurs morpho-syntaxiques du français avec le soutien des deux départements du CNRS, celui des Sciences de l'Homme et de la Société et celui des Sciences de l'Ingénieur. La même année, il est impliqué dans le lancement d'un programme dans le domaine du génie linguistique par l'Aupelf-Uref (à présent AUF, Agence Universitaire de la Francophonie) et coordonné par le Réseau Francophone de l'Ingénierie de la Langue (FRANCIL) pour renforcer les activités francophones dans ce domaine qui englobe les Actions de Recherche Concertées (ARCs), élément majeur du dispositif fondées sur l'utilisation du paradigme d'évaluation appliqué au texte et à la parole[5]. Dans les années 2000, il contribue à un ouvrage majeur portant sur le traitement automatique de la parole: Spoken Language Processing[6]. En 2006, il rejoint le comité d'éthique (COMETS) du CNRS.

Entre 2000-2010, ses activités portent sur le multilinguisme avec l'élaboration des matrices de langues pour les 24 langues de l'Union Européennes[7]. Ensuite, il travaille à la publication du livre blanc META-NET[8] pour faire l'état des lieux des ressources (dictionnaires, grammaires et programmes) disponibles pour le français.

Depuis 2010, il participe à des travaux sur le traitement automatique des langues régionales[9] et s'intéresse aux problèmes éthiques posés par l'utilisation des systèmes informatiques dans la vie courante.

Depuis 2013[10], il collecte et étudie les articles du domaine du traitement automatique de la langue, pris de manière large, en incluant le traitement de la parole et la recherche d'information. Ce travail est réalisé dans le cadre du projet NLP4NLP[11] qui a commencé sur les archives de l'ISCA (International Speech, Communication Association), puis sur LREC[12], TALN et IEEE avant d'être étendu aux autres conférences et revues comme TREC. Après cette phase de collecte qui a permis pour la première fois de rassembler la majeure partie des archives du domaine, les articles sont étudiés automatiquement selon divers angles d'attaque. Il s'agit en premier lieu d'extraire automatiquement les termes techniques et en second lieu de déterminer quel est l'auteur qui a utilisé pour la première fois un terme qui est devenu par la suite populaire. Cela constitue une mesure de l'innovation[13]. L'objectif est de comprendre les mécanismes qui ont bouleversé le domaine et ainsi permettre de dégager les tendances actuelles et futures. Ce travail porte sur la création des termes techniques, leur évolution et éventuellement leur oubli et leur résurgence comme le terme de "réseaux de neurones". Un autre angle d'attaque est l'analyse prédictive qui consiste à calculer les courbes statistiques de l'usage des termes techniques afin de prévoir leur utilisation lors des quatre années à venir. L'étude porte aussi sur l'incidence d'une conférence sur une autre ainsi que sur le plagiat et la réutilisation dans les publications scientifiques[14].

Bibliographie

Joseph Mariani a participé a plus de 500 publications, soit en tant qu'auteur, soit en tant que directeur de publication.

Références

  1. Jean-Sylvain Liénard, Joseph Mariani, 1980, Système de reconnaissance de mots isolés: MOISE - Registred Technical Report ANVAR No 50312, juin 1980
  2. Hamlet: a prototype of a Voice Activated Typewriter, Joseph Mariani, European Conference on Speech Technology 1987 papers/ecst 1987/e87 2222.pdf
  3. David Pallet, 1998 The NIST Role in Automatic Speech Recognition Benchmark Tests, LREC 1998
  4. Ralph Grishman, Beth Sundheim, 1996 Message Understanding Conference-6: A Brief History, COLING 1996
  5. Survey of the State of the Art in Human Language Technology [1]
  6. Spoken Language Processing [2]
  7. Language Matrices and the Language Resource Impact, Joseph Mariani, Gil Francopoulo, dans Language Production, Cognition and the lexicon, edited by Gala, Rapp, Bel-Enguix, Springer
  8. META-NET White Paper Series: French, Joseph Mariani, Patrick Paroubek, Gil Francopoulo, Aurélien Max, François Yvon, Pierre Zweigenbaum. Springer [3]
  9. Technologies de la langue: état des lieux, Joseph Mariani, dans Les Technologies pour les langues régionales de France, Colloque du 19 et 20 février 2015 organisé par la DGLFLF
  10. Rediscovering 25 Years of Discoveries in Spoken Language Processing: A Preliminary ISCA Archive Analysis, Joseph Mariani, Patrick Paroubek, Gil Francopoulo, Marine Delaborde, [4]
  11. NLP4NLP: The Cobbler's Children Won't Go Unshod, Gil Francopoulo, Joseph Mariani, Patrick Paroubek, D-Lib Magazine: The Magazine of Digital Library Research, November 2015 [5]
  12. Rediscovering 15 Years of Discoveries in Language Resources and Evaluation: The LREC Anthology Analysis, Joseph Mariani, Patrick Paroubek, Gil Francopoulo, Olivier Hamon, LREC 2014, [6]
  13. Text Mining for Notabilility Computation, Gil Francopoulo, Joseph Mariani, Patrick Paroubek, LREC 2016, Workshop on Cross-Platform Text-Mining and Natural Language Processing Interoperability [7]
  14. A Study of Reuse and Plagiarism in LREC papers, Gil Francopoulo, Joseph Mariani, Patrick Paroubek, LREC 2016, http://www.lrec-conf.org/proceedings/lrec2016/index.html

Liens externes

Article publié sur Wikimonde Plus

  • Portail de la robotique
  • Portail de l’informatique