Interactions entre locuteurs : de la détection de la parole superposée à la détection des interruptions
Le projet ANR GEM, à l'initiative de l'institut national de l'audiovisuel, vise à étudier les différences de traitement et dereprésentation entre les femmes et les hommes dans les médias. Ce projet encourage la collaboration entre la recherchemenée en sciences des médias et du langage...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Le projet ANR GEM, à l'initiative de l'institut national de l'audiovisuel, vise à étudier les différences de traitement et dereprésentation entre les femmes et les hommes dans les médias. Ce projet encourage la collaboration entre la recherchemenée en sciences des médias et du langage et celle menée en informatique. Un des objectifs du projet est de favoriser lacréation d’outils automatiques afin de généraliser et favoriser les études SHS sur de larges corpus.Dans cette thèse, nous nous focaliserons sur des outils de traitement du signal qui faciliteront la caractérisation desreprésentations des locuteurs. Plus précisément, nous proposons des méthodes pour détecter et caractériser automatiquementles interruptions au cours d'une conversation issue d’émissions de débats télévisuels.L'interruption est une notion subjective, dont la définition n’est pas consensuelle. Dans notre domaine du traitementautomatique, cette tâche est nouvelle, sans cadre et avec peu de ressources. Nous proposons, dans un premier temps, deréduire la définition des interruptions au cas particulier de la parole superposée conformément à la littérature en sociologie eten sciences du langage. Un outil de détection de la présence d’activité vocale mono et multi-locuteur a été développé dans cecontexte. Le développement d’un tel outil pose la question au-delà d'une évaluation quantitative. À partir des segmentsmulti-locuteurs, plusieurs études ont été réalisées portant sur leur durée ainsi que sur leur contenu linguistique.Dans un second temps, nous nous sommes intéressés spécifiquement à la détection des interruptions. L’apprentissage demodèles neuronaux dédiés a nécessité la collecte et l’annotation d’un corpus. En guidant les annotateurs, nous avons abouti àune définition de l'interruption par l’exemple. La création d'un tel corpus a permis de développer un modèle de classificationbinaire d'interruption pour qualifier les segments multi-locuteurs précédemment détectés.
The ANR GEM project, initiated by the National Audiovisual Institute, aims to study the differences in treatment andrepresentation between women and men in the media. This project encourages collaboration between research in media andlanguage sciences and research in computer science. One of the project's objectives is to promote the creation of automatedtools to generalize and facilitate social sciences and humanities studies on large corpora.In this thesis, we will focus on signalprocessing tools that facilitate the char |
---|