Associer heuristiques textométriques et méthodes d’évaluation issues du traitement automatique des langues
Cet article propose une méthodologie de sémantique de corpus pour les applications en fouille de textes s’adossant sur l’examen critique des points de divergence du traitement automatique des langues (TAL) et de l’analyse statistique des données textuelles (et plus particulièrement de la textométrie...
Gespeichert in:
Veröffentlicht in: | Études de linguistique appliquée 2016-05, Vol.180 (4), p.429-436 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | fre |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Cet article propose une méthodologie de sémantique de corpus pour les applications en fouille de textes s’adossant sur l’examen critique des points de divergence du traitement automatique des langues (TAL) et de l’analyse statistique des données textuelles (et plus particulièrement de la textométrie). Nous souhaitons mettre en évidence leurs spécificités méthodologiques et tirer parti à la fois de l’intelligence herméneutique de la textométrie fondée sur un soin philologique particulier et de la rigueur des méthodes d’évaluation mises en œuvre dans le TAL. Nous illustrons notre propos à l’aide d’une étude de fouille d’opinion portant sur la détection automatique des prises de position des députés sur un corpus de débats parlementaires (28832 interventions). L’étude permet de mettre en évidence qu’un nombre relativement réduit de marqueurs sémantiques relevant de la dialogique (positions énonciatives) et de la dialectique (stratégie rhétorique) suffisait à caractériser les positions idéologiques et d’identifier des acteurs stéréotypés que nous appelons des agonistes. |
---|---|
ISSN: | 0071-190X 1965-0477 |
DOI: | 10.3917/ela.180.0429 |