TAL & syntaxe objets, objectifs, ambitions et nouveaux défis

Le traitement automatique des langues est un domaine à double vocation, les deux étant traitées séparément ou conjointement suivant les équipes de recherche : concevoir des outils informatiques productifs et intégrés aux activités humaines et industrielles (cf. définition de P. Bouillon et al.) ou p...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Études de linguistique appliquée 2016, Vol.180 (4), p.463-473
1. Verfasser: Lebarbé, Thomas
Format: Artikel
Sprache:fre
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Le traitement automatique des langues est un domaine à double vocation, les deux étant traitées séparément ou conjointement suivant les équipes de recherche : concevoir des outils informatiques productifs et intégrés aux activités humaines et industrielles (cf. définition de P. Bouillon et al.) ou permettre la constitution de connaissances nouvelles sur le fonctionnement de la langue (cf. préambule de N. Chomsky). La syntaxe, parmi les dimensions linguistiques qui peuvent être étudiées, n’y échappe pas. Si la finalité scientifique de la syntaxe est la création de connaissances nouvelles sur la syntaxe elle-même, la finalité industrielle est quant à elle de s’intégrer dans un processus plus large, la syntaxe n’est qu’une forme abstraite et formalisée permettant d’accéder et d’interroger les contenus. La multiplicité des objectifs est pour partie responsable de la grande diversité des formalismes, parfois perçus comme antagonistes alors que chacun répond à une perception et un besoin d’interprétation syntaxique de la langue. La syntaxe en traitement automatique des langues pâtit toutefois d’une approche certes descriptive (décrire structurellement) mais teintée de prescription (l’objet analysé est considéré comme syntaxiquement bien formé). Or les défis actuels ne sont plus l’analyse de formes « parfaites » d’expression : les données produites en lignes (blogs, tweets, etc.), ou le brouillon constituent des terrains d’exploration et de création de nouveaux modèles syntaxiques de la langue, comme un objet certes prescrit mais ne respectant que partiellement ou à la marge les règles que nous savons aujourd’hui reproduire formellement.
ISSN:0071-190X
1965-0477
DOI:10.3917/ela.180.0463