Vers une grammaire probabiliste de microsystèmes fonctionnels en L2 - Productions scientifiques du CLILLAC-ARP Accéder directement au contenu
Poster De Conférence Année : 2023

Vers une grammaire probabiliste de microsystèmes fonctionnels en L2

Résumé

Cette communication présente une ébauche de constitution d’une grammaire probabiliste de microsystèmes linguistiques en anglais langue seconde (L2). Elle se fonde sur l’analyse automatique de corpus d’apprenants d’anglais. A partir de données textuelles classées par niveau de compétence, nous proposons une approche par Traitement Automatique des Langues (TAL) permettant la construction de modèles probabilistes. Lorsqu'ils pratiquent leur L2, les apprenants font des hypothèses sur les correspondances forme-fonction. Ils observent les contextes afin de comprendre la signification de formes spécifiques. « La tâche de l'apprenant consiste à découvrir (1) quelles formes sont utilisées pour réaliser quelles fonctions dans la L2 et (2) quelle importance accorder à l'utilisation de formes individuelles dans la réalisation de fonctions spécifiques. » (Ellis, 1994, p. 375). En accomplissant cette tâche, les apprenants modifient leur système interne de L2, stabilisent progressivement les correspondances et améliorent leur niveau. Au cours de ce processus, les apprenants ont tendance à hésiter entre des formes exprimant une fonction spécifique telle que la référence, la détermination ou la quantification. Ces hésitations illustrent un aspect du modèle de compétition basé sur la résolution de conflits entre formes (MacWhinney et al., 1984). Les microsystèmes sont instables car les apprenants regroupent de manière inattendue des formes qui ne relèvent pas nécessairement du même paradigme fonctionnel (Py, 1980). En raison de cette instabilité des correspondances, les microsystèmes sont de nature transitoire (Gentilhomme, 1980). Ils comprennent des correspondances erronées qui sont ensuite corrigées, ce qui permet à l'apprenant de progresser. La compétence en langues repose en partie sur la notion de complexité (Norris & Ortega, 2009), y compris grammaticale. Cette complexité s’opérationnalise à partir de la fréquence de motifs syntaxiques ou de mesures holistiques reposant sur les constituants grammaticaux (Housen et al., 2012). Malgré ses avantages, cette approche ne rend pas compte des variations entre formes d’une même fonction. Notre hypothèse de l’existence de ces microsystèmes de L2 repose sur l’association entre leurs variations endogènes et les niveaux de compétence des apprenants. Cela pose deux questions de recherche : 1. Comment saisir les variations entre formes associées à la même fonction linguistique ? 2. Ces variations sont-elle corrélées à la compétence opérationnalisée par le CECR ? Les microsystèmes peuvent être opérationnalisés sous forme d’indicateurs de probabilité. Pour ce faire, des modèles statistiques sont construits à partir de données extraites de corpus d’apprenants. Dans cette communication, nous présentons la conception de ces indicateurs pour différents microsystèmes tels que les proformes, les déterminants, les modaux, les quantificateurs et certaines prépositions. Ces indicateurs sont générés par des modèles probabilistes élaborés par régression logistique multinomiale ou réseaux neuronaux. La méthode d’évaluation de ces modèles repose sur i) l’évaluation de l’extraction automatique des formes composant les microsystèmes au regard d’échantillons de référence annotés par des experts et ii) l’évaluation de la puissance de ces indicateurs à discriminer significativement les niveaux du CECR. Les premiers résultats obtenus sur le microsystème des proformes montrent des corrélations significatives. Ces modèles probabilistes sont partie intégrante du module expert (Anderson, 2013) d'un Environnement Intelligent d’Aide à l’Humain (EIAH) en cours d’élaboration. Ces modèles permettraient de jeter les bases de la conception d’une grammaire probabiliste en L2 anglais.
Fichier principal
Vignette du fichier
REAL2_Grenoble-9.pdf (1.02 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04249627 , version 1 (19-10-2023)

Identifiants

  • HAL Id : hal-04249627 , version 1

Citer

Cyrielle Mallart, Andrew Simpkin, Rémi Venant, Nicolas Ballier, Bernardo Stearns, et al.. Vers une grammaire probabiliste de microsystèmes fonctionnels en L2. RéAL2: Grammaire(s) et acquisition des L2: Approches, trajectoires, interfaces,, Oct 2023, Grenoble, France. ⟨hal-04249627⟩
100 Consultations
21 Téléchargements

Partager

Gmail Facebook X LinkedIn More