Actions

Projets

CORPUSCOL

De GBLL, TAL, ALAO, etc.

Sujets proposés par Claude Ponton.

Dans le cadre du projet CORPUSCOL (laboratoires Lidilem et Larac), nous nous intéressons à l’évolution des compétences en littéracie à l’école primaire. Pour cela, un corpus de productions d’enfants a été constitué à partir des corpus SCOLEDIT (Lidilem) et LONGIT (Larac).

  • SCOLEDIT : suivi des mêmes enfants entre CE1 et CE2, même consigne, production de textes libres à partir du choix de personnages imposés.
  • LONGIT : suivi des mêmes enfants entre CE1 et CE2, même consigne, réécriture d’une histoire qui leur a été lue quelques temps auparavant.

Sujets possibles

  1. LONGIT : mesurer l’évolution des écrits des enfants entre CE1 et CE2 par rapport à l’histoire originale. La mesure peut porter sur différents éléments à choisir (lexique, structures syntaxiques, cohérence du texte, cohésion, orthographe…). Le corpus étant en ligne, on peut imaginer une interface pour visualiser dynamiquement ces mesures.
  2. SCOLEDIT / LONGIT : les deux corpus étant comparables (même typologie de classe, suivi longitudinal d’enfants, mêmes niveaux scolaires…), on aimerait mesure et visualiser les différences entre ces deux corpus. Ces mesures peuvent porter sur différents éléments à choisir (lexique/diversité lexicale, structures syntaxiques, cohérence du texte, cohésion, orthographe, ponctuation, longueur de textes…).
  3. Dans le cadre de ce projet, on cherche également à mesure la « qualité » des textes. Différents indicateurs nous intéressent : lexique/diversité lexicale, structures syntaxiques, cohérence du texte, cohésion, orthographe, usage de la ponctuation… Il s’agirait de calculer certains de ces indicateurs, de permettre un calcul pour chaque texte et d’offrir une visualisation dynamique des résultats

Notes et références