Actions

Projets

SELF/Évaluation de la production écrite chinoise

De GBLL, TAL, ALAO, etc.

< Projets:SELF

Projet réalisé par Yumeng DING, Jingyu LIU et Ning ZHANG

Introduction


  • Présentation de ce projet


Dans le cadre du projet SELF, le prototype que nous proposons est un système qui permet de calculer différents scores donnant une idée de la production écrite d'un étudiant. Pour réaliser la demande du test SELF, nous serons créer un programme développé en Java qui peut évaluer automatiquement de la production écrite par les apprenants utilisant la langue de mandarin.

  • Objectif


Le prototype que nous proposons est un système qui permet aux utilisateurs de tester les productions écrites. En même temps, ce système a la fonction de se faire les exercices sur les connaissances de pinyin et de sinogrammes.

  • Public visé


Le système que nous proposons s'adresse principalement aux chercheurs dans le cadre du projet SELF, il s'adresse également aux enseignants et aux apprenants qui veulent tester ou faire les exercices de la production écrite chinoise (notamment sur le pinyin et le sinogrammes).

Fonctionnalité


  1. Entrainer

Le système permet aux utilisateurs de choisir différents niveaux (simple et avancé) d’exercices et chaque exercice est composant principalement par les parties suivantes :

  • La transcription entre Pinyin et sinogramme
  • La remise en ordre des tokens d’une phrase choisie aléatoirement dans un corpus.

Il y a 2 formes de contenu à choisir : soit la conversation courte sur différents sujets, soit le mot clé avec son utilisation.

Types d'exercices.png
  1. Evaluer

Le système est capable d’évaluer la production de l’utilisateur en comparant avec la référence et à la fin, de bien indiquer la faute orthographique ou syntaxique. L’utilisateur va aussi obtenir un score. Pour élever la tolérance au niveau syntaxique, il y a 2 possibilités :

  • Comme le corpus n’est pas de grande taille, on essaie de trouver toutes les possibilités de variance de phrase et les stocker dans le dictionnaire. (Il est moins possible de tous trouver. Si la taille de corpus augmente, cette manière ne sera pas faisable.)
  • Le corpus est annoté et chaque constituant de la phrase est accompagné d’une étiquette. On essaie de construire de différentes règles pour que les phrases correctes, mais qui sont différentes des références soient acceptables.



Corpus




Evaluation




Difficultés




Référence et Ressource