Actions

Projets

Différences entre versions de « SELF/Évaluation de la production écrite chinoise »

De GBLL, TAL, ALAO, etc.

< Projets:SELF
Ligne 46 : Ligne 46 :
 
== Evaluation ==
 
== Evaluation ==
 
<br/>
 
<br/>
 +
 +
Le système permet d’évaluer la production écrite par deux aspects : une correspondance entre les sinogrammes et le pinyin et une bonne structure grammaticale de la phrase.
 +
* Correspondance entre les sinogrammes et le pinyin
 +
Dans un contexte spécifique, chaque caractère chinois ne correspond qu’à un pinyin. En utilisant l’outil de Pinyin4j, on compare la référence avec la production de l’utilisateur pour calculer la distance.
 +
* Structure grammaticale
 +
Vu la liberté grammaticale en chinois, on compare non seulement la structure entre la référence et la production, on élève aussi la tolérance à travers des règles qu’on propose.
 +
  
 
<br/>
 
<br/>

Version du 16 novembre 2020 à 22:29

Projet réalisé par Yumeng DING, Jingyu LIU et Ning ZHANG

Introduction


  • Présentation de ce projet


Dans le cadre du projet SELF, le prototype que nous proposons est un système qui permet de calculer différents scores donnant une idée de la production écrite d'un étudiant. Pour réaliser la demande du test SELF, nous serons créer un programme développé en Java qui peut évaluer automatiquement de la production écrite par les apprenants utilisant la langue de mandarin.

  • Objectif


Le prototype que nous proposons est un système qui permet aux utilisateurs de tester les productions écrites. En même temps, ce système a la fonction de se faire les exercices sur les connaissances de pinyin et de sinogrammes.

  • Public visé


Le système que nous proposons s'adresse principalement aux chercheurs dans le cadre du projet SELF, il s'adresse également aux enseignants et aux apprenants qui veulent tester ou faire les exercices de la production écrite chinoise (notamment sur le pinyin et le sinogrammes).

Fonctionnalité


  1. Entrainer

Le système permet aux utilisateurs de choisir différents niveaux (simple et avancé) d’exercices et chaque exercice est composant principalement par les parties suivantes :

  • La transcription entre Pinyin et sinogramme
  • La remise en ordre des tokens d’une phrase choisie aléatoirement dans un corpus.

Il y a 2 formes de contenu à choisir : soit la conversation courte sur différents sujets, soit le mot clé avec son utilisation.

Types d'exercices.png
  1. Evaluer

Le système est capable d’évaluer la production de l’utilisateur en comparant avec la référence et à la fin, de bien indiquer la faute orthographique ou syntaxique. L’utilisateur va aussi obtenir un score. Pour élever la tolérance au niveau syntaxique, il y a 2 possibilités :

  • Comme le corpus n’est pas de grande taille, on essaie de trouver toutes les possibilités de variance de phrase et les stocker dans le dictionnaire. (Il est moins possible de tous trouver. Si la taille de corpus augmente, cette manière ne sera pas faisable.)
  • Le corpus est annoté et chaque constituant de la phrase est accompagné d’une étiquette. On essaie de construire de différentes règles pour que les phrases correctes, mais qui sont différentes des références soient acceptables.



Corpus




Evaluation


Le système permet d’évaluer la production écrite par deux aspects : une correspondance entre les sinogrammes et le pinyin et une bonne structure grammaticale de la phrase.

  • Correspondance entre les sinogrammes et le pinyin

Dans un contexte spécifique, chaque caractère chinois ne correspond qu’à un pinyin. En utilisant l’outil de Pinyin4j, on compare la référence avec la production de l’utilisateur pour calculer la distance.

  • Structure grammaticale

Vu la liberté grammaticale en chinois, on compare non seulement la structure entre la référence et la production, on élève aussi la tolérance à travers des règles qu’on propose.




Difficultés




Référence et Ressource


Liens :
Corpus dynamique du chinois