Actions

Projets

Différences entre versions de « SELF/Évaluation de la production écrite chinoise »

De GBLL, TAL, ALAO, etc.

< Projets:SELF
Ligne 17 : Ligne 17 :
 
* La remise en ordre des tokens d’une phrase choisie aléatoirement dans un corpus.
 
* La remise en ordre des tokens d’une phrase choisie aléatoirement dans un corpus.
 
Il y a 2 formes de contenu à choisir : soit la conversation courte sur différents sujets, soit le mot clé avec son utilisation.  
 
Il y a 2 formes de contenu à choisir : soit la conversation courte sur différents sujets, soit le mot clé avec son utilisation.  
 +
 
[[Fichier:Exercice.png|vignette]]
 
[[Fichier:Exercice.png|vignette]]
 +
 
# '''Evaluer'''
 
# '''Evaluer'''
 
Le système est capable d’évaluer la production de l’utilisateur en comparant avec la référence et à la fin, de bien indiquer la faute orthographique ou syntaxique. L’utilisateur va aussi obtenir un score.  
 
Le système est capable d’évaluer la production de l’utilisateur en comparant avec la référence et à la fin, de bien indiquer la faute orthographique ou syntaxique. L’utilisateur va aussi obtenir un score.  

Version du 16 novembre 2020 à 21:03

Projet réalisé par Yumeng DING, Jingyu LIU et Ning ZHANG

Présentation


Quel public ?


Quel but ?




Fonctionnalité


  1. Entrainer

Le système permet aux utilisateurs de choisir différents niveaux (simple et avancé) d’exercices et chaque exercice est composant principalement par les parties suivantes :

  • La transcription entre Pinyin et sinogramme
  • La remise en ordre des tokens d’une phrase choisie aléatoirement dans un corpus.

Il y a 2 formes de contenu à choisir : soit la conversation courte sur différents sujets, soit le mot clé avec son utilisation.

Exercice.png
  1. Evaluer

Le système est capable d’évaluer la production de l’utilisateur en comparant avec la référence et à la fin, de bien indiquer la faute orthographique ou syntaxique. L’utilisateur va aussi obtenir un score. Pour élever la tolérance au niveau syntaxique, il y a 2 possibilités :

  • Comme le corpus n’est pas de grande taille, on essaie de trouver toutes les possibilités de variance de phrase et les stocker dans le dictionnaire. (Il est moins possible de tous trouver. Si la taille de corpus augmente, cette manière ne sera pas faisable.)
  • Le corpus est annoté et chaque constituant de la phrase est accompagné d’une étiquette. On essaie de construire de différentes règles pour que les phrases correctes, mais qui sont différentes des références soient acceptables.



Corpus




Evaluation




Difficultés




Référence et Ressource