Actions

Projets

Consultation de dictionnaire par entrée phonologique "le Dicophone"

De GBLL, TAL, ALAO, etc.

Projet réalisé par El Yazid BARKA et Hesna SEBIANE


< M2 IdL - TAL & ALAO 2020-2021

Lire la proposition de projet "Consultation de dictionnaire par entrée phonologique"

Présentation du projet

Notre projet « consultation d’un dictionnaire par entrée phonologique » est proposé par le projet ALeM (apprentissage des langues et multimodalité) des laboratoires LIDILEM (UGA) et ICAR (Lyon 2). Il s’inscrit dans la lignée des outils développés par le projet ALeM, qui se distingue par son approche multimodale pour l’Apprentissage des Langues, au sens de multisensorialité, en proposant plusieurs outils pour l’AL dans leurs dimensions (phonétique et phonologique, phonographémique et orthographique, morphologiques, syntaxiques etc.). Nous avons tenté de créer un outil à partir de la ressource Wikiphon d’ALeM que nous avons développé sous Python.

L’objectif de ce projet est de créer un outil, appelé « le Dicophone », pour la consultation d'un dictionnaire par la saisie complète ou partielle des phonèmes qui composent le mot recherché. Cet outil permet de consulter un dictionnaire sans connaître nécessairement l'orthographe du mot en question. Par exemple, {/diksjionɛʁ/ pour trouver "dictionnaire, dictionnaires" ; /k.t/ pourra donner "compte, conte, côte..." ; /p..abl/ pourra donner "pliable, portable, potable, palpable...", etc.}.

Problématique

Grâce aux outils TAL, nous pouvons aujourd’hui créer des dictionnaires électroniques qui permettent de rechercher un mot sans connaître son orthographe. Cela dit, la consultation d’un dictionnaire par entrée phonologique propose une autre façon d’associer et d’appréhender les mots à leur prononciation. A ce propos, il arrive souvent qu’un apprenant allophone connaisse la prononciation d’un mot entendu, mais n’a aucune idée de son orthographe. Ce qui nous amène à repenser la recherche d’un mot dans un dictionnaire. Comment le TAL peut-il aider à la recherche d’un mot par entrée phonologique dans un dictionnaire ?

Public visé

Il nous a semblé important de préciser le profil langagier de l'utilisateur avant de commencer la recherche d'un mot. Donc, nous identifions le profil langagier de l’utilisateur afin d'identifier les erreurs fréquentes dues aux interférences phonétiques liées à sa langue. Dans notre projet, nous nous sommes focalisés sur deux langues (L1) : l'arabe maghrébin et l’espagnol, mais aussi sur certaines confusions fréquentes en français.

Ressources et bibliothèques pour le Dicophone

- Le dico_frwiktionary : un dictionnaire phonétisé de la ressource Wikiphon permettant d’accéder aux mots orthographiés à partir de leurs transcriptions phonétiques.

- Le DEM : le Dictionnaire Electronique des Mots comportant les définitions des mots orthographiques.

Remarque : le choix des deux dictionnaires enregistrés séparément s’est fait pour pouvoir, éventuellement les permuter  avec d’autres ressources.  

- Ressources selon le profil langagier : nous avons construit des ressources pour identifier les confusions fréquentes des phonèmes en français, ainsi que les erreurs typiques des utilisateurs hispanophones et arabophones lors de l’apprentissage du FLE.

- Bibliothèque Tkinter : pour réaliser l’interface graphique.

- Bibliothèque Winsound : pour l’ajout des sons correspondant aux phonèmes.

Fonctionnalités du Dicophone

F1 : On demande à l’utilisateur de choisir sa langue maternelle (l’arabe maghrébin ou l’espagnol). Le français constitue la langue principale du Dicophone.

F1.jpg

F2 : L’utilisateur peut saisir le mot recherché en écrivant chaque phonème dans une case (grâce au bouton « ajouter un phonème ») à partir du clavier API ou en saisissant le mot dans une seule case.

F3 : L’utilisateur a la possibilité d’écouter la prononciation du phonème ou de voir un exemple d’un mot contenant ce même phonème saisi à partir du clavier, en cliquant sur le bouton « info ».

F4 : Lorsque l’utilisateur appuie sur le bouton « valider », une autre fenêtre s’affiche pour donner la définition du mot recherché. Il peut alors avoir une liste de mot ayant une prononciation similaire à celle du mot saisi par ce dernier.

F5 : L’utilisateur peut faire une saisie partielle du mot recherché en ajoutant :

  • « ? » lorsqu’il a un doute sur la présence d’un phonème tapé.
  • « / » pour ajouter un phonème alternatif.
  • « . » pour rechercher un phonème inconnu.
F4.png

F6 : Si F1 ne trouve pas de résultats, cette fonctionnalité (F6) va identifier l’erreur d’un phonème saisie par l’utilisateur en le comparant aux différentes confusions du fichier ressource_fr.

F7 : Sinon, si F1 et F6 ne donnent pas de résultats, F7 identifie l’erreur saisie par l’utilisateur selon le profil langagier de l’utilisateur et va la comparer aux différentes erreurs des fichiers ressource_ar (arabe maghrébin) ou ressource_es(espagnol).

F9.png

F8 : L’utilisateur peut également cliquer sur le bouton « suggestion » à tout moment, s’il ne connaît pas le mot recherché. Le programme va alors lui proposer au maximum 10 entrées phonologiques du Dicophone.

Les difficultés rencontrées

  • Nous avons rencontré des difficultés au niveau de la combinaison des différentes fonctionnalités proposées pour le Dicophone. Lorsque l’outil rencontre plusieurs types d’erreurs, il ne retrouve pas le mot recherché, même si ce mot figure dans le dictionnaire. Par exemple, le Dicophone peut trouver le mot « tre » au lieu de « tʁɛ » mais ne trouve pas le mot « t./ ɛe ».
  • Nous avons également tenté un recoupement des clés du frwikitionary avec celles du dico DEM afin de ne garder que celles existantes dans les deux dictionnaires. Toutefois, ce traitement prenait beaucoup de temps, car il fallait s’assurer que chaque clé du dictionnaire frwiktionary (comportant 1M4 clés) figure bien dans le dictionnaire DEM.
  • Partant du principe que toutes les entrées d’un dictionnaire sont sous forme de lemmes, nous avons fait une tentative de réaliser un lemmatiseur pour notre dictionnaire phon, qui lui, comprend les mots transcrits phonétiquement comme clés et les mots transcrits orthographiquement (parfois fléchis) comme valeurs. Nous avons voulu lemmatiser les valeurs du dictionnaire phon avec la librairie Spacy et NLTK sous python. Le test du lemmatiseur avec Spacy était trop lent à l’exécution du programme, quant à NLTK, nous n’avons trouvé que le lemmatiseur pour le modèle anglais.
  • Une autre fonctionnalité que nous avions souhaité ajouter à notre outil, était celle d’une recherche par paires minimales. Seulement, cette fonctionnalité générait des erreurs en suggérant un nombre important de mots à l’utilisateur. Cette fonctionnalité était plus difficile à gérer pour nous, au vu du délai de rendu de ce projet.

Prise de recul : amélioration et extension du projet

Le projet du Dicophone pourrait être élargi en lui rajoutant d’autres langues comme ressources L1, afin de tenir compte des difficultés des apprenants du FLE. La fonctionnalité de la recherche du mot par paire minimale aurait été intéressante, dans le sens où celle-ci aurait potentiellement couvert une majorité d’erreurs à elle seule. Malheureusement, les tests que nous avons faits pour cette fonctionnalité ont produit beaucoup de bruits. Cette fonctionnalité demanderait une machine possédant une grande capacité de calcul.

Nous avions souhaité faire une association d’images aux entrées du Dicophone en recourant à la technique du Web scraping, mais cette fonctionnalité demande une réflexion plus fine, car il est difficile d’associer une image à certains mots d’une langue. Enfin, une autre fonctionnalité aurait été intéressante dans le cadre de ce projet, faire un quiz à partir des mots recherchés par l’utilisateur. En sauvegardant les mots recherchés par l’utilisateur dans un fichier, ce dernier pourrait s’entraîner à partir de l’outil Dicophone. Il réécrit les mots précédemment recherchés en API afin d’améliorer son orthographe, mais encore, il donne la définition du mot tiré au hasard par le Dicophone pour enrichir son vocabulaire.

Notre outil n’est pas complet, néanmoins il offre la possibilité de consulter un dictionnaire par entrée phonologique avec quelques fonctionnalités pour la saisie partielle d’un mot recherché.

Enfin, l’utilisation du Dicophone pourrait avoir des enjeux pédagogiques pour être utilisé dans une classe de FLE/FLS afin de travailler la phonétique avec les apprenants. Il pourrait également être inclus à une application e-learning, pour un usage personnel (lors d’un séjour linguistique, par exemple).

Références bibliographiques

  • Dictionnaire Électronique des Mots :

- http://rali.iro.umontreal.ca/rali/?q=fr/versions-informatisees-lvf-dem

- https://www.modyco.fr/fr/base-documentaire/ressources/jean-dubois.html

- https://talep.lis-lab.fr/FondamenTAL/

  • Ressources langagières arabe et espagnole :

- https://lgidf.cnrs.fr/node/10

- https://www.ert.tn/ien_MeM/wp-content/uploads/2013/10/Interferences_langagieres_francais_arabe.pdf

- https://lgidf.cnrs.fr/sites/lgidf.cnrs.fr/files/images/phono_espagnol_0.pdf

- http://flecampus.ning.com/forum/topics/prononciation-fle-difficult-s?overrideMobileRedirect=1