IPADIC
De GBLL, TAL, ALAO, etc.
C'est un dictionnaire utilisé par un des bons analyseurs morphosyntaxiques. Il est au format csv, pour le moment j'ai tout encodé en UTF-8 pour qu'on puisse utiliser (si je ne me trompe pas).
Au niveau structure, il est divisé selon les grandes catégories grammaticales. Dedans il y a 13 colonnes :
| Forme lexicale | ID du contexte | Indice de fréquence | Catégorie grammaticale | Sous-catégorie grammaticale | Mode grammatical | Classe de conjugaison | Lemme | Transcription | Prononciation | |||
| gauche | droite | 1 | 2 | 3 | en katakana | |||||||
En raison de règles grammaticales, les formes fléchies ne peuvet pas s'utiliser telles quelles (elles ne sont pas complète), mais grâce au mode grammatical et à la classe de conjugaison je suppose qu'on a des moyens de s'en sortir...