IPADIC
De GBLL, TAL, ALAO, etc.
Révision datée du 20 avril 2020 à 12:01 par Kusaoh (discussion | contributions)
Révision datée du 20 avril 2020 à 12:01 par Kusaoh (discussion | contributions)
- https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM
- File:IPADIC_UTF8_csv.zip
C'est un dictionnaire utilisé par un des bons analyseurs morphosyntaxiques. Les fichiers concernés sont au format csv, ré-encodé en UTF-8.
structure
Chaque fichier porte une grande catégorie grammaticale (verbe, adjectif, adverbe, ...). Dedans il y a 13 colonnes :
Forme lexicale | ID du contexte | Indice de fréquence | Catégorie grammaticale | Sous-catégorie grammaticale | Mode grammatical | Classe de conjugaison | Lemme | Transcription | Prononciation | |||
gauche | droite | 1 | 2 | 3 | en katakana |
En japonais, ce sont
- les verbes,
- les adjectifs nominaux et verbaux,
- les verbes auxiliaires et
- la copule (mot qui relie le sujet au prédicat[1])
qui se fléchissent (Delteil et al., 2006)[2].