IPADIC
De GBLL, TAL, ALAO, etc.
- https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM
- File:IPADIC_UTF8_csv.zip
C'est un dictionnaire utilisé par un des bons analyseurs morphosyntaxiques. Les fichiers concernés sont au format csv, ré-encodé en UTF-8.
structure
Chaque fichier porte une grande catégorie grammaticale comme suit :
Catégorie | en japonais | ex, exp. | Remarques |
---|---|---|---|
Verbe | 動詞 | ||
Adjectif | 形容詞 | Fini par i い | se fléchit avec verbes auxiliaires et postpositions. |
Adverbe | 副詞 | ||
Verbe auxiliaire | 助動詞 | ||
Nom adjectival | 形容動詞 | dit adjectif en na な | |
Nom suivi de nai | 名詞,ナイ形容詞語幹 | ||
Nom verbal | 名詞,サ変接続 | ||
Postposition | 助詞 | ||
Postposition - collocation | (助詞 – 格助詞 – 連語) | ||
Nom adverbal | 名詞,副詞可能 | dimanche, après-midi, ... | Noms utilisables comme adverbes |
Nom démonstratif | 名詞,代名詞 | ||
Nom | 名詞 | ||
Nom - autres | 名詞 非自立 | ||
Nom - chiffres | 名詞,数 | ||
Adnominal | 連体詞 | ano あの (ce) | Pas de flexion. Ne qualifient que les noms. |
Conjonction | 接続詞 | ||
Interjection | 間投詞 / 感動詞 | ||
Préfixe | 接頭詞 | ||
Suffixe | 接尾詞 |
À part ces catégories, il y a aussi le filler (comme bah, eh, etc.), le nom de personne, d'organisation et de lieu, le nom propre, les "autres" (écrits en un seul hiragana qui sont classés en interjection) et les symboles (comme les parenthèses) qui ne sont pas pertinents aux objectifs linguistiques visés.
Dedans il y a 13 colonnes :
Forme lexicale | ID du contexte | Indice de fréquence | Catégorie grammaticale | Sous-catégorie grammaticale | Mode grammatical | Classe de conjugaison | Lemme | Transcription | Prononciation | |||
gauche | droite | 1 | 2 | 3 | en katakana |
En japonais, ce sont
- les verbes,
- les adjectifs nominaux et verbaux,
- les verbes auxiliaires et
- la copule (mot qui relie le sujet au prédicat[1])
qui se fléchissent (Delteil et al., 2006)[2].