IPADIC
De GBLL, TAL, ALAO, etc.
- https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7MWVlSDBCSXZMTXM
- File:IPADIC_UTF8_csv.zip
C'est un dictionnaire utilisé par un des bons analyseurs morphosyntaxiques. Les fichiers concernés sont au format csv, ré-encodé en UTF-8.
structure
Chaque fichier porte une grande catégorie grammaticale comme suit :
Catégorie | en japonais | ex, notes | Explications |
---|---|---|---|
Verbe | 動詞 | - | Se fléchit avec verbes auxiliaires et postpositions. |
Adjectif | 形容詞 | - | Se fléchit avec verbes auxiliaires et postpositions. Le lemme finit par i い. |
Verbe auxiliaire | 助動詞 | vouloir, pouvoir, sembler, etc. | Suivent un verbe conjugué. Le verbe auxiliaire lui-même aussi se fléchit quand il est suivi d'un autre verbe auxiliaire ou d'une postposition. |
Nom adjectival | 形容動詞 | dit adjectif en -na な (= qui finit par na) ou adjectif nominal | Se fléchit (ou non) en fonction du type du mot qui suit. |
Nom suivi de nai | 名詞,ナイ形容詞語幹 | nai = il n'y a pas, ne pas exister | Peut s'utiliser tout seul ou suivi de nai. Ce nai se fléchit en fonction du mot qui suit. |
Nom verbal | 名詞,サ変接続 | - | Peut s'utiliser tout seul ou suivi du verbe suru faire qui peut se fléchir. |
Postposition | 助詞 | Particules | Certains suivent les verbes, les adjectifs, les noms adjectivaux, les verbes auxiliaires. |
Postposition - collocation | (助詞 – 格助詞 – 連語) | Locution verbale (ex. à propos de) | Collocation formée par des particules principales et un verbe. |
Adverbe | 副詞 | - | Pas de flexion. |
Nom adverbal | 名詞,副詞可能 | dimanche, après-midi, ... | Noms utilisables comme adverbes. |
Nom démonstratif | 名詞,代名詞 | Pronom | Pas de flexion. |
Nom | 名詞 | ||
Nom - autres | 名詞 非自立 | ?? | |
Nom - chiffres | 名詞,数 | mille, million, billion, un, deux, trois,... | Concerne les kanji. |
Adnominal | 連体詞 | ano あの (ce) | Pas de flexion. Ne qualifient que les noms. |
Conjonction | 接続詞 | mais, ensuite, ... | Pas de flexion. |
Interjection | 間投詞 / 感動詞 | bonjour, merci.../eh, ah... | Quelques salutations / interjections |
Préfixe | 接頭詞 | par heure, anti-,... | Précède le nom ou le chiffre. |
Suffixe | 接尾詞 | compteur etc. | Pas de flexion. |
À part ces catégories, il y a aussi le filler (comme bah, eh, etc.), le nom de personne, d'organisation et de lieu, le nom propre, les "autres" (écrits en un seul hiragana qui sont classés en interjection) et les symboles (comme les parenthèses) qui ne sont pas pertinents aux objectifs linguistiques visés.
Dedans il y a 13 colonnes :
Forme lexicale | ID du contexte | Indice de fréquence | Catégorie grammaticale | Sous-catégorie grammaticale | Classe de conjugaison | Forme de conjugaison | Lemme | Transcription | Prononciation | |||
gauche | droite | 1 | 2 | 3 | en katakana |
- Catégorie grammaticale : adjectif, adverbe, adnominal, verbe auxiliaire, verbe, conjonction, interjection, nom, postposition et préfixe (+ filler et symbole).
- Sous-catégorie grammaticale : catégorie grammaticale plus en détail.
- Classe de conjugaison : groupes/types de mots variants selon la façon de conjugaison, comme le groupe des verbes -er, -ir, etc. en français.
- Forme de conjugaison : 5 formes (en principe) différant en fonction de mode grammatical (la voix, le temps, l'aspect et la déférence). En français le verbe se conjugue en fonction de sujets ; en japonais c'est selon le mode grammatical.
Règles de flexion & formes fléchies dans le IPADIC
En japonais, ce sont
- les verbes,
- les adjectifs nominaux et verbaux,
- les verbes auxiliaires (suffixes fonctionnels) et
- la copule (mot qui relie le sujet au prédicat[1])
qui se fléchissent (Delteil et al., 2006)[2].