« Jumandic » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(Une version intermédiaire par un autre utilisateur non affichée) | |||
Ligne 12 : | Ligne 12 : | ||
|rowspan=2|Sous-catégorie grammaticale | |rowspan=2|Sous-catégorie grammaticale | ||
|rowspan=2|Classe de conjugaison | |rowspan=2|Classe de conjugaison | ||
|rowspan=2| | |rowspan=2|Base de conjugaison | ||
|rowspan=2|Lemme | |rowspan=2|Lemme | ||
|rowspan=2|Transcription en ''hiragana'' | |rowspan=2|Transcription en ''hiragana'' | ||
Ligne 28 : | Ligne 28 : | ||
* la description représentante des mots qui peuvent s'écrire de façon différente, | * la description représentante des mots qui peuvent s'écrire de façon différente, | ||
* ... | * ... | ||
[[Catégorie:Mémo_technique]] |
Dernière version du 25 novembre 2020 à 13:44
https://salsa.debian.org/nlp-ja-team/mecab-jumandic
Il s'agit d'un dictionnaire des morphèmes japonais. Il y a 11 colonnes au total :
Forme lexicale | ID du contexte | Indice de fréquence | Catégorie grammaticale | Sous-catégorie grammaticale | Classe de conjugaison | Base de conjugaison | Lemme | Transcription en hiragana | Information.s sémantique.s | |
gauche | droite |
La colonne des informations sémantiques comporte :
- le type du verbe (verbe du potentiel, verbe honorifique,
- la relation transitif/intransitif,
- l'antonyme,
- la catégorie sémantique (sport, humain, etc.),
- la description représentante des mots qui peuvent s'écrire de façon différente,
- ...