Actions

Ressources

« Japonais » : différence entre les versions

De GBLL, TAL, ALAO, etc.

Aucun résumé des modifications
Aucun résumé des modifications
 
(3 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
== Analyse morphosyntaxique ==
== Analyse morphosyntaxique ==
* [[MeCaB]] ([https://taku910.github.io/mecab/ doc en japonais ici], un peu [https://totoro.imag.fr/~mangeot/morphan-php.en.html en anglais ici] sur la page de Mathieu Mangeot (LIG))
* [[MeCaB]]
* [https://pypi.org/project/mecab-python3/ MeCaB-python3] (Mecab directement pour Python)
* [https://pypi.org/project/mecab-python3/ MeCaB-python3] (Mecab directement pour Python)
* [http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?JUMAN JUMAN]
* [http://nlp.ist.i.kyoto-u.ac.jp/EN/index.php?JUMAN JUMAN]
* [[Jumandic]] ([https://salsa.debian.org/nlp-ja-team/mecab-jumandic code ici])
* [[Jumandic]] ([https://salsa.debian.org/nlp-ja-team/mecab-jumandic code ici])
* [http://www.phontron.com/kytea/ KyTea]
* [http://www.phontron.com/kytea/ KyTea (python)]
* [https://spacy.io/ Spacy (Python)]  
* [https://pypi.org/project/Janome/ Janome (python)]
* [https://spacy.io/ Spacy (Python)]


== Ressources lexicales ==
== Ressources lexicales ==
Ligne 14 : Ligne 15 :
* Lexique de [[Jumandic]] ([https://salsa.debian.org/nlp-ja-team/mecab-jumandic code ici])
* Lexique de [[Jumandic]] ([https://salsa.debian.org/nlp-ja-team/mecab-jumandic code ici])
* [[IPADIC]]
* [[IPADIC]]
* [https://unidic.ninjal.ac.jp/ UniDic]
* [https://dumps.wikimedia.org/jawiki/ Dumps de Japanese Wikipedia]
* [https://dumps.wikimedia.org/jawiki/ Dumps de Japanese Wikipedia]
* Dumps du Japanese Wiktionary ([https://archive.org/details/jawiktionary-20170101 01/2017], [https://archive.org/details/incr-jawiktionary-20200710 07/2020])
* Dumps du Japanese Wiktionary ([https://archive.org/details/jawiktionary-20170101 01/2017], [https://archive.org/details/incr-jawiktionary-20200710 07/2020])
Ligne 25 : Ligne 27 :
* [http://aozora-word.hahasoha.net/index.html Aozora Bunko analysé morphosyntaxiquement] (11 176 livres);
* [http://aozora-word.hahasoha.net/index.html Aozora Bunko analysé morphosyntaxiquement] (11 176 livres);
* [https://lionbridge.ai/ja/datasets/japanese-language-text-datasets/ Lien intéressant] pour trouver des corpus en japonais;
* [https://lionbridge.ai/ja/datasets/japanese-language-text-datasets/ Lien intéressant] pour trouver des corpus en japonais;
== Corpus oraux ==
* [https://masahiro-mi.github.io/dialogue_corpus.html Liste de corpus oraux ici]

Dernière version du 27 septembre 2022 à 13:08

Analyse morphosyntaxique

Ressources lexicales

JMdict is currently distributed in two versions: a basic version in which there are only English glosses, and a full version in which there are glosses included in German (111,000 entries), Russian (77,000), Hungarian (51,000), Spanish (39,000), Italian (38,000), Dutch (29,000), Swedish (16,000), French (15,000) and Slovenian (9,000).

Corpus de textes

Corpus oraux