« Français » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(3 versions intermédiaires par le même utilisateur non affichées) | |||
Ligne 7 : | Ligne 7 : | ||
* [https://gricad-gitlab.univ-grenoble-alpes.fr/pedagogies-multimodales/lexiques-phonetises Lexique.org, lexique phonétisé seul, en API] | * [https://gricad-gitlab.univ-grenoble-alpes.fr/pedagogies-multimodales/lexiques-phonetises Lexique.org, lexique phonétisé seul, en API] | ||
* [https://www.labri.fr/perso/clement/lefff/ LEFFF], lexique de formes fléchies du français | * [https://www.labri.fr/perso/clement/lefff/ LEFFF], lexique de formes fléchies du français | ||
* [https://repository.ortolang.fr/api/content/morphalou/2/LISEZ_MOI.html Morphalou], Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff) | |||
* [https://eduscol.education.fr/186/liste-de-frequence-lexicale Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)] | |||
* [https://inframorph.github.io/ Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.] | |||
== Corpus de textes == | == Corpus de textes == | ||
* [https://www.ortolang.fr/ ORTOLANG], mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée) | * [https://www.ortolang.fr/ ORTOLANG], mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée) | ||
* [https://www.ortolang.fr/market/corpora/cefc-orfeo ORFEO], Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié | * [https://www.ortolang.fr/market/corpora/cefc-orfeo ORFEO], Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié | ||
* [https://www.frantext.fr/ Frantext], 258 millions de mots (une partie est accessible dans ORFEO) | * [https://www.frantext.fr/ Frantext], 258 millions de mots (une partie est accessible gratuitement dans ORFEO) | ||
* [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | * [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | ||
* [http://88milsms.huma-num.fr/index.html 88milSMS], +88 000 sms récoltés à Montpellier en 2011 | * [http://88milsms.huma-num.fr/index.html 88milSMS], +88 000 sms récoltés à Montpellier en 2011 | ||
* [http://redac.univ-tlse2.fr/corpus/geopo.html GeoPo], articles géopolitiques 270 000 mots | * [http://redac.univ-tlse2.fr/corpus/geopo.html GeoPo], articles géopolitiques 270 000 mots |
Dernière version du 9 août 2023 à 03:17
Analyse morphosyntaxique
Ressources lexicales
- WikiPhon, lexique phonétisé extrait du Wiktionnaire (1 414 635 mots et expressions, avec plusieurs transcriptions possibles par mot le cas échéant)
- Lexique.org v381 (142 691 mots)
- Lexique.org, lexique phonétisé seul, en API
- LEFFF, lexique de formes fléchies du français
- Morphalou, Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff)
- Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)
- Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.
Corpus de textes
- ORTOLANG, mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée)
- ORFEO, Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié
- Frantext, 258 millions de mots (une partie est accessible gratuitement dans ORFEO)
- UniTex/GramLab
- 88milSMS, +88 000 sms récoltés à Montpellier en 2011
- GeoPo, articles géopolitiques 270 000 mots