« Français » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 9 : | Ligne 9 : | ||
* [https://repository.ortolang.fr/api/content/morphalou/2/LISEZ_MOI.html Morphalou], Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff) | * [https://repository.ortolang.fr/api/content/morphalou/2/LISEZ_MOI.html Morphalou], Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff) | ||
* [https://eduscol.education.fr/186/liste-de-frequence-lexicale Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)] | * [https://eduscol.education.fr/186/liste-de-frequence-lexicale Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)] | ||
* [https://inframorph.github.io/ Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.] | |||
== Corpus de textes == | == Corpus de textes == |
Dernière version du 9 août 2023 à 03:17
Analyse morphosyntaxique
Ressources lexicales
- WikiPhon, lexique phonétisé extrait du Wiktionnaire (1 414 635 mots et expressions, avec plusieurs transcriptions possibles par mot le cas échéant)
- Lexique.org v381 (142 691 mots)
- Lexique.org, lexique phonétisé seul, en API
- LEFFF, lexique de formes fléchies du français
- Morphalou, Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff)
- Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)
- Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.
Corpus de textes
- ORTOLANG, mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée)
- ORFEO, Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié
- Frantext, 258 millions de mots (une partie est accessible gratuitement dans ORFEO)
- UniTex/GramLab
- 88milSMS, +88 000 sms récoltés à Montpellier en 2011
- GeoPo, articles géopolitiques 270 000 mots