Ressources:Français
De GBLL, TAL, ALAO, etc.
Analyse morphosyntaxique
Ressources lexicales
- WikiPhon, lexique phonétisé extrait du Wiktionnaire (1 414 635 mots et expressions, avec plusieurs transcriptions possibles par mot le cas échéant)
- Lexique.org v381 (142 691 mots)
- Lexique.org, lexique phonétisé seul, en API
- LEFFF, lexique de formes fléchies du français
- Morphalou, Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff)
- Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)
- Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.
Corpus de textes
- ORTOLANG, mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée)
- ORFEO, Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié
- Frantext, 258 millions de mots (une partie est accessible gratuitement dans ORFEO)
- UniTex/GramLab
- 88milSMS, +88 000 sms récoltés à Montpellier en 2011
- GeoPo, articles géopolitiques 270 000 mots