Actions

Ressources

« Français » : différence entre les versions

De GBLL, TAL, ALAO, etc.

Aucun résumé des modifications
Aucun résumé des modifications
 
Ligne 9 : Ligne 9 :
* [https://repository.ortolang.fr/api/content/morphalou/2/LISEZ_MOI.html Morphalou], Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff)
* [https://repository.ortolang.fr/api/content/morphalou/2/LISEZ_MOI.html Morphalou], Lexique morphologique ouvert du français (Morphalou3 comprend 159 271 lemmes et 954 690 formes fléchies; fusion de Morphalou 2, DELA, Dicollecte, Lefff, LGLex et LGLexLefff)
* [https://eduscol.education.fr/186/liste-de-frequence-lexicale Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)]
* [https://eduscol.education.fr/186/liste-de-frequence-lexicale Liste de fréquence lexicale EDUSCOL (1500 lemmes, fréquence basée sur textes d'école)]
* [https://inframorph.github.io/ Inframorph et son lexique de 50K mots avec nb syllabes, phonèmes, rimes, indices complexité phonie-graphie etc.]


== Corpus de textes ==
== Corpus de textes ==

Dernière version du 9 août 2023 à 03:17

Analyse morphosyntaxique

Ressources lexicales

Corpus de textes

  • ORTOLANG, mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée)
  • ORFEO, Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié
  • Frantext, 258 millions de mots (une partie est accessible gratuitement dans ORFEO)
  • UniTex/GramLab
  • 88milSMS, +88 000 sms récoltés à Montpellier en 2011
  • GeoPo, articles géopolitiques 270 000 mots