« Français » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
|||
Ligne 11 : | Ligne 11 : | ||
* [https://www.ortolang.fr/ ORTOLANG], mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée) | * [https://www.ortolang.fr/ ORTOLANG], mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée) | ||
* [https://www.ortolang.fr/market/corpora/cefc-orfeo ORFEO], Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié | * [https://www.ortolang.fr/market/corpora/cefc-orfeo ORFEO], Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié | ||
* [https://www.frantext.fr/ Frantext], 258 millions de mots (une partie est accessible dans ORFEO) | * [https://www.frantext.fr/ Frantext], 258 millions de mots (une partie est accessible gratuitement dans ORFEO) | ||
* [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | * [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | ||
* [http://88milsms.huma-num.fr/index.html 88milSMS], +88 000 sms récoltés à Montpellier en 2011 | * [http://88milsms.huma-num.fr/index.html 88milSMS], +88 000 sms récoltés à Montpellier en 2011 | ||
* [http://redac.univ-tlse2.fr/corpus/geopo.html GeoPo], articles géopolitiques 270 000 mots | * [http://redac.univ-tlse2.fr/corpus/geopo.html GeoPo], articles géopolitiques 270 000 mots |
Version du 21 novembre 2020 à 13:56
Analyse morphosyntaxique
Ressources lexicales
- WikiPhon, lexique phonétisé extrait du Wiktionnaire (1 414 635 mots et expressions, avec plusieurs transcriptions possibles par mot le cas échéant)
- Lexique.org v381 (142 691 mots)
- Lexique.org, lexique phonétisé seul, en API
- LEFFF, lexique de formes fléchies du français
Corpus de textes
- ORTOLANG, mine d'or pour les corpus francophones mais pas seulement (472 ressources, 8,3 To de données, langue écrite, orale et signée)
- ORFEO, Corpus d'Étude pour le Français Contemporain (CEFC) oral:450h, 2500locuteurs ; écrit:6millions de mots. Très diversifié
- Frantext, 258 millions de mots (une partie est accessible gratuitement dans ORFEO)
- UniTex/GramLab
- 88milSMS, +88 000 sms récoltés à Montpellier en 2011
- GeoPo, articles géopolitiques 270 000 mots