« Arabe » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
Aucun résumé des modifications |
||
(3 versions intermédiaires par le même utilisateur non affichées) | |||
Ligne 2 : | Ligne 2 : | ||
* [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | * [https://unitexgramlab.org/fr/language-resources UniTex/GramLab] | ||
* [https://camel.abudhabi.nyu.edu/madar/ Multi-Arabic Dialect Applications and Resources (MADAR) Project] | * [https://camel.abudhabi.nyu.edu/madar/ Multi-Arabic Dialect Applications and Resources (MADAR) Project] | ||
* [https://arap.qatar.cmu.edu/ Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification] (2.4M tweets, 11 régions, 16 pays, 1100 utilisateurs, avec âge, genre, dialect) | |||
== Lexiques == | == Lexiques == | ||
Ligne 10 : | Ligne 11 : | ||
* https://www.ali-soft.com/ (en ligne) | * https://www.ali-soft.com/ (en ligne) | ||
* [https://learning.aljazeera.net/fr/pages/%D8%AA%D8%B4%D9%83%D9%8A%D9%84-vocalization Tashkil (Aljazeera Media Institute)] (en ligne) | * [https://learning.aljazeera.net/fr/pages/%D8%AA%D8%B4%D9%83%D9%8A%D9%84-vocalization Tashkil (Aljazeera Media Institute)] (en ligne) | ||
== Translittération et normalisation == | |||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | |||
== Analyseurs syntaxiques == | |||
* [https://camel.abudhabi.nyu.edu/madamira/ Madamira (Standard Arabic, Egyptian Arabic) 2014] (en ligne, utilisable en stand alone (Java) gratuit pour utilisation universitaire) | |||
* [https://github.com/aub-mind/arabert AraBERT] | |||
* [https://github.com/mawdoo3/Multi-dialect-Arabic-BERT Multi-dialect-Arabic-BERT] | |||
== Identification du dialecte == | |||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | |||
* [https://github.com/UBC-NLP/aranet AraNet (2020) (Python)] | |||
== Reconnaissance des sentiments == | |||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | |||
* [https://github.com/UBC-NLP/aranet AraNet (2020) (Python)] | |||
== Reconnaissance des entités nommées (NER) == | |||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] |
Dernière version du 15 juillet 2021 à 17:48
Corpus de textes
- UniTex/GramLab
- Multi-Arabic Dialect Applications and Resources (MADAR) Project
- Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification (2.4M tweets, 11 régions, 16 pays, 1100 utilisateurs, avec âge, genre, dialect)
Lexiques
Phonétiseurs
- http://www.tahadz.com/mishkal (en ligne, téléchargeable ici http://www.tahadz.com/mishkal/download)
- https://www.ali-soft.com/ (en ligne)
- Tashkil (Aljazeera Media Institute) (en ligne)
Translittération et normalisation
Analyseurs syntaxiques
- Madamira (Standard Arabic, Egyptian Arabic) 2014 (en ligne, utilisable en stand alone (Java) gratuit pour utilisation universitaire)
- AraBERT
- Multi-dialect-Arabic-BERT