« Arabe » : différence entre les versions
De GBLL, TAL, ALAO, etc.
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 12 : | Ligne 12 : | ||
* [https://learning.aljazeera.net/fr/pages/%D8%AA%D8%B4%D9%83%D9%8A%D9%84-vocalization Tashkil (Aljazeera Media Institute)] (en ligne) | * [https://learning.aljazeera.net/fr/pages/%D8%AA%D8%B4%D9%83%D9%8A%D9%84-vocalization Tashkil (Aljazeera Media Institute)] (en ligne) | ||
== Translitération == | == Translitération et normalisation == | ||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020)] | * [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | ||
== Analyseurs syntaxiques == | == Analyseurs syntaxiques == | ||
Ligne 21 : | Ligne 21 : | ||
== Identification du dialecte == | == Identification du dialecte == | ||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020)] | * [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | ||
* [https://github.com/UBC-NLP/aranet AraNet (2020) (Python)] | |||
== Reconnaissance des sentiments == | == Reconnaissance des sentiments == | ||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020)] | * [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] | ||
* [https://github.com/UBC-NLP/aranet AraNet (2020) (Python)] | |||
== Reconnaissance des entités nommées (NER) == | == Reconnaissance des entités nommées (NER) == | ||
* [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020)] | * [https://github.com/CAMeL-Lab/camel_tools CAMeL Tools (2020) (Python)] |
Version du 15 juillet 2021 à 17:47
Corpus de textes
- UniTex/GramLab
- Multi-Arabic Dialect Applications and Resources (MADAR) Project
- Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification (2.4M tweets, 11 régions, 16 pays, 1100 utilisateurs, avec âge, genre, dialect)
Lexiques
Phonétiseurs
- http://www.tahadz.com/mishkal (en ligne, téléchargeable ici http://www.tahadz.com/mishkal/download)
- https://www.ali-soft.com/ (en ligne)
- Tashkil (Aljazeera Media Institute) (en ligne)
Translitération et normalisation
Analyseurs syntaxiques
- Madamira (Standard Arabic, Egyptian Arabic) 2014 (en ligne, utilisable en stand alone (Java) gratuit pour utilisation universitaire)
- AraBERT
- Multi-dialect-Arabic-BERT