Ressources:Arabe
De GBLL, TAL, ALAO, etc.
Corpus de textes
- UniTex/GramLab
- Multi-Arabic Dialect Applications and Resources (MADAR) Project
- Arap-Tweet: A Large Multi-Dialect Twitter Corpus for Gender, Age and Language Variety Identification (2.4M tweets, 11 régions, 16 pays, 1100 utilisateurs, avec âge, genre, dialect)
Lexiques
Phonétiseurs
- http://www.tahadz.com/mishkal (en ligne, téléchargeable ici http://www.tahadz.com/mishkal/download)
- https://www.ali-soft.com/ (en ligne)
- Tashkil (Aljazeera Media Institute) (en ligne)
Translittération et normalisation
Analyseurs syntaxiques
- Madamira (Standard Arabic, Egyptian Arabic) 2014 (en ligne, utilisable en stand alone (Java) gratuit pour utilisation universitaire)
- AraBERT
- Multi-dialect-Arabic-BERT