Iles d Imesli

Appel à Numéro spécial

Iles d Imesli 07-06-2020

Appel à contribution

LE TAMAZIGHT A L’ERE DU TAL

(Date limite de soumission : 30 avril 2021)

Coordinateur : Professeur Patrice POGNAN, Institut National des Langues et Civilisations Orientales, France

Les sociétés amazighes ont considérablement évolué du fait de diverses décisions politiques au sein de Tamazgha au premier plan desquelles se trouvent la reconnaissance de la langue et les scolarisations possibles en Algérie et au Maroc. Le besoin de promotion de la langue berbère (tamazight) y est patent et il existe une prise de conscience de la nécessité de l’automatisation qui est aussi un moyen d’y parvenir.

Cette prise de conscience n’est pas le fait unique d’institutions telles que l’IRCAM à Rabat ou le laboratoire LAELA à Tizi-Ouzou, mais aussi de plus petits groupes de recherche universitaires tant au Maroc qu’en Algérie et parfois d’acteurs isolés.

L’importance du traitement automatique de l’information dans sa langue maternelle n’est plus à souligner de même que la vie d’une langue sur les réseaux est devenue un élément favorable en faveur de sa survie.

Le traitement automatique des langues (TAL) est un domaine encore jeune, puisqu’il est né avec les premiers ordinateurs. Il a cependant connu des périodes très diverses. D’abord centré sur des travaux d’ordre essentiellement syntaxique, il a eu pour domaine d’application privilégié la traduction automatique. Ce courant a été stoppé en 1965 par le rapport Alpac qui, à l’époque, a donné de facto la main à l’intelligence artificielle. Le TAL a cependant continué sa vie en se diversifiant, en général loin des grands financements tels que ceux qui ont soutenu la traduction automatique. On est ainsi passé, sans révolution visible ni résultats patents, à une situation où l’automatisation de la langue est de plus en plus omniprésente.

Depuis environ deux décennies, on assiste à un développement sans précédent des travaux sur corpus y compris pour le traitement en masse de données langagières par e-learning, puis réseaux neuronaux.

Cette direction de recherche actuellement très largement majoritaire nécessite l’existence, et donc préalablement la construction, de très grands corpus qui n’existent pas encore pour les parlers berbères (amazighs) dont la multiplicité complique la tâche.

Loin de devoir être prise comme une catastrophe, cette situation devrait promouvoir des travaux de nature nettement plus linguistique. On peut actuellement noter avec la start-up américaine GOLEM la velléité d’un retour à des travaux linguistiques avec une intelligence artificielle dite « symbolique basée sur la linguistique ».

Il semble souhaitable de pouvoir faire un état des lieux du traitement automatique de tamazight. Nous souhaitons avoir une vision large du TAL englobant des domaines connexes. Toutes les approches sont bienvenues, mais nous souhaitons mettre l’accent sur l’exploitation des méthodes, des dépouillements et des résultats en faveur de l’enseignement de la langue (grammaire, lexique).

Les propositions d’article peuvent porter sur :

- le traitement de la graphie et de la graphotaxe, y compris éditeurs de texte, lecture optique, définition de caractéristiques d’écriture favorables au traitement automatique.

- définition, création, gestion de corpus écrits et oraux, monolingues et multilingues, généraux ou spécialisés.

- lexicologie, bases de données, dictionnairique : fabrication de lexiques, de dictionnaires spécialisés ou généraux à partir de corpus, de bases de données,… ici aussi, mono ou multilingues.

- grammaires à destination du TAL, formelles ou descriptives. Cela peut concerner des travaux réalisés avec la boîte à outils de traitement automatique NOOJ.

- décomposition morphématique, recherche des racines, lemmatisation ; analyses morphologique, phonomorphologique, syntaxique, sémantique ; applications telles que conjugueurs, recherche et extraction d’informations, analyse de sentiments, indexation, résumé automatique, traduction automatique ou assistée…

- les applications à l’enseignement de la langue

- et d’une manière générale, tout traitement automatique portant sur tamazight, mais aussi sur d’autres langues. Toutes les propositions seront bienvenues et particulièrement celles portant sur des langues « peu outillées » ou des problématiques apportant des solutions potentielles au traitement de tamazight.

Quelques références :

Abdellaoui S., Bellynck V., Mangeot M., Boitet Ch.: Outillage de l’accès aux textes par la lecture active étymologique multilingue pour apprenants berbérophones et arabophones. Actes de l'atelier Traitement Automatique des Langues Africaines TALAf, conférence LTT, Grenoble, 2018
Ammari, R., Zenkouar, L., Outahajala, M.: « System of Analysis and Generation for Amazigh Nominal Morphology based on Xerox’s Finite State tranducer », Procedia Computer Science, 117, 2017.
Annouz H. : « Construction d’un dictionnaire électronique des flexions verbales du kabyle à l’aide du logiciel NOOJ (Verbes primaires) », Revue des études berbères vol. 9, Paris, 2013.
Annouz H. : « Traitement morphologique des formes verbales dérivées du kabyle à l’aide du logiciel NooJ », Revue des études berbères vol. 10, Paris, 2015.
Annouz H. : « Tests de désambiguïsation pour la reconnaissance des unités homographes », Conférence internationale NOOJ, Palerme, 2018.
Ataa Allah, F.: «Finite-state transducer for Amazigh verbal morphology », Digital Scholarship in the Humanities, 31(1), 2014.
Ataa Allah F., Boulaknadel S. : « Pseudo-racinisation de la langue amazighe », TALN, Montréal, 2010.
Ataa Allah, F. et Boulaknadel, S. : « Amazigh Verb Conjugator», LREC, Reykjavik, 2014.
Ataa Allah, F., Miftah, N.: « The First Parallel Multi-Lingual Corpus of Amazigh », International Journal of Engineering Research and Applications, Vol. 8, Issue 6 (V), 2018.
Boukherrouf R., Tigziri N. : « Base de données kabyles : collectes de données et applications. Synchronisation texte / son », Revue Iles d Imesli n° 07, Tizi-Ouzou, 2015.
Boulaknadel, S., Ataa Allah, F.: « Building a standard Amazigh corpus », in IHCI, Prague, 2012.
Enguehard C., Mangeot M. : « DILAF : des dictionnaires africains en ligne et une méthodologie ».
Enguehard, C., Modi I.: « Towards an electronic dictionary of Tamajaq language in Niger ». EACL-09 W07 Workshop Language Technologies for African Languages. Athènes, 2009.
Fadili H. : « une approche de construction d’un wiktionnaire sémantique et multilingue des SHS, en vue de son intégration dans le Web des données ouvertes (Linked Open Data) », TICAM, 2014.
Fadili H. : « Le Machine Learning : numérique non supervisé et symbolique peu supervisé, une chance pour l’analyse sémantique automatique des langues peu dotées », TICAM, Rabat, 2016.
Ferroudja K. : « La grammaire de la préposition « d » avec le logiciel Nooj ». Revue des études berbères vol. 9, Paris, 2013.
Guerrab S. : « Analyse dialectométrique des parlers berbères de Kabylie », thèse de doctorat INALCO, Paris, 2014.
Kessai F. : « Dictionnaire électronique de Berbère Général », Revue des études berbères vol. 10, Paris, 2015.
Kessai F. : « Elaboration d’un dictionnaire électronique de berbère avec annotations étymolo-giques ». Thèse de doctorat INALCO, Paris, 2018
Lafkioui M. : Atlas linguistique des variétés berbères du Rif. Rüdiger Koeppe Verlag, Cologne, 2007.
Lafkioui M. : « Analyses dialectométriques du lexique berbère du Rif ». Dymitr Ibriszimow ; Rainer Vossen; Harry Stroomer. Essais lexicologiques et lexicographiques et autres articles, Rüdiger Koeppe Verlag, Cologne, 2009.
Miftah N. et al.: « sentence-aligned parallel corpus Amazigh-English», international conference on information and communication systems, Irbid, 2017.
Moukrim, S. : Morphosyntaxe et sémantique du « présent » : une étude contrastive à partir de corpus oraux, arabe marocain, berbère tamazight et français (ESLO/LCO), Thèse de doctorat, Orléans, 2010.
Moukrim, S. : « Le DictAm: Dictionnaire électronique des verbes amazighs-français », TALN'2012, Grenoble, 2012.
Moukrim, S. : « Traitement automatique de l’amazighe : l’annotation des phénomènes liés à l’oralité », SITACAM’13 the third international symposium on Automatic Amazigh processing, Béni Mellal, 2013.
Naït-Zerrad K. : Manuel de conjugaison kabyle, L'Harmattan, Paris, 1994. https://www.amyag.com/
Naït-Zerrad K : tajeŗŗumt n tmaziγt tamirant (taqbaylit), ENAG, Alger, 1995.
Naït-Zerrad K. : Linguistique berbère et applications, L'Harmattan, Paris, 2004.
Nejme F. Z., Boulaknadel S., Aboutajdine D. : « Analyse automatique de la morphologie nominale amazighe », Atala, TALN-Recital 2013.
Nejme, F.Z. Boulaknadel S, Aboutajdine D.: « AmAMorph: Finite State Morphological Analyzer for Amazighe », Journal of Computing and Information Technology, 2016.
Outahajala, M. et al.: « Tagging Amazigh with AnCoraPipe », HLT & NLP Workshop, Malte, 2010.
Pierrel J.-M. : Ingénierie des langues, Hermès sciences, Paris, 2000.
Pognan P., Taïfi M.: Un dictionnaire en tant que corpus: traitements informatiques du dictionnaire raisonné berbère – français de Miloud Taïfi. 4ème atelier international sur l’amazighe et les TIC. IRCAM, Rabat, 2011.
Pognan P., Sadi N., Fitas R., Salhi M.-A., Achour R.: « Analyse morphologique automatique du kabyle. Traitement de l’affixation. Présentations linguistique et algorithmique », 10^ème Bafrale, Bayreuth, 2018.
Silberztein M. et Tutin A. : « NooJ : Un outil TAL de corpus pour l’enseignement des langues et de la linguistique ». Journée ATALA TAL et apprentissage des langues, 2004.
Taghbalout, I., Ataa Allah, F., El Marraki, M.: « Towards UNL based machine Translation for Moroccan Amazigh language », International journal of computational Science and engineering, 2017.
Talha, M., Boulaknadel S, Hammouch, A.: « A brief Survey on Named Entity Recognition in Amazigh language », International Journal of Scientific & Engineering Research, Vol 9, Issue 8, 2018.
Tigziri N. : « Les corpus oraux : essai de segmentation automatique », TICAM, Rabat, 2012.
Tigziri N. : « Présentation de l’Atlas linguistique parlant de l’amazigh avec synchronisation texte/son », in 10^ème Bafrale, Bayreuth, 2018.
Tigziri N., Boukherrouf R. : « Base de données de corpus oraux : applications », The 3rd International Conference on Business Intelligence, Beni Mellal, 2017.
Villard M. : « Traduction automatique et recherche cognitive », Histoire Epistémologie Linguistique n° 11-I, Paris, 1989.
Yamouni F. : « Analyse syntaxique automatique en tamazight (Kabyle) », TICAM, Rabat, 2016.

Date de publication : juin 2020

::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

Appel à contribution

Le berbère (ou L’AMAZIGHE) : études diachroniques

Coordinateur : Professeur Abdelaziz ALLATI, Université de Tanger-Tétouan, Maroc

Date limite de soumission : 15 octobre 2021

Publication du volume : 31 décembre 2021

Les études diachroniques berbères connaissent un regain d’intérêt ces dernières années. On espère que cela va rattraper le retard qu’elles accusent et qui est dû à plusieurs facteurs. On signale notamment l’absence de documents écrits anciens appartenant aux différents stades évolutifs de cette langue millénaire. Etant donné leur type (des inscriptions funéraires ou votives), le type de données linguistiques qu’elles contiennent (essentiellement des anthroponymes, des ethnonymes et des noms de fonction) et la difficulté que présente leur exploitation (graphie consonantique, absence de séparation des mots…), les inscriptions libyques ne nous ont fourni jusqu’à présent que quelques renseignements phonético-phonologiques, grammaticaux et lexicaux sur le berbère antique (genre, nombre, quelques catégories/classes morphologique actuelles dont le nom et le verbe, etc.). De plus, elles ne couvrent qu’une période relativement courte de l’histoire du berbère (dix siècles : -500 av. J.-C. / +500 J.-C.) et concernent essentiellement une partie de l’Afrique du Nord (Nord de Tunisie, de Constantine et du Maroc) où l’influence punique était profonde. Quant aux sources médiévales (phrases ou fragments de phrases, toponymes… (cf. El Bekri), et d’autres documents d’origine almohade, ibadite…), elles recèlent un stade du berbère qui est très proche de son état actuel auquel est presque identique de celui dans lequel sont écrits les documents du sud du Maroc qui remontent jusqu’au XVIe siècle.

Jusqu’au début des années vingt du siècle passé, les études diachroniques berbères s’étaient intéressées essentiellement à l’apparentement de cette langue. En l’intégrant dans la forme classique de la famille afro-asiatique ou chamito-sémitique (sémitique, égyptien, berbère et couchitique), Marcel Cohen (1924) l’a placée dans le cadre de sa conception des études diachroniques afro-asiatiques. Ce cadre projette les éléments structurels prédominants dans le stade ancien du sémitique dans lequel sont écrits les textes akkadiens, ougaritiques, etc. (IIIe millénaire av. J.C.) sur le stade proto-afro-asiatique[1] dont auraient évolué les autres groupes de cette famille[2]. Les divergences qui les caractérisent seraient dues à la perte d’une partie de leur héritage proto-afro-asiatique, à l’altération plus ou moins profonde de la partie qui en reste et aux éléments développés localement.

Suivant cette conception sémitisante de l’afro-asiatique, les berbérisants (Basset, Galand, Prasse…) distinguent deux stades dans l’évolution de cette langue. À son fond historique, se trouve le stade pré-berbère dont les éléments correspondraient à ceux qui sont prédominants dans le stade du sémitique dans lequel sont écrits les documents anciens et qui sont postulés proto-afro-asiatiques (cf. ci-dessus). La méthode de reconstruction de ce stade est la comparaison avec le sémitique (cf. M. Cohen, 1947).

Vient ensuite le stade berbère pendant lequel cette langue aurait connu, outre le processus évolutif poursuivant l’altération de son héritage afro-asiatique, des évolutions spécifiques qui ont généré ses différentes variétés modernes et actuelles. Les comparaisons interdialectales permettent de déterminer la partie pan-berbère ou commune à ces variétés, que Basset et ses disciples ont prise / prennent pour leur noyau dur et, donc, pour leur fond historique ou leur stade le plus ancien ou encore le proto-berbère dont elles auraient évolué. La seule variante de cette conception sémitisante de la diachronie du berbère concerne ce stade et est promulguée par Prasse (1972 – 1974) qui considère que le stade proto-berbère dont auraient évolué les variétés berbères actuelles est non leur partie commune ou pan-berbère, mais le touareg (tahaggart). Les travaux de reconstruction du stade berbère se limitent presque aux genèses des éléments berbères spécifiques que cette langue aurait développés dont, par exemple, les marques initiales du nom, les préverbes rad, ad…, l’aoriste intensif, la négation, les noms de parenté, etc.

Par ailleurs, la méthode de reconstruction interne qui se fonde sur l’analyse des vestiges des stades antérieurs fossilisés / conservés dans les éléments irréguliers attestés dans le berbère, constitue un autre cadre où sont également réalisés plusieurs travaux.

Outre l’état des lieux des études diachroniques berbères, un intérêt particulier sera accordé aux nouvelles propositions de reconstruction dont notamment celles qui ouvrent de nouvelles perspectives de recherche dans ce domaine. Nous proposons les axes principaux suivants, mais toutes les propositions portant sur la diachronie de cette langue sont les bienvenues.

Renseignements sur les stades antérieurs du berbère (inscriptions antiques (libyques), sources médiévales et modernes, matériel toponymique…);
Les fondements des reconstructions proposées;
Reconstruction du berbère et méthode historicocomparative;
Reconstruction du berbère et conception sémitisante de l’afroasiatique;
Reconstruction du berbère et comparaisons afroasiatiques;
Reconstruction du berbère et comparaisons interdialectales;
Reconstruction du berbère et méthode de reconstruction interne;
Reconstruction du berbère et les variétés touarègues;
Reconstruction du berbère et le guanche;
Reconstruction du berbère et les langues anciennes du pourtour de la Méditerranée;
Reconstruction du berbère : éléments internes et facteurs externes (sociopolitiques, socioéconomiques, etc.);
Reconstruction des éléments phonético phonologiques;
Reconstruction des éléments morphologiques;
Reconstruction des éléments syntaxiques;
Reconstruction des éléments lexicosémantiques.

Date de publication : février 2021

Date limite de soumission : 15 octobre 2021

Email de contact : revue.ilesdimesli@ummto.dz

Pour soumettre un article, cliquer sur ce lien : https://www.asjp.cerist.dz/en/PresentationRevue/397

Publication du volume : 31 décembre 2021.

[1] « L’état connu par le sémitique est aussi l’état chamito-sémitique.» (M. Cohen, 1947 : 59).

[2] Le tchadique et l’omotique ont été laissés à part parce qu’ils sont structurellement différents de cette base historique sémitique. Ils y sont intégrés respectivement par Greenberg (1955, 1966) et Diakonoff (1988).

Date limite de soumission: 15-10-2021

Email de contact: revueilesdimesli@gmail.com

Pour soumettre un article cliquer sur ce lien: https://www.asjp.cerist.dz/en/submission/397