Envoyer à un ami | Version à imprimer | Version en PDF

La langue arabe dans l'univers du big-data

par Fatima Haichour Ould Hocine*

La Faculté de langue et littérature arabes et langues orientales avait organisé les 11 et 12 mars 2020 à l'Université 2 Abou Al Kacem Saâdallah de Bouzaréah, un Colloque sous le thème : « La langue arabe à l'ère du numérique » sous la présidence du Professeur Amar Manâa, Recteur de l'Université 2 et du professeur Abdelhamid Allaoui, Doyen de la faculté de langue et littérature arabe et langues orientales. En tant que présidente des travaux de ce colloque auxquels participait une pléiade de spécialistes de la linguistique parmi lesquels, le professeur Abdelmadjid Selmi président du département des Sciences de la langue, directeur du Laboratoire de linguistique et phonétique, des professeurs Fatiha Lalaoui, Mohamed Laïd Rétima président du Comité scientifique et Dr Ali Kechroud.

Je saisis cette occasion en tant que linguiste pour apporter succinctement quelques éclairages sur le sujet qui traduit personnellement mon point de vue dans la trame de la thématique proposée. Je veux dire que la langue arabe est la quatrième des langues retenues dans le concert des Nations dont l'Unesco avait pris la décision lors de la session 190 de son Conseil exécutif en 2012, sur proposition de l'Assemblée.

Depuis nous remarquons son évolution et sa place à travers les mutations sociétales au regard de la révolution numérique qui imprime sa marche vers les horizons d'une langue des sciences et des technologies, elle qui fut la langue par laquelle la renaissance européenne en est inspirée. La langue arabe reprend ses lettres de noblesse.

Les Linguistes dans la nanotechnologie

La langue arabe inscrit sa démarche dans l'esprit de la rigueur et de la rationalité. Classée quatrième, la langue arabe est parmi les dix langues officielles de travail dans les instances onusiennes et les centres d'études des différents laboratoires des grandes universités dans le monde.

A l'aube de cette révolution numérique, cette langue du Coran est devenue une langue de partage à travers les réseaux sociaux (facebook, twitter, instagram, watshap, viber) dans le vaste mouvement des idées cognitives. La langue arabe de par son passé florissant de la période abbasside de l'Andalousie arabe où jadis, poètes, mathématiciens, astronomes, médecins, linguistes ont permis à la Renaissance européenne, de connaître les progrès fulgurants dans les domaines des technologies et de l'innovation.

Aujourd'hui le courrier électronique est le moyen de communication le plus simple, rapide et fiable. Il est reçu par chaque internaute et peut être sauvegardé, supprimé ou renvoyé à un tiers. Il est possible de l'imprimer ou de l'afficher sur écran. Il est un message numérique facile à copier, à envoyer ou à associer à d'autres applications.

L'arobase @ ce marqueur symbole de l'internet

L'inventeur de la boîte e-mail en 1972 par Ray Tomlison a utilisé un signe graphique que l'on nomme « arobas » @ qui est le nom d'une mesure qui vient de la langue arabe ?ar roub' c'est-à-dire le quart.

L'arobase @ a été choisi par les informaticiens comme langage, un marqueur logique. Il deviendra le symbole mondial de l'Internet. Le mot « chat » qui signifie en anglais « bavarder » utilisé par les internautes dans leurs discussions à plusieurs sur Internet en temps réel grâce à un logiciel approprié. Quant au « blog » est la contraction de web et de log. Il s'agit d'un mini-site mettant facilement en ligne, des textes, des images ou des vidéos.

Ces blogs étaient destinés à permettre aux internautes de commenter l'actualité. Sa particularité par rapport à un site web est la possibilité pour les lecteurs de réagir aux informations publiées. Les liens d'un blog vers un autre blog sont appelés les rétro-liens ou en anglais « trackback » qui peuvent constituer selon un système appelé « blogosphère ».

L'ère numérique et la nouvelle société de l'Information

L'Internet est devenu un média avec un nouveau langage, une nouvelle écriture. La langue arabe étant au rendez-vous en entrant dans l'ère numérique qui bouscule les frontières traditionnelles entre l'écrit, les données, du son et de l'image sous forme de fichiers informatiques. Nous rentrons dans la nouvelle société de l'information. C'est l'ère des médias personnalisés.

Yahoo qui est un moteur de recherche généraliste d'Internet a été fondé en 1994 par deux étudiants de l'Université de Stanford et Google fondé en 1998 par deux autres étudiants en Mathématiques de l'Université de Stanford, auteurs du moteur de recherche.

Ces deux moteurs fournissent, gratuitement, les informations à leurs publics et se rémunèrent par la publicité et leurs chiffres d'affaires. Alors le skype en est une application informatique, une technologie de téléphonie sur Internet selon le logiciel de deux fondateurs propriétaires de l'entreprise ?skype technology', en août 2003. Il existe aussi, ce que les internautes appellent YouTube, le plus célèbre des sites de partage de vidéo. Ce formidable essor est dû, en grande partie aux technologies sans fil (wifi, wimax etc?) qui ont accéléré l'extension du réseau à de nouvelles zones souvent difficiles d'accès. Les internautes pourront être connectés en permanence par leur téléphone mobile, leur ordinateur, en voiture, en train en un mot partout où l'on se trouve. Le bluetooth a été conçu pour supprimer les câbles ou les fils entre les ordinateurs, les imprimantes, les souris, les téléphones portables, les appareils photos numériques, etc?

Le nouveau langage- la Toile a révolutionné les langues

Le World Wide Web appelé web ou la toile. Pas un jour ne passe, sans que naissent des applications nouvelles, sans que le champ d'application de l'Internet se développe. Il a révolutionné les langues bien que la langue anglaise y domine en termes de langage universel sauf que la majorité des internautes se cantonnent à des échanges locaux ou nationaux qui n'abandonnent pas leur langue maternelle. Un nouveau monde entièrement décloisonné est né.

D'ailleurs Roman Jakobson établit dans la linguistique, qu'il faut aller plus loin que l'unité élémentaire apparente qu'est le mot, si l'on veut comprendre le fonctionnement d'une langue. Il faut donc prendre en compte le phonème. Claude Lévy Strauss rouvre une interrogation sur les structures élémentaires de la parenté.

Une nouvelle épistémologie technologique

Ainsi dans toutes les disciplines, une nouvelle épistémologie prend forme, fondée sur une nouvelle échelle de décomposition et la sophistication des grammaires descriptives des interactions entre les micros éléments.

Les révolutions du « printemps arabe » n'étaient-elles pas la résultante de l'action menée par les internautes appelées communément « révolution Facebook » ? C'est l'émergence d'espaces pour la liberté d'expression à l'image du mouvement « Hirak » qui a trouvé le cadre des manifestations pacifiques animées par les réseaux sociaux.

Le ?Hirak' un élan d'émancipation linguistique

La modernité devient un puissant élan d'émancipation. L'intelligence artificiel émerge des universités intelligentes, c'est-à-dire plus innovantes et donc capable de construire ces smart city grâce aux centres de recherche et développement. C'est cette génération que prépare notre université ouverte à l'universalisme, qui aura la responsabilité de promouvoir les villes intelligentes dans l'aménagement spatial de leur territoire.

On peut dire que les possibilités offertes par une langue numérique, renouvellent les modalités de création et d'innovation. C'est en quoi la langue arabe se doit d'être de son temps pour faire émerger une génération capable de rivaliser dans ce monde où domine la robotique et la nano technologie qui seront introduites dans tous les domaines de la vie. Les réseaux tissés à partir de l'exploitation d'une langue innovante qui transcende d'une manière pragmatique les valeurs de l'Internet ouvert.

La langue arabe un vecteur humaniste du droit au savoir

La langue arabe redevient comme son passé florissant des Lettres et des Sciences, un vecteur humaniste de droit au savoir, à l'éducation et au partage des connaissances et du progrès scientifique. Comme il le disait, le Président Boumediene dans son discours à Lahore, « nous voulons de notre langue arabe non pas celle de la poésie, mais celle du fer et de l'acier ». Car en définitive la révolution numérique part de cette envie d'être fière d'une langue qui façonne un type d'homme et de femme tolérant et créatif.

Des algorithmes arabes dans le dôme numérique

C?est ce qui m'a motivée pour proposer au Comité scientifique l'idée de ce colloque qui fut validé par les autorités universitaires. En guise de préambule, j'avais exprimé le fait que la langue arabe peut se hisser de par la maîtrise des algorithmes en mesure d'affronter les défis de la révolution numérique. La langue arabe recèle un potentiel scientifique et un vocabulaire assez dense pour lui permettre de construire l'architecture numérique innovante. C'est pour cette raison que la problématique en question « la langue arabe à l'ère de la révolution numérique » va nous permettre de trouver les voies et moyens pour que les vocables propres au langage des T.I.C modernise le corpus morphologique ayant trait aux signes et aux concepts doivent aboutir dans ce qui va modeler le futur à savoir l'intelligence artificielle de ce XXI e siècle.

Enrichir le corpus morphologique numérique du futur

Enfin c'est autour de deux axes que notre colloque devait répondre par la contribution de nos spécialistes évoluant dans les différents laboratoires et les ?think tank' ou centres de recherche et développement.

1- Quels seront les défis auxquels la langue arabe devait faire face pour développer ses logiciels en partenariat avec les praticiens de la langue arabe, des informaticiens, des mathématiciens et les linguistes ?

2- A quelle ingénierie technologique, la langue arabe devrait réfléchir répondant à une mondialisation de signes et de lettres standardisés en adéquation avec la recherche opérationnelle ?

La langue arabe locomotive de la nanosphère

En conclusion, il serait difficile de dire quelle langue domine aujourd'hui le monde, si on considère que celle-ci devient un vecteur de communication la plus utilisée.

Selon certaines études en la matière, on recense les langues les plus parlées et répandues à travers le monde, Il se trouve que c'est la langue anglaise, langue des technologies, parlée par environ 25% de la population mondiale.

Le mandarin (Chine) est parlé par 18,05% puis l'indou avec 11,60%, la langue espagnole 6,25%, la langue russe 3,95%, la langue portugaise 3,26%, la langue française 3,05%, la langue allemande 2,7%.

La langue arabe recèle 12.302.912 mots sans répétitions alors que la langue anglaise possède 600 000 mots. Mais ce qui fait dire qu'une langue répond à des critères précis fait toujours débat entre linguistes. Le nombre de sinophones estimé de locuteurs natifs chinois est de 1,2 milliard de personnes dont 1 milliard parlant mandarin. Pour ce qui est de l'espagnol, le nombre de locuteurs natifs est 400 millions de personnes. Pour ce qui est des anglophones, il y a 360 millions de personnes dont l'anglais est langue maternelle et 1 milliard le parlent en seconde langue. Le hindi où l'Inde compte 23 langues officielles dont la principale est le hindi/ourdou.

La langue arabe, selon les données récentes, compte 250 millions d'arabophones. Le portugais qui fut un pays colonial, compte 215 millions de locuteurs natifs alors que le bengali compte 170 millions de personnes. Le russe compte 145 millions de locuteurs qui est la huitième langue la plus parlée dans le monde.

Le japonais ou yamoto compte 130 millions de locuteurs natifs et vivent au Japon. La langue japonaise combine les kanjis caractères d'origine chinoise représentant les morphèmes et les kanas qui sont syllabiques (hiraganas et katakanas). Le penjabi/lahnda tourne autour de 100 millions de locuteurs natifs au Penjab. Ainsi dans l'esprit d'un bon nombre de linguistes, il est établi des systèmes phoniques ou graphiques, morphologiques ou grammaticaux, conçus comme des réseaux de rapports de corrélations. C'est ce que précise Louis Hjelmslev dans sa contribution sur la sémantique structurale.

Une terminologie arabe adaptée au futur numérique

Par opposition aux phonèmes ou aux graphèmes aussi bien qu'aux morphèmes, les vocables ou les mots qu'on peut employer dans l'Internet peuvent changer constamment, car il y a dans un état de langue un va-et-vient de mots nouveaux, que le lexique arabe peut utiliser.

La langue arabe peut créer une terminologie simple, susceptible d'être insérée dans les différentes applications numériques. La structure de la langue numérique impose aussi des méthodes par exemple binaires pour aboutir au nouveau langage que partage toute science. C'est à ces innovations que les laboratoires des langues peuvent aboutir à une forme sémiologique capable de rendre l'expression numérique adaptée à l'évolution technologique. C'est cette rupture avec l'approche linguistique traditionnelle qui nous interpelle pour créer une autre typologie des langues à même de traduire cette évolution. Chaque siècle a apporté sa part d'innovations. La civilisation arabe peut renaître dans cette ère numérique. Dans l'ordre des idées émises de par les nuances qui séparent les différentes langues, la langue arabe retrouvera la voie de l'intelligence artificielle et du Big Data.

(*) Pr Fatima Haichour Ould Hocine - Dr en Linguistique/Sémantique - Présidente du Colloque

Bibliographie :

1- James Lane :fr babbel.com magazine 2020 Paris

2- Xavier Niel et Dominique Roux « Les 100mots de l'Internet pages 63-65» Que sais-je PUF Paris 2008.

3- Philippe Aigrain et Daniel Kaplan : « internet peut il casser des briques ? un territoire politique en jachère pages 83-86 édition Descartes et Cie paris 2006.

4- Jakobson R : « Essai de linguistique générale, Paris éditions de Minuit 1963.

5- Fatima Ould Hocine  Haichour ...

6- Louis Hjelmslev : « Essais linguistiques » éditions de Minuit- pages 105/106. Paris 1979.