Marcel Diki-Kidiri et Atibakwa Baboya Edema
(article publié dans les Cahiers du Rifal n° 23, novembre 2003)
La révolution informatique est considérée à juste titre comme la plus grande révolution de notre ère depuis l’invention de l’imprimerie pour la communication et la diffusion de la culture du savoir et des idées. Dans quelle mesure les langues africaines participent-elles à cette révolution ? En étudiant l’usage qui est fait des langues africaines sur la Toile, on voudrait montrer la configuration de la place qu’elles y occupent.
Termes-clés : langues africaines ; sites africains ; NTIC ;
Afrique.
Annexe :
Introduction
La lutte contre la fracture numérique a été et reste l’un des
grands chantiers de la Francophonie, constamment repris de sommet en sommet.
C’est ce qui fonde les efforts consentis au sein des réseaux francophones
(notamment Rint, Riofil puis Rifal) pour apporter à leurs membres du Sud la
formation nécessaire à l’utilisation des NTICs pour développer du contenu en
français et dans les langues partenaires. L’étude présentée ici voudrait faire
le point sur la place réelle occupée par les langues africaines sur la Toile.
Elle ne concerne pas l’usage des langues africaines dans les courriers
électroniques, ni dans les forums de discussion, mais uniquement sur les sites
auxquels on peut accéder avec un navigateur ordinaire.
On estime le
nombre des langues africaines à environ 2000 dont une centaine dites
«majeures» en raison soit de leur grande diffusion soit du nombre de leur
locuteurs. Cette étude se limite à 64 langues sélectionnées parmi les plus
parlées des langues majeures, qu’elles soient de grande diffusion ou non. Pour
cela, nous avons suivi les statistiques compilées par Mathias Brenzinger, de
l’Institut für Afrikanistik (Université de Cologne), sur les 103
langues africaines majeures du XXIe siècle
I - Mode de recherche
La recherche sur la Toile a donc été menée en utilisant le
nom de chaque langue comme mot-clé. Ce qui a nous a conduits à devoir résoudre
les problèmes de dialectologie et d’écriture multiple des noms de langue.
Certaines langues se présentent avec plusieurs dialectes nettement
distingués et différemment nommés. Le cas le plus simple est celui du kirundi
et du kinyarwanda qui sont deux langues différentes du point de vue
socio-politique alors que d’un point de vue strictement linguistique, il
s’agit d’une seule et même langue. Ce cas est comparable à celui de la langue
sotho parlée au Lesotho sous l’appellation de «southern sotho» ou «sesotho» et
en Afrique du Sud sous l’appellation de «northern sotho» ou «pedi», et par
conséquent, ces deux parlers sont considérés comme deux langues différentes.
Le peul représente un cas plus complexe où le mot «peul» n’est utilisé
qu’en français pour désigner un ensemble linguistique que les Anglophones
appellent «fulani ». Les locuteurs natifs, eux, utilisent dans leurs parlers,
les termes de «fulfulde» pour les parlers allant du Mali au Tchad, «pulaar »
pour les parlers de l’ouest ( Sénégal et Mauritanie ) et enfin « pular » pour
le parler de Guinée. En dépit de ces différents parlers, les locuteurs natifs
se considèrent bel et bien comme une seule communauté linguistique et
culturelle, les Hal-Pulaar. Et bien entendu, on retrouve tous ces
termes sur la Toile ! Ce qui complexifie la recherche.
Le cas le plus
complexe est cependant celui de la langue berbère, également appelée
«amazighe». Elle comprend de très nombreux dialectes et parlers régionaux dont
les quatre plus importants sont le tamazight, le tarifit, le
tachelhit au nord du Sahara, et le touareg qui inclut le
tamachek ou tamajaq au sud du Sahara. Ces différents parlers
portent de nombreux noms qui relativisent la clarté de ces distinctions. Ce
qui démultiplie d’autant la recherche.
Notre objectif n’étant pas de
régler les problèmes identitaires entre langues et dialectes, nous relèverons
tous les sites où il est clairement question d’un parler, quel que soit son
statut. Toutefois, les sites relevés à partir de variantes purement
orthographiques seront regroupés dans un même comptage. Par exemple on
comptera ensemble les sites relatifs au hausa, hawsa, haoussa,
etc.
II - Critères de sélection
Nous avons utilisé Copernic 2001 Plus(tm) pour rechercher les
sites avec chaque nom de langue comme mot-clé. Or tous les sites récoltés par
cette méthode ne se rapportent pas nécessairement à la langue. Nous devons
donc visiter chaque site et éliminer tous ceux qui ne permettent pas
d’identifier formellement le nom de la langue comme renvoyant bien à une
langue. En effet, le même mot qui désigne une langue désigne aussi le peuple
qui la parle, la culture de ce peuple, etc. Par exemple, le mot «bambara»
désigne aussi bien la langue que le peuple et l’art de celui-ci, tandis que
dans les langues bantu ce type d’ambiguïté est quasiment inexistant du fait
que les noms de langues comportent généralement un préfixe spécifique (
ki-, li- ou se ) qui les rend univoques. Par exemple:
kiswahili, lingála, sesotho ).
Par ailleurs, certains noms de
langues fortuitement homographes de noms désignent des sociétés, des marques
ou des associations n’ayant rien à voir avec la langue. Ainsi ewe est
plus connu sur la Toile comme une marque de laine écossaise que comme langue
d’Afrique de l’ouest, tandis que le mot-clé akan rapporte des sites
aussi bien sur la langue et la culture akan que sur une société
polonaise du même nom.
En conséquence, à l’issue d’un premier tri entre
les 3332 pages Web visitées, seules les 1 374 qui traitent explicitement des
langues sont retenues, soit 41,24% de l’ensemble des sites récoltés par le
métamoteur ( cf. fig. 1 et 2 ).
III - Grille d’analyse
Le contenu des sites visités a été soumis à la grille d’analyse
suivante :
– mention simple;
– description ;
– documentation;
–
échantillon ;
– cours de langue ;
– textes ;
– sites ;
– langue de
communication -français (LC-F) ;
– langue de communication – anglais (LC-A)
;
– langue de communication – autres (LC-O).
Cette grille s’est constituée progressivement à partir de l’examen du contenu des sites au fur et à mesure du dépouillement. Elle est commentée de façon détaillée ci-après.
3.1 Mention simple
La mention simple d’une langue peut se manifester de deux
façons différentes : soit dans un texte quelconque, soit sur une carte
géographique de pays, délimitant l’espace d’extension de la langue. Dans un
texte, le nom de la langue est situé dans un contexte linguistique explicite
comme ceux-ci:
la langue X
Dictionnaire X -français et français
X
Cet artiste chante en langue X
Vous pouvez apprendre à parler le X
grâce à notre cours interactif
sur CD-Rom
Parlez-vous X?
Déclaration
universelle des Droits de l’Homme. Version X.
L’enseignement en X...
Le
X se parle dans l’est de...
La famille linguistique du X
etc.
Un autre contexte significatif est représenté par les sites
génériques qui donnent des listes de noms de langues avec leur code ISO en
deux ou trois lettres, ou encore la liste des langues parlées dans un pays.
Dans tous les cas, le visiteur n’a aucun mal à identifier le mot-clé recherché
comme étant bien un nom de langue sur le site visité. Et c’est la seule
information pertinente qu’il aura.
Sur les 1 374 sites qui traitent de
langues, 383, soit 27,87%, ne mentionnent que le nom des langues sans aucune
information qui soit de nature à révéler quoi que ce soit de leur substance,
de leur statut social ou juridique.
3.2 Documentation
Ce critère s’applique aux sites qui sont dédiés à des
ressources documentaires sur les langues, comme par exemple, des
bibliographies, des cédéroms, des ressources multimédia, mais aussi des
librairies électroniques. Nous classons également ici les sites qui font de la
publicité pour des produits linguistiques non directement utilisables en
ligne, comme par exemple, des méthodes d’apprentissage de langues sur cédérom
qu’il faut acheter avant de savoir comment l’utiliser. De nombreuses
publicités sur les langues africaines sont de ce type et ne permettent pas
d’accéder directement à la langue de façon interactive.
Certaines
documentations générales qui concernent presque toutes les langues ne sont
reprises ici que lorsque la langue recherchée est directement concernée.
Par exemple, les codes des noms de langue (codes ISO 639-1 et 639-2, code
MARC), les polices de caractères et, le cas échéant, les logiciels spécifiques
à l’écriture de certaines langues.
La documentation apporte donc au
visiteur du site une quantité d’informations qui vont bien au-delà du simple
nom de la langue, sans pour autant l’informer davantage sur la matérialité de
la langue.
Ce critère s’applique à 152 sites sur 1374, soit 14,79% des
sites qui traitent des langues africaines ( Cf. figures 3 et 4,
ci-dessus ).
3.3 Description
Le critère de description s’applique lorsqu’un site donne des informations de type sociolinguistiques et linguistiques. Les informations sociolinguistiques décrivent l’usage de la langue dans la société et sont du genre :
nombre de locuteurs;
pays d’origine ou aire d’extension de la langue ;
son statut juridique ou ses usages sociaux ;
sa classification linguistique ;
etc.
Les informations linguistiques vont d’une étude ponctuelle (
par exemple, la structure du verbe en amharique ) jusqu’à une esquisse
linguistique ( phonologie, syntaxe, lexique) plus ou moins développée qui
apporte beaucoup plus d’informations encore sur la langue. Grâce à ces
informations, on commence à avoir une petite idée de la manière dont telle ou
telle langue structure la pensée, du moins sur les points étudiées.
Il est
important de noter que même dans ce cas, les informations sont données sur
la langue africaine en utilisant comme langue de description une autre
langue, en général une langue européenne (allemand, anglais, espagnol,
français, néerlandais, polonais, portugais, italien ). La description
linguistique fragmentaire souvent proposée ici comporte généralement peu de
données matérielles sur la langue.
Ce critère s’applique à 148 des 1 374
sites qui traitent des langues, soit 14,40%, comme le montrent les figures 3
et 4 ci-après.
3.4 Échantillons
Par définition, ce critère permet d’accéder à la matérialité
de la langue, car les sites classés ici nous livrent des échantillons de la
langue plus ou moins importants qui vont des simples citations de mots dans la
langue à des lexiques interactifs. Nous considérons comme citation
l’usage ponctuel d’un mot dans une langue africaine alors que tout
l’environnement est dans une autre langue. C’est par exemple le cas des sites
dont le nom est donné dans une langue africaine alors que tout le site est en
français ou en anglais. C’est aussi le cas des sites où l’usage d’une langue
africaine se limite à un slogan ou une enseigne, voire un nom propre, en cette
langue. Bien entendu, on peut avoir des citations plus longues que cela
!
Un autre type d’échantillon est celui des sites qui traduisent dans
un grand nombre de langues un même mot ou une même expression. Par exemple
«comment dit-on paix dans 2000 langues, comment dit-on bonjour
dans 800 langues, comment dit-on je t’aime dans 350 langues,
comment dit Joyeux Noël dans deux cents langues» etc. Ces sites ne
concernent bien évidemment pas que les langues africaines mais un bon nombre
des langues africaines sont incluses dans ce type de listes.
Certains sites
comportent des fichiers sonores permettant de saisir encore mieux la
matérialité de la langue. D’autres proposent des phrases usuelles dans la
langue traitée. La matière linguistique fournie est déjà plus riche et permet
d’avoir une meilleure idée de la langue, même si elle demeure encore trop
sommaire. Entrent dans cette catégorie les esquisses grammaticales qui
s’accompagnent des exemples dans la langue.
Plus élaborés encore sont les
lexiques interactifs qui permettent au visiteur d’obtenir instantanément la
traduction d’un mot qu’il entre. Cette traduction peut se faire vers ou depuis
la langue africaine. Les lexiques interactifs de ce genre ne sont pas
généralement très fournis et leur mode de consultation ne permet pas de lire
plusieurs mots à la fois. C’est pourquoi nous les classons parmi les
échantillons.
L’ensemble des sites concernés par ce critère s’élèvent à 76
sur 1374, soit 7,39 % des sites traitant de langues
( Cf. figures 3
et 4 plus haut ).
3.5 Textes
C’est parce qu’un texte fournit davantage d’informations sur
une langue qu’une liste des mots ou de phrases usuelles que nous mettons à
part les sites qui proposent des textes en morceaux choisis ou des textes
entiers. L’un des sites les plus remarquables de cette catégorie est le
Language Museum qui se veut une collection des textes dans 2000
langues. On y trouve très largement représentés la traduction de textes
religieux tels que le Pater Noster, l’Ave Maria, les premiers
versets du premier chapitre de l’Évangile selon saint Jean ), les textes
juridiques comme les premiers articles de la Déclaration universelle des
droits de l’homme et des textes narratifs avec leur traduction en
anglais.
Par ailleurs le site de l’Unesco donne la traduction du texte
intégral de la Déclaration universelle des droits de l’homme dans de
nombreuses langues africaines entre autres. À l’instar de l’Unesco, certains
sites offrent plusieurs versions d’un même texte dans plusieurs langues,
chacune ayant ses propres pages. C’est souvent le cas pour les textes
officiels d’Afrique du Sud, traduits dans les onze langues officielles de ce
pays. C’est aussi le cas pour de nombreux sites religieux en mal de
prosélytisme.
Certains sites universitaires consacrés essentiellement à la
littérature livrent des textes en langues africaines avec leur traduction dans
une langue européenne, généralement en anglais. Nous n’incluons pas ici les
sites qui ne livrent que la traduction en langue européenne des contes ou
poèmes africains sans en donner les textes originaux dans la langue
source!
Dans notre corpus, 89 sites sur 1 374, soit 8,66% des sites
fournissent des textes avec traduction. On notera que la majorité des textes
recueillis sont des traductions vers des langues africaines à l’exception des
sites littéraires qui eux s’intéressent aux langues africaines et traduisent
vers les langues européennes, mais dans les deux cas, la langue de
communication utilisée reste une langue européenne.
3.6 Cours de langue
Il s’agit ici des sites qui proposent des cours de langues en
ligne et non pas qui font la publicité des cours de langues non disponibles en
ligne. Le plus souvent on trouve des débuts de cours ou des cours complets
pour débutants qui constituent des produits d’appel pour inciter le visiteur à
aller plus loin dans la découverte de la langue en achetant un produit plus
élaboré.
Nous n’avons trouvé que très peu de cours interactifs soignés en
ligne pour les langues africaines. Les produits d’appel sont très largement
orientés vers l’enseignement des langues africaines aux touristes et résidents
étrangers ( anglais, espagnols, allemands ou français notamment ).
Sur 1374
sites de notre corpus, il n’y a que 24 qui proposent des cours de langues soit
2,33% de l’ensemble. Pourtant les cours de langue sont l’un des moyens les
plus sûrs d’augmenter à la fois le nombre et la compétence des usagers d’une
langue. C’est dire l’importance de ce type de matériel pour la création et le
développement d’une cybercommunauté d’utilisateurs de la langue africaine
comme véhicule de communication.
3.7 Sites
Nous classons ici les sites qui utilisent effectivement les
langues africaines comme moyen de communication avec le visiteur.
On peut
distinguer les sites qui utilisent les langues africaines sur quelques pages
ou dans quelques rubriques seulement. Par exemple sur les boutons de
navigation, la partie journal d’informations (news) ou encore la partie
forum de discussion, le reste étant en langue européenne.
Ensuite viennent
les sites qui utilisent majoritairement les langues africaines. Il s’agit des
sites bilingues dont le côté bilingue ne concerne qu’un nombre restreint de
textes en général traduits de la langue africaine vers une langue
européenne.
Enfin, quelques sites sont rédigés en langues africaines voire
dans une écriture spécifique (comme l’écriture éthiopienne, l’écriture Nko,
etc. ). On trouve ici l’utilisation maximale d’une langue africaine comme
véhicule de communication sur la Toile.
Ce critère s’applique à 33 sites
sur 1 374 soit 3,22% de l’ensemble de notre corpus ( Cf.


|
Total Net |
Mention | Doc | Décrite | Échantillons | Textes | Cours | Sites |
| 100 | 27,87 | 24,46 | 18,79 | 9,61 | 9,61 | 3,13 | 6,11 |
| 1373 | 383 | 332 | 254 | 132 | 132 | 43 | 84 |
Figure 4
3.8 Les langues de communication des sites
Nous appelons «langue de
communication» la langue dans laquelle le webmestre entend communiquer avec le
visiteur. C’est donc typiquement la langue utilisée par le webmestre pour
écrire les annotations sur les boutons de navigation, les messages d’aide, les
éventuels menus, les légendes d’images, les consignes de lecture, et bien
entendu, tout texte destiné à communiquer avec le visiteur.
Par exemple,
dans une description linguistique, la langue de description est la langue de
communication tandis que la langue décrite n’est qu’un objet dont on parle
Dans le cas de textes comme celui de la Déclaration universelle des
droits de l’homme, on peut se demander si la langue du texte n’est pas la
langue de communication, dans la mesure où il constitue l’essentiel du message
que le webmestre veut communiquer au visiteur. En fait, nous constatons qu’en
dehors du texte lui-même, tout ce qui est consigne ou annotation ( si peu que
cela soit ) est en anglais.
Par conséquent c’est bien dans cette langue
que le webmestre entend assister le visiteur dans l’identification de ce
texte. La langue de communication est bel et bien celle dans laquelle le
webmestre tente de dialoguer avec le visiteur et non celle du texte qu’il lui
présente pour lecture.
On pourrait croire que les langues parlées dans les
pays francophones comme le bambara, le sängö, le lingála, etc., sont traitées
dans des sites utilisant largement le français. En fait, il n’en est rien !
L’examen de la langue de communication utilisée dans 503 sites pris au hasard
sur les 1374 montre que dans 376 sites, soit 74,76%, c’est l’anglais qui est
utilisée comme langue de communication. Le français vient en second lieu avec
77 sites, soit 15,30%. Les langues africaines sont utilisées comme langues de
communication dans les 33 sites en langues africaines, soit 6,56%. Enfin, les
17 sites qui restent, soit 3,37% se partagent entre l’allemand, l’espagnol, le
portugais, le polonais, le néerlandais et l’italien. Ce sont les langues de
communication «autres » (LC-O dans la figure 5).

Conclusion
Les principaux enseignements que révèle cette brève étude
sont clairement les suivants :
Les langues africaines apparaissent sur la
Toile beaucoup plus comme des objets d’étude (mention, documentation,
description, échantillons, textes, cours ) que comme des véhicules de
communication (sites ).
La langue de communication utilisée pour parler des
langues africaines est très largement l’anglais, même pour les langues en zone
francophone.
Les cours de langues africaines sont beaucoup trop rares sur
la Toile. Ce qui entrave la possibilité de développer des cybercommunautés de
locuteurs utilisant les langues africaines comme véhicules de communication
via l’Internet.
Les produits logiciels ou les solutions informatiques
intégrant en standard des polices de caractères pour toutes les langues
africaines sont rarement proposés sur les sites.
Pour corriger cette situation, il y a donc lieu de promouvoir:
la multiplication des sites bilingues (ou multilingues) comportant le français et au moins une langue africaine comme langues de communication ;
une plus grande diffusion de la documentation francophone sur les langues africaines, car cette documentation existe mais n’est pas systématiquement diffusée sur la Toile ;
les cours de langues africaines de qualité à diffuser sur la Toile ;
le développement et la diffusion de produits logiciels ou de solutions informatiques facilitant l’écriture des langues africaines et leur utilisation normale et courante dans le cyberespace.
Bibliographie
Ngangala Balade Tongamba (J.), 2001: «Technologie de l'information et langues africaines : Lieux des enjeux existentiels», dans
Cahiers du Rifal, nº 22, décembre 2001, p. 3-9.Bearth (Th.), 2001: «Ali Akan: initiation à une langue africaine par les nouvelles technologies», dans Cahiers du Rifal,
nº 22, décembre 2001, p. 27-32.Chanard (Chr.), Popescu-Belis (A.), 2001: «Encodage informatique multilingue. Application au contexte du Niger», dans
Cahiers du Rifal, nº 22, décembre 2001, p. 33-45.
Marcel Diki-Kidiri et Atibakwa Baboya Edema,
Llacan (CNRS,
Inalco, Université de Paris)
Villejuif, France.
kidiri@vjf.cnrs.fr
edema_atibakwa@yahoo.fr
Annexe :
Liste des sites étudiés