La standardisation, les langues et l'IA : quelques enjeux et perspectives

twitterlinkedin

Alerte standardisation ?

L’intelligence artificielle a pris ses quartiers dans nos outils et nos réflexes, à l’heure de communiquer. Or, sous le « nos » tout juste employé, grouille pourtant une multitude de spécificités sociolinguistiques reflétant des réalités sociales uniques. Et nous sommes bien placés pour le savoir : notre agence a, depuis sa création, un pied sur deux continents, entre Paris et Buenos Aires.

Mais alors, que penser de cette standardisation croissante qui nous guette du même œil que le développement exponentiel des IA ? Loin de nous l’idée de répondre à cette question. Par contre, on adore ouvrir le débat : petit tour d’horizon de ce qu’il nous semble intéressant de contempler, face à ces réalités…

>>On parie qu’on est sociolinguistiquement compatible ? Appelez-nous pour vérifier 😉

Standardisation : un apprentissage linguistique déséquilibré

Allez, mettons les pieds dans le plat : il est essentiel de comprendre que toutes les langues ne sont pas logées à la même enseigne, dans l’univers de l’IA. Les modèles de langages sont principalement entraînés sur des corpus en anglais, chinois et dans quelques langues dominantes.

Les langues moins répandues, les dialectes régionaux et les variations locales sont sous-représentés dans les données d’entraînement.

Surprenant ? Pas vraiment. Mais cette disparité crée un biais fondamental : l’IA tend naturellement vers les structures et les modes d’expression des langues majoritaires, même lorsqu’elle génère du contenu dans des langues moins courantes…

Expressions du quotidien et réalités sociales

Les langues ne sont pas de simples outils de communication, mais le reflet de modes de vie et d’organisations sociales spécifiques.

  • D’un côté, on distingue des territoires où se développent des expressions, des syntaxes et des lexiques qui traduisent la réalité quotidienne de ses occupants. Tous ces supports, vecteurs de lien, portent en eux des concepts sociaux, des habitudes de vie et des façons de penser propres à chaque culture.
  • Et de l’autre ? L’IA, dans sa recherche d’efficacité, tend à standardiser ces expressions, perdant ainsi la richesse des nuances sociales qu’elles véhiculent.

Nous avions récemment ouvert un chapitre, sur ce même blog, à propos de la nécessaire collaboration IA/humain appliquée au domaine de la traduction, à la recherche du ratio idéal.

Les choses avancent, mais une conviction demeure : nous croyons dur comme fer que la conservation des spécificités sociolinguistiques est aujourd’hui entre les mains du pourcentage d’intervention humaine maintenue dans les processus de création de contenus.

>> Lire notre article sur le travail humain en bonne intelligence artificielle

Le monde professionnel et ses codes face à la standardisation

Dans le contexte professionnel aussi, chaque langue développe son propre écosystème d’expressions, voire de jargon. Ces terminologies ne sont pas interchangeables d’une culture à l’autre car elles reflètent des organisations du travail, des hiérarchies et des relations professionnelles différentes.

Un exemple ? Les formules de politesse dans les emails professionnels varient considérablement selon les cultures, traduisant des rapports hiérarchiques et des codes de respect spécifiques que l’IA peine à saisir dans toute leur complexité.

Les marqueurs sociaux dans le langage

La langue est aussi un puissant marqueur d’appartenance sociale et culturelle. Les variations linguistiques ne sont pas de simples différences de vocabulaire : elles signalent l’appartenance à un groupe, un niveau d’éducation, une origine géographique.

L’IA, lorsqu’on lui « passe la main » de manière trop autonome, tend donc vers cette uniformisation du langage et risque d’effacer ces subtils marqueurs qui structurent nos interactions sociales… et donnent finalement toute leur richesse à nos échanges.

L’ennui nous guette, donc, sur nos écrans ? Rien n’est moins sûr…

Vers une communication authentique VS standardisée, à l’ère de l’IA

Face à tout ça, les agences de communication doivent développer des stratégies concrètes. Par exemple, il devient crucial de penser ses prompts comme des vecteurs d’entrainements faisant tout sauf l’impasse sur les spécificités sociolinguistiques que chacun souhaite valoriser.

Une idée ? La formation des équipes à ces nouveaux outils pourrait inclure une sensibilisation aux variations sociolinguistiques régionales – ou en tout cas à celles de leurs cibles – et à leur importance dans la communication.

De la même façon, les processus de validation des contenus fraichement accouchés par l’IA doivent être repensés pour garantir que l’utilisation de tels outils ne conduit pas à une standardisation appauvrissante. Il s’agit de trouver le juste équilibre entre l’efficacité offerte par les outils d’IA et le maintien d’une communication authentique, ancrée dans les réalités sociales locales. Facile à dire, n’est-ce pas ?

On conclut ? Pas question ici de rejeter l’IA, mais de s’offrir le luxe de l’utiliser de manière réfléchie, en gardant à l’esprit que la communication n’est pas qu’une question de mots justes. C’est aussi et surtout une question de compréhension profonde des contextes sociaux et culturels. Ce même article que vous avez lu jusqu’au bout – et on vous en remercie ! – contient sa dose d’expressions qui, on en est sûrs, vous aura conforté dans l’idée qu’il est bien le fruit d’une plume humaine…  

 

Envie d’aller plus loin ? Quelques recommandations, et un peu de lecture !

Anna Kristina Hultgren
Ouvrage principal : « Language in a Digital World » (2023, Oxford University Press)
Article clé : « The Digital Transformation of Language Work: A Critical Sociolinguistic Study of Global English in the Digital Age » (2023) dans Language Sciences
Conférence accessible en ligne : « Linguistic Justice in the Digital Age » (2022) donnée à l’Université de Copenhagen

David Casacuberta et Marco Schorlemmer
Publication collaborative : « Algorithmic Linguistic Justice: A Framework for Analysis and Action » (2022) dans AI & Society
Chapitre d’ouvrage : « The Ethics of Language Models » dans « Ethics of Artificial Intelligence » (2023, Oxford University Press)
Projet de recherche en cours : « LITHME – Language In The Human-Machine Era » (participation européenne)
Pour approfondir : le site du projet LITHME qui compile leurs travaux récents : https://lithme.eu/

Dirk Geeraerts
Article récent : « Cognitive Sociolinguistics in the Age of AI » (2022) dans Cognitive Linguistics
Ouvrage collectif : « Language Variation in the Age of Digital Communication » (2023)
Série de séminaires : « Digital Transformation of Language » à l’université de Leuven
Pour approfondir : la page du laboratoire de recherche QLVL (Quantitative Lexicology and Variational Linguistics) : https://www.arts.kuleuven.be/ling/qlvl 

empty