Ce n'est un secret pour personne que la politique américaine est devenue très polarisée.
Même ainsi, il y a probablement peu d'Américains vivants qui aient jamais été témoins de quoi que ce soit qui soit comparable au premier débat présidentiel de cet automne.
Était-ce vraiment le cas que la nation ne pouvait pas faire mieux qu'une bataille verbale de nourriture, avec deux candidats se lançant des insultes de quatrième année et se parlant?
Pour nous, le débat discordant n'était qu'un symptôme de plus du discours civique effiloché de la nation, qui, dans une étude récente, nous avons pu montrer s'étend aux mots que nous utilisons pour parler de politique.
Plus tôt cette année, nous avons commencé à créer un ensemble de données qui comprend tous les commentaires des téléspectateurs sur les vidéos YouTube publiés par quatre réseaux de télévision – MSNBC, CNN, Fox News et One America News Network – qui ciblent des tranches du spectre politique. Ensemble, l'ensemble de données contient plus de 85 millions de commentaires sur plus de 200000 vidéos de 6,5 millions de téléspectateurs depuis 2014.
Nous avons étudié s'il existe des variantes distinctes de l'anglais écrites dans les sections des commentaires, semblables à la distinction entre l'anglais britannique et l'anglais américain.
En utilisant des méthodes d'apprentissage automatique, nous avons constaté que ces permutations existent. De plus, nous pouvons les classer en termes de «gauche» et de «droite». À notre connaissance, il s'agit de la première démonstration empirique de différences linguistiques quantifiables dans le public des informations.
Notre deuxième découverte, cependant, était encore plus inattendue.
Notre système de traduction par apprentissage automatique a constaté que des mots aux significations très différentes, comme «KKK» et «BLM», étaient utilisés exactement dans les mêmes contextes en fonction de la chaîne YouTube analysée.
L'entreprise qu'un mot garde
Lors de la traduction de deux langues différentes, par exemple l'espagnol et l'anglais, les systèmes de traduction automatisés comme Google Traduction commencent par un vaste ensemble de textes de formation dans les deux langues. Le système applique ensuite des méthodes d'apprentissage automatique pour devenir meilleur dans la traduction.
Au fil des ans, cette technologie est devenue de plus en plus précise, grâce à deux informations clés.
Le premier remonte aux années 1950, lorsque le linguiste John Rupert Firth a proposé l'aphorisme «Vous connaîtrez un mot par la compagnie qu'il garde».
Pour les systèmes de traduction automatique modernes, la «société» qu'un mot conserve est son «contexte», ou les mots qui l'entourent. Par exemple, le mot anglais «raisin» apparaît dans des contextes tels que «jus de raisin» et «vigne de raisin», tandis que le mot équivalent en espagnol, uva, se produit dans les mêmes contextes – jugo de uva, vid de uva – dans des phrases espagnoles.
La deuxième découverte importante est venue assez récemment. Une étude de 2013 a trouvé un moyen d'identifier – et ainsi de relier – le contexte d'un mot dans une langue à son contexte dans une autre. La traduction automatique moderne dépend fortement de ce processus.
Ce que nous avons fait, c'est d'utiliser ce type de traduction d'une manière entièrement nouvelle: traduire de l'anglais vers l'anglais.
Quand les "Trumptards" deviennent des "flocons de neige"
Cela peut paraître bizarre. Pourquoi traduire l'anglais vers l'anglais?
Eh bien, considérez l'anglais américain et l'anglais britannique. De nombreux mots sont identiques dans les deux langues. Pourtant, il peut y avoir des différences subtiles. Par exemple, «appartement» en anglais américain peut se traduire par «appartement» en anglais britannique.
Pour les besoins de notre étude, nous avons étiqueté la langue utilisée dans la section des commentaires de chaque réseau «MSNBC-Anglais», «CNN-Anglais», «Fox-Anglais» et «OneAmerica-Anglais». Après avoir analysé les commentaires, nos algorithmes de traduction ont découvert deux modèles différents de «mots mal alignés» – des termes qui ne sont pas identiques dans les sections de commentaires mais qui sont utilisés dans les mêmes contextes.
Un type était similaire à «appartement» et «appartement», dans le sens où les deux décrivent ostensiblement la même chose. Cependant, les paires de mots que nous avons découvertes ont des intonations différentes. Par exemple, nous avons constaté que ce qu'une communauté appelle «Pelosi», l'autre appelle «Pelousy»; et «Trump» dans une langue d'information se traduit par «Drumpf» dans une autre.
Un deuxième type de désalignement – et plus profond – s'est produit lorsque les deux mots se réfèrent à deux choses fondamentalement différentes.
Par exemple, nous avons constaté que dans CNN-anglais, "KKK" – l'abréviation de Ku Klux Klan – est traduit par notre algorithme en "BLM" – abréviation de Black Lives Matter – en Fox-anglais. L'algorithme trouve essentiellement que les commentaires faits par une communauté sur KKK ressemblent beaucoup aux commentaires de l'autre sur BLM. Bien que les systèmes de croyance du KKK et du BLM soient à peu près aussi différents que possible, selon la section des commentaires, ils semblent chacun représenter quelque chose de tout aussi inquiétant et menaçant.
CNN-English et Fox-English ne sont pas les deux seules langues affichant ces types de désalignements. L'extrémité conservatrice du spectre elle-même se divise en deux langues. Par exemple, «masque» en Fox-anglais se traduit par «museau» en OneAmerica-anglais, reflétant les différences d'attitudes dans ces sous-communautés.
Il semble y avoir une dualité miroir en jeu. «Conservatisme» devient «libéralisme», «rouge» est traduit par «bleu», tandis que «Cooper» est converti en «Hannity».
Il ne manque pas non plus ce que l'on ne peut appeler que des insultes enfantines.
«Trumptards» en CNN-anglais se traduit par «flocons de neige» en Fox-anglais; «Trumpty» en CNN-anglais se traduit par «Obummer» en Fox-anglais; et «républicains» en CNN-anglais se traduit par «démocraps» en Fox-anglais.
Territoire inexploré
Les linguistes soulignent depuis longtemps à quel point une communication efficace entre des personnes de croyances différentes nécessite un terrain d'entente. Nos résultats montrent que la façon dont nous parlons des questions politiques est de plus en plus différente; selon qui écrit, un mot commun peut être imprégné d'une signification entièrement différente.
[Connaissance approfondie, au quotidien. Inscrivez-vous à la newsletter de The Conversation.]
Nous nous demandons: à quelle distance sommes-nous du point de non-retour lorsque ces différences linguistiques commencent à éroder le terrain d'entente nécessaire à une communication productive?
Les chambres d'écho sur les réseaux sociaux ont-elles exacerbé la polarisation politique au point que ces désalignements linguistiques se sont enracinés dans le discours politique?
Quand «démocratie» dans une variante linguistique cessera-t-elle de se traduire par «démocratie» dans l'autre?
Mark Kamlet, professeur universitaire d'économie et de politique publique, L'université de Carnegie Mellon; Ashique KhudaBukhsh, scientifique de projet à l'École d'informatique, L'université de Carnegie Mellon, et Tom Mitchell, professeur universitaire fondateur d'apprentissage automatique, L'université de Carnegie Mellon
Cet article est republié à partir de The Conversation sous une licence Creative Commons. Lisez l'article original.
À partir d'articles de votre site
Articles connexes sur le Web