Au cours de l’été, le département de linguistique et de traduction de l’Université de Montréal a annoncé l’obtention par Ayla Rigouts Terryn d’une chaire de recherche Fonds de recherche du Québec – IVADO sous le thème « Au carrefour des langues et de l’IA : vers une synergie entre expertise en langues et innovation computationnelle ».
Le programme de recherche s’intéressera à trois grands axes : analyse et évaluation du multilinguisme des grands modèles de langue, traduction automatique et terminologie, et IA pour les langues sous-dotées.
UdeM français s’est entretenu avec Ayla Rigouts Terryn pour en savoir davantage sur ces travaux, qui vont démarrer en 2026.
UdeM français : Merci d’avoir accepté de nous rencontrer, et félicitations pour l’obtention de votre chaire de recherche! 
UdeM français suit de près les initiatives contribuant à la valorisation du français, à sa qualité et à son apprentissage, ainsi que l’évolution des outils d’intelligence artificielle dans le domaine des langues. Pouvez-vous nous en dire plus sur cette chaire?
ART : Il s’agit d’une chaire Fonds de recherche du Québec – IVADO avec la Faculté des arts et des sciences. Elle permet aux jeunes chercheurs de s’établir à Montréal dans le cadre du projet IAR³ d’IVADO pour développer une intelligence artificielle robuste, raisonnante, et responsable. Mes recherches portent sur l’IA et la langue, surtout dans le contexte d’autres langues que l’anglais et en contextes multilingues. J’aimerais réunir une équipe multidisciplinaire avec des personnes au doctorat en traduction et en informatique. Je cherche aussi des collaborations pour des codirections, comme en science des données et en linguistique.
UdeM français : Les langagières et langagiers professionnels doivent-ils voir en l’IA une alliée ou une ennemie?
ART : Je comprends qu’on puisse voir l’intelligence artificielle comme un ennemi. Parfois, je me sens très mal à l’aise avec son utilisation, notamment parce que les IA sont conçues par de grandes entreprises avec beaucoup d’opacité par rapport aux structures ou aux systèmes.
En revanche, je crois que même si on la voit comme un ennemi, il faut connaître ses ennemis. Et donc, il ne faut pas utiliser ces enjeux comme prétexte pour ignorer la technologie : il est préférable de les comprendre tout en restant critiques.
Il y a une certaine culpabilisation des utilisateurs, notamment sur la consommation d’eau et d’énergie, alors que les données manquent de transparence et que les technologies évoluent très vite : d’un côté, les modèles deviennent plus efficaces, de l’autre, ils s’agrandissent et touchent de plus en plus d’usagers. L’impact écologique de l’IA est indéniablement un enjeu sérieux, mais il faut aussi relativiser : pour quelqu’un qui fait seulement quelques requêtes par jour, l’empreinte reste négligeable par rapport à d’autres aspects de sa consommation.
L’IA est trop incontournable pour l’ignorer. Il ne faut pas l’accepter ou la rejeter en bloc, mais se faire une idée en apprenant à l’utiliser selon les contextes.
UdeM français : Selon vos observations, quelle place les concepteurs de grands modèles de langues laissent-ils aux langagières et langagiers professionnels dans le développement de leurs outils?
ART : Les langagières et langagiers ne sont pas nécessairement dans l’équipe de développement, mais plutôt embauchés à l’externe pour créer, évaluer et annoter des données. Il y a des exceptions, et peut-être des profils hybrides comme le mien – j’ai une maîtrise en traduction. Les langagières et langagiers sont importants dans le travail sur les données, mais ce n’est malheureusement pas un travail très valorisé.
UdeM français : Parallèlement, les outils d’IA comportent-ils un risque d’appauvrissement de la langue, à votre avis?
ART : Les corpus d’entraînement des grands modèles restent, dans l’ensemble, fortement dominés par l’anglais, mais les proportions varient selon les modèles et ne sont pas toujours publiques. À titre d’ordre de grandeur, plusieurs mélanges récents demeurent très majoritairement anglophones (autour de 90 à 95 % d’anglais lorsque des chiffres indicatifs sont publiés), ne laissant que quelques points de pourcentage à répartir entre toutes les autres langues du monde.
Parmi ces autres langues, le français figure souvent dans le top 3 des langues les mieux représentées, et est donc relativement privilégié comparé à la vaste majorité des langues, mais demeure très loin de la domination écrasante de l’anglais.
En parlant avec des IA, on a parfois l’impression de parler avec une personne anglophone ayant une bonne maîtrise du français. J’ai effectué des recherches à ce sujet et j’ai noté que ça s’améliore avec les nouvelles versions. J’ai engagé des traductrices et traducteurs professionnels pour noter les fautes linguistiques et voir si on remarque une influence claire de l’anglais ou non. Dans une grande proportion des fautes, il y a un lien clair avec l’anglais, même si ce n’est pas un texte traduit. Les modèles d’IA affichent des écarts de performance marqués selon les langues, avec des résultats quasi systématiquement supérieurs en anglais.
J’ai fait une nouvelle recherche faisant l’objet d’une révision par les pairs : les valeurs culturelles dans les modèles et l’influence de la langue de la requête. Il s’avère que les valeurs culturelles reflétées par les modèles s’alignent mieux sur les profils des Pays-Bas, des États-Unis, de l’Allemagne et du Japon parmi 11 pays testés.
UdeM français : D’après vous, dans quelle mesure ces outils peuvent-ils faciliter l’intégration des personnes non francophones qui viennent étudier ou enseigner en français à Montréal?
ART : Je pense que c’est très utile. Le français est ma troisième langue et avoir ChatGPT, Claude et tous les autres modèles pour m’aider est vraiment appréciable, surtout pour préparer mes cours, écrire des courriels, des textes plutôt administratifs que personnels, mais qui doivent être dans un français correct. C’est toujours plus rapide, même si j’ai la responsabilité finale de ce que j’ai écrit. Je l’utilise plutôt pour de la transcréation que pour la traduction. Je donne des éléments dans la requête avec une liste de points à aborder. Ces outils ont rendu ma première année ici beaucoup plus facile.
UdeM français : Quelles initiatives de valorisation du français nous conseilleriez-vous d’entreprendre en cette période où l’IA devient de plus en plus omniprésente?
ART : D’abord, pour toute utilisation d’IA, pesez risques et bénéfices : quelle est la sensibilité de vos données et l’outil est-il suffisamment sûr pour les traiter? Quels seraient les coûts d’erreurs typiques en français (p. ex., anglicismes, calques, respect des normes typographiques) et en général (p. ex., confabulations, contenus biaisés). Par exemple, pour transformer des notes de réunion internes non sensibles en compte rendu, l’IA peut convenir; pour une communication externe qui engage une marque ou comporte des informations cruciales, je consulterais assurément une professionnelle ou un professionnel.
Ensuite, testez et comparez en continu. La technologie évolue très vite : ce qui n’est pas possible le sera peut-être en quelques semaines, avec un autre modèle ou une autre requête. Testez aussi si ce qui fonctionne bien en anglais fonctionne tout aussi bien en français.
Enfin, appuyez-vous sur l’expertise des langagières et langagiers. Par exemple, plutôt que d’envoyer une traduction pré-générée à post-éditer, laissez la traductrice ou le traducteur décider si une génération s’impose pour ce texte précis, et quels outils et requêtes à utiliser. Bien sûr, cela suppose que les langagières et langagiers assurent une veille active : se tenir à jour sur les outils pertinents et expérimenter, afin d’être pleinement conscients de leur valeur ajoutée et de savoir la faire valoir.