banner
Maison / Nouvelles / Traduction automatique : un guide complet
Nouvelles

Traduction automatique : un guide complet

Jul 07, 2023Jul 07, 2023

La traduction automatique est l'utilisation de l'intelligence artificielle pour traduire automatiquement du texte et de la parole d'une langue à une autre. À l'aide de techniques de traitement du langage naturel et d'apprentissage en profondeur, un logiciel de traduction automatique analyse les éléments linguistiques de la langue d'origine, reconnaît l'influence des mots les uns sur les autres, puis communique leur pleine signification dans une nouvelle langue.

La traduction automatique utilise l'IA pour traduire automatiquement le texte et la parole d'une langue à une autre. Il s'appuie sur le traitement du langage naturel et l'apprentissage en profondeur pour comprendre le sens d'un texte donné et le traduire dans différentes langues sans avoir besoin de traducteurs humains.

Les outils de traduction automatique populaires incluent Google Translate et Microsoft Translator, qui sont tous deux capables de traduire à la fois les langues parlées et écrites. Ils s'appuient sur toutes les connaissances existantes du traitement du langage naturel - y compris la grammaire, la compréhension du langage et la génération de langage - et produisent rapidement des traductions dans des centaines de langues différentes.

La traduction automatique est loin d'être parfaite, et ces systèmes ne produisent pas des traductions aussi rapidement ou aussi facilement que les appareils décrits dans des histoires de science-fiction comme Hitchhiker's Guide to the Galaxy ou Star Trek. Pourtant, cette technologie a parcouru un long chemin au fil des décennies et promet d'être un perturbateur majeur pour la traduction linguistique à l'avenir.

Matière à réflexionVerrons-nous jamais un traducteur universel "Star Trek" dans la vie réelle ?

La traduction automatique remonte aux années 1950 - lorsque les États-Unis l'ont utilisée pour espionner la Russie et d'autres pays pendant la guerre froide - ce qui en fait "l'application d'intelligence artificielle originale", selon Maite Taboada, professeur de linguistique à l'Université Simon Fraser en Grande-Bretagne. Colombie, Canada.

Les méthodes utilisées alors nécessitaient de programmer à la main des dictionnaires bilingues étendus et des règles de grammaire dans des ordinateurs afin de traduire une langue dans une autre. Au début des années 2000, les ordinateurs ont commencé à utiliser l'apprentissage automatique pour analyser le texte et faire des prédictions statistiques, déterminant la probabilité qu'un mot ou une phrase particulière dans une langue source soit un mot ou une phrase correspondante dans une langue cible.

Aujourd'hui, nous nous appuyons sur la traduction automatique neuronale, qui utilise l'apprentissage en profondeur pour apprendre de nouvelles langues, puis améliorer continuellement ces connaissances à l'aide d'une méthode d'apprentissage automatique spécifique appelée réseaux de neurones, où les données d'entrée passent par plusieurs nœuds interconnectés pour générer une sortie - similaire à la façon dont fonctionne le cerveau humain.

Le logiciel de traduction automatique neuronale fonctionne avec des ensembles de données volumineux et considère l'intégralité de la phrase d'entrée à chaque étape de la traduction au lieu de la décomposer en mots ou phrases individuels comme d'autres méthodes. Il est plus capable de capturer - voire de comprendre - l'intention ou le sens d'une phrase et, par conséquent, a rapidement remplacé de nombreux modèles statistiques plus anciens.

Une percée plus récente dans la traduction automatique neuronale a été la création de réseaux de neurones transformateurs - le "T" dans GPT, qui alimente de grands modèles de langage, ou LLM, comme ChatGPT d'OpenAI et Bard de Google. Les transformateurs apprennent des modèles de langage, comprennent le contexte d'un texte d'entrée et génèrent une sortie appropriée. Cela les rend particulièrement efficaces pour traduire des textes dans différentes langues.

En utilisant une technique appelée "attention sur soi", les transformateurs peuvent se concentrer de manière sélective sur différentes parties d'une phrase d'entrée, peser leur importance en fonction de leur pertinence les unes par rapport aux autres et identifier les relations importantes entre elles afin de pouvoir les traduire avec précision dans une autre. langue. Ils sont également formés sur des quantités massives de données textuelles bilingues, ce qui les aide à apprendre les nuances de différentes langues et améliore leur capacité à générer des traductions précises.

"Avec les modèles de transformateurs, vous prédisez également [le mot suivant], comme n'importe quel grand modèle de langage. Mais vous le prédisez dans son contexte", a déclaré Olga Beregovaya, vice-présidente de l'IA et de la traduction automatique de la société de traduction Smartling, à Built In. "Alors que les grands modèles linguistiques sont formés pour une variété de tâches, la dernière génération de LLM fonctionne également bien sur les tâches de traduction."

À son niveau le plus sophistiqué, la traduction automatique est essentiellement une forme d'IA générative, où les LLM sont utilisés pour produire automatiquement du texte. Par exemple, si un utilisateur demande à ChatGPT en anglais de lui donner une recette d'éclair au chocolat en français, le résultat est un exemple de traduction automatique.

Jusqu'à présent, la traduction automatique neuronale sans l'utilisation de modèles de transformateurs était factuellement exacte, mais manquait de la fluidité du langage naturel. Et le texte généré par l'IA est devenu assez conversationnel, mais peut se tromper énormément sur les choses.

La prochaine itération de la traduction automatique combinera probablement les forces des LLM et de la traduction automatique neuronale pour générer une traduction linguistique plus naturelle et précise. En fait, Beregovaya dit que cela se produit déjà avec GPT-4, le modèle de langage le plus avancé d'OpenAI.

"GPT-4 produit déjà des copies de traduction automatique - souvent de qualité supérieure, pour certaines directions de traduction, à la traduction automatique neuronale", a-t-elle déclaré. "Y aura-t-il une réelle convergence technologique ? C'est à voir. Mais ils apprendront et récolteront certainement les uns des autres."

Perspectives d'avenirL'avenir de l'IA : comment l'intelligence artificielle va changer le monde

Les outils de traduction automatique modernes présentent de nombreux avantages, en particulier dans les applications professionnelles.

La traduction automatique est essentiellement un "amplificateur de productivité", selon Rick Woyde, directeur technique et directeur marketing de la société de traduction Pairaphrase. Il peut fournir des traductions cohérentes et de qualité à grande échelle et à une vitesse et une capacité qu'aucune équipe de traducteurs humains ne pourrait accomplir seule.

Et avec des améliorations continues des algorithmes d'apprentissage automatiqueet la technologie informatique, la traduction automatique deviendra probablement encore plus rapide et plus efficace à l'avenir.

Les systèmes de traduction automatique peuvent également continuer à apprendre grâce à l'apprentissage non supervisé, une forme d'apprentissage automatique qui implique le traitement d'entrées et de sorties de données non étiquetées afin de prédire les résultats. Avec l'apprentissage non supervisé, un système peut identifier par lui-même des modèles et des relations entre des données non étiquetées, ce qui lui permet d'apprendre de manière plus autonome.

C'est idéal pour la traduction automatique. Au fur et à mesure que davantage de contenu est produit et alimenté, la qualité de leurs traductions peut s'améliorer. Les moteurs peuvent apprendre de nouveaux mots, phrases et même de nouvelles langues au fil du temps.

La traduction automatique effectue une grande partie du travail initial de la traduction linguistique, minimisant le besoin d'intervention humaine, ce qui peut réduire à la fois les coûts et les délais de livraison. Par exemple, les entreprises peuvent intégrer un moteur de traduction automatique dans leur système de gestion de contenu pour traduire automatiquement les informations qu'il contient dans différentes langues sans avoir à payer une équipe de personnes pour le faire à la main.

"Vous pouvez faire beaucoup plus aujourd'hui avec moins de monde", a déclaré Woyde. "La comparaison des coûts est ridiculement en faveur de la technologie d'aujourd'hui."

"La comparaison des coûts est ridiculement en faveur de la technologie d'aujourd'hui."

Cela ne veut pas dire que la traduction automatique éliminera complètement les traducteurs humains. Au contraire, leurs emplois vont simplement changer. Au fur et à mesure qu'un modèle de traduction automatique est en cours de formation, les traducteurs humains peuvent créer des glossaires de termes spécifiques et les traductions correctes de ces termes. Ils deviennent, en quelque sorte, des ingénieurs logiciels qui dictent les règles qu'une machine doit suivre. Ensuite, une fois la traduction terminée, ils peuvent entrer et apporter des modifications ou des modifications si nécessaire.

Ce type de travail est particulièrement important pour créer un modèle de traduction automatique plus adapté à un secteur ou à une entreprise spécifique. Par exemple, le mot « embrayage » dans l'industrie automobile signifie quelque chose de très différent de ce qu'il est dans l'industrie de la mode, et un système de traduction automatique peut avoir besoin d'un humain pour l'enseigner.

"Avec un glossaire, vous pouvez réduire de 50 % vos erreurs", a déclaré Woyde. "C'est un peu vers là que nous nous dirigeons. Là où vous pouvez utiliser de plus petites quantités de données pour améliorer la traduction que vous obtenez d'une machine. Et vous pouvez le faire à grande échelle."

La traduction automatique peut être un moyen bon marché et efficace d'améliorer l'accessibilité. De nombreux grands fournisseurs de traduction automatique proposent des centaines de langues et peuvent fournir des traductions simultanément pour plusieurs langues à la fois, ce qui peut être utile pour atteindre rapidement un public multilingue.

Il ne s'agit pas seulement de briser les barrières linguistiques non plus. Les personnes aveugles ou malvoyantes peuvent utiliser la technologie de synthèse vocale compatible avec la traduction automatique afin qu'un texte puisse être traduit et lu à haute voix simultanément, ce qui leur permet d'accéder aux informations de manière beaucoup plus pratique.

En éliminant les barrières linguistiques et en améliorant l'expérience utilisateur, la traduction automatique peut accroître l'accessibilité du contenu, des produits et des services pour les publics du monde entier.

Bien que la traduction automatique ait parcouru un long chemin et continue de profiter aux entreprises, elle n'est pas parfaite. Il existe encore plusieurs défis liés à la formation des systèmes de traduction automatique et de nombreux cas où cette technologie n'est pas une solution idéale.

Comme tout modèle d'IA, les systèmes de traduction automatique ne savent que ce qui y est mis dans leur ensemble de données de formation. Et parce que l'apprentissage en profondeur utilise des méthodes non supervisées, ils apprennent tout en extrayant des données du monde, que ces données soient biaisées ou non. En conséquence, ils héritent des mêmes problèmes et préjugés qui existent dans le monde réel.

Cela est particulièrement vrai pour les langues qui doivent classer leurs noms comme masculins ou féminins, comme le français et l'espagnol. Par exemple, si les mots "docteur" et "infirmière" sont traduits de l'anglais vers l'espagnol, ils doivent avoir un genre lié à eux. Les genres que le moteur de traduction automatique décide d'utiliser seront probablement liés au genre prédominant associé aux médecins et aux infirmières dans ses données de formation.

"Cela reproduit en quelque sorte le monde tel qu'il est, pas tel que nous voulons qu'il soit."

"Il prédira que les infirmières sont des femmes et que les médecins sont des hommes", a déclaré le professeur de linguistique Taboada. "Cela reproduit en quelque sorte le monde tel qu'il est, pas tel que nous voulons qu'il soit."

Pendant ce temps, d'autres ensembles de données de formation peuvent contenir une quantité de données démesurée dans certaines langues, et pas assez dans d'autres, ce qui signifie que le moteur de traduction automatique ne fonctionnera pas aussi précisément pour ces langues sous-représentées. Ses algorithmes peuvent ne pas être en mesure de différencier les nuances comme les dialectes, rendant les traductions inadéquates.

En savoir plus sur AI BiasHey Siri, les assistants vocaux AI renforcent-ils les préjugés sexistes ?

Dans de nombreux cas, la traduction automatique ne générera pas de sortie précise sans quelques modifications ou l'assistance d'humains. Peu importe la quantité de données que l'on jette dans un moteur de traduction automatique, il aura du mal avec les subtilités du langage.

La traduction automatique a tendance à se heurter à différentes règles de syntaxe ou de grammaire spécifiques à des langues particulières. Et si un moteur rencontre un vocabulaire rare ou spécialisé sur lequel il n'a pas été formé, comme des termes de l'industrie ou du jargon spécifique à l'industrie, il peut cracher des traductions incorrectes ou incomplètes s'il n'y a pas d'humain dans la boucle pour faire des modifications.

Et de nombreuses langues contiennent des expressions idiomatiques qui n'ont aucun sens lorsqu'elles sont traduites littéralement. Par exemple, avoir une « grenouille dans la gorge » ne signifie pas que quelqu'un a un amphibien dans la bouche ; cela signifie qu'ils ont perdu leur voix. Un moteur de traduction automatique ne s'en apercevrait probablement pas et le traduirait simplement littéralement, ce qui pourrait entraîner des résultats assez gênants dans d'autres langues.

Cela fait de la traduction automatique une solution moins qu'optimale pour traduire plus de créations, comme des romans ou même du journalisme narratif. La traduction automatique n'a pas la nuance ou le savoir-faire contextuel pour passer au crible Guerre et Paix, une œuvre de fiction écrite à l'origine en russe, et la traduire de manière adéquate dans n'importe quelle autre langue.

"La traduction automatique n'a pas de cerveau."

"La traduction automatique n'a pas de cerveau", a déclaré Beregovaya de Smartling. "C'est un réseau de neurones, mais c'est un modèle mathématique. Et le modèle mathématique n'est pas conçu pour comprendre les figures de style."

Bien que les moteurs de traduction automatique excellent dans l'analyse de phrases entières, ils ont encore du mal à comprendre la relation d'une phrase avec les phrases qui la précèdent et la suivent. Ainsi, si une personne voulait traduire "Mary est médecin. Le médecin est entré dans la pièce" en espagnol, le moteur traduirait correctement "docteur" en "médica" dans la première phrase, mais le traduirait ensuite de manière incorrecte en "médico" dans la deuxième phrase, car il ne se souvient pas du contexte du médecin étant une femme nommée Mary de la phrase précédente.

Ce problème peut apparaître dans d'autres formes de contexte, comme le ton ou la culture.

Par exemple, certaines langues utilisent des pronoms différents selon la personne à qui l'on s'adresse - si une personne s'adresse à son ami en français, elle dirait "tu" pour vous, mais si elle s'adresse à son patron, elle dira "vous". Un moteur de traduction automatique ne connaîtrait probablement pas cette complexité, car il ne comprend pas comment la grammaire française s'entremêle avec le contexte et la culture.

Lecture connexeVous voulez utiliser l'IA ? Investissez d'abord dans l'intelligence d'affaires

La traduction automatique fonctionne généralement mieux lorsque le contenu source est plus instructif et simple que créatif, ou si l'objectif final est de faire passer un message rapidement plutôt que de générer une traduction impeccable et nuancée.

"C'est [bon pour] ce que nous appellerions" gisting "", a déclaré Woyde de Pairaphrase, "où je veux comprendre l'essentiel de l'idée."

Pour les entreprises comptant de nombreux employés répartis dans le monde entier, l'envoi de communications uniformes et complètes à l'échelle de l'entreprise peut être difficile à gérer. Les compétences linguistiques peuvent varier d'un bureau à l'autre, d'un employé à l'autre, et certains peuvent ne pas maîtriser la langue officielle des opérations de l'entreprise.

La traduction automatique peut aider à réduire ou à éliminer cette barrière linguistique en permettant aux entreprises de traduire leurs communications internes à grande échelle. Cela peut être utile pour créer des tickets de support technique, des bulletins d'entreprise, des présentations et du matériel de formation.

Il en va de même pour les communications externes, où une entreprise souhaite pouvoir atteindre un public mondial avec efficacité. C'est bon pour traduire des vidéos, des articles de blog, des supports marketing et du contenu généré par les utilisateurs, comme des critiques de produits.

Par exemple, Beregovaya dit que des entreprises comme Tripadvisor utilisent la traduction automatique pour traduire tous leurs avis d'utilisateurs depuis des années, permettant aux clients de déterminer quel est le meilleur restaurant de Santorin, par exemple, sans avoir à connaître le grec.

Pour les communications externes et internes, la traduction automatique peut être effectuée avec ou sans traducteur humain dans la boucle, tant qu'il n'est pas impératif que le matériel maîtrise parfaitement la langue traduite.

La traduction automatique avec des humains impliqués dans la formation ou la post-édition concerne davantage le contenu qui est peut-être trop compliqué pour qu'un moteur de traduction automatique puisse le gérer seul. Ou les enjeux peuvent être trop élevés si le moteur se trompe. C'est bon pour traduire du contenu dans des espaces hautement réglementés comme le droit et la médecine - donc des choses comme les brevets, les poursuites, les résultats d'essais cliniques et les avertissements de médicaments.

"Avec un humain dans la boucle, vous produisez des traductions 100 % adéquates, utilisables, fluides, grammaticalement correctes et conformes à la marque", a déclaré Beregovaya. "A partir de là, les cas d'utilisation se développent indéfiniment."

Voici une poignée d'outils de traduction automatique inaugurant une nouvelle ère de traduction linguistique basée sur la technologie.

Sans doute l'outil de traduction automatique le plus populaire, Google Translate propose des services de traduction gratuits dans plus de 100 langues. Il a été l'un des premiers moteurs de ce type à mettre en œuvre la traduction automatique neuronale, désormais une pratique courante dans l'industrie.

À l'aide de la traduction automatique neuronale, la plate-forme traduit le texte saisi directement dans son interface. Et il est intégré à Google Docs pour permettre aux utilisateurs d'y traduire directement du texte. Les utilisateurs peuvent également prendre une photo de quelque chose - un panneau de signalisation ou un journal, par exemple - et Google Traduction traduira automatiquement le texte de cette image dans une autre langue.

Microsoft Translator permet aux utilisateurs de tout traduire, des conversations en temps réel aux menus en passant par les documents Word. Il dispose également d'une fonction de traducteur personnalisé destinée spécifiquement aux entreprises, aux développeurs d'applications et aux fournisseurs de services linguistiques pour créer un système de traduction neuronale adapté à leurs propres besoins. Avec Custom Translator, les utilisateurs peuvent également personnaliser le texte à l'aide du service Translator sur Azure et la traduction vocale à l'aide du service Speech dans Azure.

Microsoft propose également des fonctionnalités de traduction personnalisées spécialement conçues pour l'éducation, fournissant des outils capables de traduire et de sous-titrer des conférences et des présentations, des conférences parents-enseignants et des groupes d'étude.

Avec Pairaphrase, les entreprises peuvent tout traduire, des PDF numérisés aux e-mails. Une fois qu'ils ont effectué une traduction, la plate-forme conserve ces informations et utilise l'apprentissage automatique pour améliorer sa qualité au fil du temps.

Pairaphrase offre également un composant de sécurité des données - une distinction importante à une époque où l'IA générative et d'autres modèles d'intelligence artificielle posent de nouveaux types de risques pour la confidentialité des données. La plate-forme permet aux entreprises de garder tous les documents propriétaires, traductions, glossaires, etc. totalement confidentiels et sécurisés, et de ne jamais les partager publiquement ou les indexer dans les moteurs de recherche.

En savoir plusContenu généré par l'IA et droit d'auteur : ce que nous savons

Amazon Translate utilise la traduction automatique neuronale pour permettre des traductions linguistiques rapides et de haute qualité. La plate-forme s'améliore continuellement pour produire des traductions plus précises au fil du temps et ajoute constamment de nouvelles langues.

Translate peut être intégré aux autres canaux d'une entreprise et peut traiter du contenu dans différents formats. Sa personnalisation et son évolutivité le rendent facile à utiliser pour toutes sortes de projets, de la traduction de contenu généré par les utilisateurs à l'ajout de traduction en temps réel dans les applications de chat, de messagerie, d'assistance et de billetterie.

L'outil de traduction automatique de Smartling est utilisé par des centaines d'entreprises, dont Lyft, Shopify et Peloton, pour automatiser et créer des sites Web multilingues, des campagnes marketing, des produits Web et mobiles et des expériences client.

Sa plate-forme de gestion de traduction automatique basée sur le cloud offre une gestion de contenu et de flux de travail basée sur l'IA, des tableaux de bord de performance et de progression et une ingestion de contenu automatisée. Les clients peuvent soit utiliser l'un des traducteurs humains de Smartling, avec qui ils peuvent communiquer directement et partager des guides de style et des glossaires, soit son moteur de traduction automatique neuronale.

La plate-forme dite "LangOps" d'Unbabel combine à la fois la traduction humaine et la traduction automatique pour aider les entreprises à fournir des services d'expérience client multilingues et à se développer sur de nouveaux marchés. Cela inclut des traductions de chat en temps réel entre les agents du service client et les clients, des communiqués de presse, des campagnes de marketing par e-mail, des livres électroniques et des livres blancs.

Unbable est capable de s'intégrer directement dans le CRM d'une entreprise et l'avocat dans les canaux numériques qu'ils utilisent déjà, y compris le courrier électronique, le chat et les médias sociaux. La société affirme qu'elle peut aider les entreprises à déployer leur contenu jusqu'à 65 % plus rapidement et à réduire leurs coûts de plus de moitié par rapport à l'utilisation de traducteurs humains.