Tech

Google Translate traduit désormais également du romani ᐉ Actualités de Fakti.bg – Curieux

L'intelligence artificielle aide Google Translate à s'étendre à 110 nouvelles langues, sa plus grande mise à jour à ce jour.

Google a annoncé dans un article de blog que cette énorme expansion inclut les langues parlées par plus de 614 millions de personnes dans le monde, soit environ 8 % de la population mondiale. La diversité est énorme – depuis les langues parlées par plus de 100 millions de personnes jusqu'aux précieux dialectes des communautés locales, a rapporté bTV.

Même les langues sans nationalité actuelle sont incluses, démontrant l'engagement de Google à préserver les langues en voie de disparition.


En plus de cette mise à jour impressionnante, Google se concentre sur les langues africaines, qui représentent environ un quart des nouveaux ajouts. Des langues comme le fon, le kikongo, le lu, le ga, le swati, le venda et le wolof font désormais partie de Google Translate, marquant le progrès le plus significatif dans l'ajout de langues africaines à ce jour.

Google comprend que traduire des langues n'est pas facile en raison des différences régionales, des dialectes et des différences orthographiques. Certaines langues, comme le romani, avec ses nombreux dialectes, n'ont pas une forme unifiée, ce qui rend la traduction difficile.


Le grand modèle linguistique PalM 2 de Google a été utile pour étendre la traduction. Il apprend les langues apparentées, permettant l'ajout de langues de type hindi telles que l'Awadhi et le Marwadi, en plus des langues créoles françaises telles que les Seychelles et le Maghreb.

L'ajout de langues largement utilisées comme le cantonais comporte ses propres défis en raison des caractères partagés avec le mandarin. Malgré ces obstacles, l'engagement de Google en faveur de la diversité linguistique est clair. Un exemple est l'inclusion du manx, une langue celtique de l'île de Man qui a pratiquement disparu en 1974. Grâce aux efforts de renaissance, le nombre de locuteurs courants a atteint des milliers.

READ  Color propose les séries GeForce RTX 3090 Ti iGame Vulcan et Neptune avec une puissance allant jusqu'à 510 W

Cette extension inclut également le panjabi, écrit en écriture Shahmukhi, la variante arabo-persane utilisée au Pakistan, où c'est la langue la plus parlée.

Avant cette extension, la plus grande mise à jour de Google Translate avait eu lieu en mai 2022 avec l'introduction de la traduction automatique Zero-Shot. Cette technique permet au modèle d'apprendre de nouvelles langues sans avoir besoin d'exemples traduits existants. Il s’agit d’une avancée majeure dans la traduction automatique qui a aidé Google à surmonter les barrières linguistiques.

Cette extension constitue un grand pas vers l'initiative 1 000 langues de Google, qui vise à utiliser des modèles d'IA pour prendre en charge 1 000 des langues les plus importantes au monde.

Taux:





appréciation 1 depuis 3 voix.

Cunégonde Lestrange

"Gourou de Twitter. Écrivain en herbe. Fauteur de troubles typique. Entrepreneur. Étudiant hipster."

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer
Fermer