CMC propulse l’IA en langue vietnamienne sur la scène mondiale

L’Institut d’application des technologies CMC (CMC ATI) a récemment présenté le modèle de compréhension de documents visuels CATI-VLM, développé à partir d’un corpus de données de 5 To.

>> L’intelligence artificielle révolutionne l’achat immobilier au Vietnam

>> Dà Nang se voit en pôle de l'intelligence artificielle du Vietnam

>> Le Vietnam lance un plan pour attirer 100 experts de haut niveau en IA

Dans un contexte de transformation numérique et de développement rapide de l’intelligence artificielle (IA) au Vietnam, la technologie de reconnaissance optique de caractères (OCR) joue un rôle de plus en plus essentiel dans la numérisation des documents, l’automatisation des processus et l’amélioration de l’efficacité de la gestion.

Cependant, avec les spécificités de la langue vietnamienne - notamment les signes diacritiques -, la reconnaissance ne se limite pas à la simple lecture des caractères, mais exige également une compréhension approfondie du contexte linguistique et de la structure des documents.

Classement du RRC dans la catégorie DocVQA en juin 2025. 
Photo : CMC/CVN

 Le modèle de compréhension de documents visuels CATI-VLM de l’Institut d’application des technologies CMC (CMC ATI), s’est classé parmi les 12 meilleurs au monde et occupe la première place au Vietnam dans la catégorie Document Visual Question Answering (DocVQA), selon le classement publié en juin 2025 par le Robust Reading Competition (RRC).

Ce modèle est capable de répondre directement à des questions posées sur des images de documents, à la manière des systèmes d’IA générative tels que ChatGPT, mais sans nécessiter d’apprentissage préalable basé sur des formulaires spécifiques.

Le Docteur Dang Minh Tuân, directeur de CMC ATI, a déclaré : "Nous sommes très heureux que les capacités de recherche de notre équipe soient reconnues sur une scène mondiale aussi prestigieuse que le RRC. Plus encore, cela démontre notre capacité à maîtriser la technologie pour résoudre les défis spécifiques à la langue vietnamienne".

Nguyên Trung Chinh, président du groupe technologique CMC, a souligné que ce succès est le fruit de plus de dix années d’investissement en recherche et développement. "Nous sommes convaincus que l’intelligence vietnamienne a pleinement la capacité de rivaliser avec les Big Tech mondiaux."

CATI-VLM sera intégré dans l’écosystème C.OpenAI de CMC, notamment dans l’assistant virtuel CLS pour l’analyse des textes juridiques, la plateforme de numérisation SmartDoc, le système de gestion des connaissances CMC KMS, les systèmes de génération automatique de rapports et les nouvelles applications Agentic Documents.

VNA/CVN

Rédactrice en chef : Nguyễn Hồng Nga

Adresse : 79, rue Ly Thuong Kiêt, Hanoï, Vietnam

Permis de publication : 25/GP-BTTTT

Tél : (+84) 24 38 25 20 96

E-mail : courrier@vnanet.vn, courrier.cvn@gmail.com

back to top