Trí tuệ nhân tạo Việt vào top 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM được xếp hạng Top 12 thế giới và Top 1 Việt Nam tại cuộc thi quốc tế Robust Reading Competition (RRC), hạng mục Document Visual Question Answering (DocVQA), tổ chức tháng 6/2025.

0907-ai-viet-nam.jpg

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị.

Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Trước thách thức đó, Viện Ứng dụng Công nghệ CMC (CMC ATI) đã phát triển mô hình CATI-VLM - một hệ thống hiểu tài liệu bằng thị giác máy tính (Visual Document Understanding).

Dựa trên kho dữ liệu lớn tới 5TB, mô hình này vừa được xếp hạng Top 12 thế giới và Top 1 Việt Nam tại cuộc thi quốc tế Robust Reading Competition (RRC), hạng mục Document Visual Question Answering (DocVQA), tổ chức tháng 6/2025./.

(TTXVN/Vietnam+)

Tin cùng chuyên mục

Biểu tượng nền tảng TikTok trên màn hình điện thoại ở Arlington, Virginia, Mỹ. (Nguồn: THX/TTXVN)

TikTok ký thỏa thuận bán chi nhánh tại Mỹ

Thỏa thuận sẽ chấm dứt cuộc tranh chấp kéo dài nhiều năm nhằm buộc công ty Trung Quốc ByteDance phải bán hoạt động kinh doanh tại Mỹ nhằm xoa dịu những lo ngại về an ninh quốc gia.

Ra mắt Cổng thông tin việc làm thành phố Hà Nội

Ra mắt Cổng thông tin việc làm thành phố Hà Nội

Nhằm phát triển bền vững thị trường lao động, Cổng thông tin việc làm thành phố Hà Nội tại địa chỉ congvieclam.hanoi.gov.vn là sự chuyển đổi toàn diện thành một hệ sinh thái số thông minh, hiệu quả.