Thứ Ba ngày 31 tháng 1 năm 2023

Viện CMC ATI đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo và 2 giải thưởng VLSP 2022

Viện Nghiên cứu Ứng dụng Công nghệ CMC (Applied Technology Institute – CMC ATI) thuộc Tập đoàn Công nghệ CMC đã đạt Top 1 tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo trên địa bàn TP.HCM năm 2022 với giải pháp số hóa, chuyển đổi số toàn diện văn bản, hồ sơ giấy tờ dạng ảnh C-ORC.

Hội thi Giải pháp ứng dụng trí tuệ nhân tạo lần thứ 3 năm 2022 do Sở Thông tin và Truyền thông, Thành đoàn phối hợp với Đại học Quốc gia TP HCM, Hiệp hội Phần mềm và Dịch vụ công nghệ thông tin Việt Nam (VINASA) tổ chức nhằm tìm kiếm các giải pháp ứng dụng trí tuệ nhân tạo (AI) vào các lĩnh vực cuộc sống.

Hội thi năm nay có 210 đội thi, gồm có 2 nhóm dự thi: nhóm 1 là Thử thách AI (AI Challenge) với chủ đề “Truy vấn sự kiện từ dữ liệu thị giác” (Event Retrieval from Visual Data) được tổ chức theo chuẩn của các cuộc thi quốc tế; nhóm 2 là Sản phẩm ứng dụng AI (AI solution).

Viện CMC ATI nhận giải Ba tại Hội thi Giải pháp ứng dụng trí tuệ nhân tạo.

Anh Nguyễn Tiến Đồng, đại diện đội CMC ATI  tham dự cuộc thi, cho biết, nhóm nghiên cứu giải pháp có thể số hóa toàn bộ các dạng tài liệu, văn bản, kể cả văn bản viết tay, biểu mẫu, hồ sơ… phục vụ cho các thủ tục hành chính số. Riêng văn bản chữ viết tay, mô hình của nhóm có thể nhận dạng với độ chính xác trên 95% dựa trên việc cho máy học trên tập hơn 10.000 loại dữ liệu viết tay tiếng Việt.

CMC ATI nhận cú đúp giải thưởng tại Cuộc thi Xử lý Ngôn ngữ và Tiếng nói tiếng Việt VLSP 2022

Nhóm CMC AI của Viện CMC ATI tiếp tục nhận cú đúp giải thưởng tại cuộc thi quốc tế Xử lý Ngôn ngữ và Tiếng nói tiếng Việt (International Workshop on Vietnamese Language and Speech Processing) lần thứ 9 năm 2022 – VLSP 2022 với một giải Nhất và một giải Ba.

Đây là cuộc thi được Câu lạc bộ Xử lý ngôn ngữ và tiếng nói tiếng Việt (VLSP) và Hội Tin học Việt Nam tổ chức lần thứ 9. VLSP 2022 gồm 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung – Việt, hỏi đáp đa ngữ về nội dung ảnh.

Cụ thể, nhóm CMC AI đạt giải Nhất với giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”. Đồng thời, nhóm còn giành được giải Ba với giải pháp “Mô hình transformers với khả năng mô hình hóa văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” tại cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt”.

Nhóm CMC AI của Viện CMC ATI đã nhận cú đúp giải thưởng tại Cuộc thi VLSP 2022.

Viện CMC ATI đạt giải Nhất tại cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh” trong khuôn khổ Workshop VLSP 2022.

Với cuộc thi “Hỏi đáp trực quan đa ngôn ngữ dựa trên hình ảnh”, các đội phải giải bài toán nghiên cứu đa lĩnh vực: xử lý ngôn ngữ tự nhiên và xử lý ảnh. Cuộc thi này xuất hiện lần đầu tiên tại VLSP 2022. Nhiệm vụ của các nhóm là xây dựng những mô hình/hệ thống phải có khả năng trả lời câu hỏi về nội dung ảnh bằng ngôn ngữ tự nhiên. Thêm một thách thức nữa cho các đội là câu hỏi có thể bằng tiếng Việt, tiếng Anh hoặc tiếng Nhật.

Viện CMC ATI đạt giải Ba tại cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” trong khuôn khổ chương trình VLSP 2022.

Cuộc thi “Tóm tắt tóm lược đa văn bản Tiếng Việt” (VLSP Abmusu) là một trong các tác vụ xử lý ngôn ngữ rất hữu ích để giải quyết vấn đề khai thác dữ liệu văn bản. Trong thời đại bùng nổ thông tin, khai thác dữ liệu một cách hiệu quả có tiềm năng rất lớn nhưng lại là một bài toán khó, tốn nhiều thời gian, tiền bạc và công sức. Nhận một tập tài liệu đầu vào, hệ thống tóm tắt phải chọn lọc hoặc tạo sinh một bản tóm tắt ngắn gọn cho các tài liệu này.

Để đạt được giải Nhất trong Cuộc thi VLSP 2022, team CMC AI đã thử nghiệm nhiều thuật toán khác nhau để tìm được ra thuật toán tốt nhất. Kết quả được đánh giá trên hệ thống do ban tổ chức cuộc thi cung cấp và team đã vượt qua 27 đội dự thi khác như Viettel, VinGroup, VCCorp, TopCV,… để đạt được vị trí dẫn đầu.

Toàn bộ cuộc thi diễn ra trong khoảng hơn một tháng, trong đó thời gian để các đội thi đăng ký, chuẩn bị là khoảng 3 tuần. Thời gian để các đội nộp bài thi và cạnh tranh với nhau trên bảng xếp hạng kéo dài trong 10 ngày.

TS  Đặng Minh Tuấn, Viện trưởng Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI, chia sẻ. “Giải thưởng là kết quả của sự cố gắng của cả đội trong một khoảng thời gian tuy không quá dài nhưng hết sức cam go và thử thách. Đây cũng là minh chứng cho năng lực của team AI nói riêng cũng như Viện CMC ATI nói chung. Các bài toán trong cuộc thi nếu xử lý được rất tiềm năng trong việc tích hợp trong nền tảng trợ lý ảo mà nhóm đã và đang phát triển.”

Nói về điểm nổi bật của giải pháp “Mô hình transformers cho dữ liệu đa miền với khả năng phát hiện đối tượng cho bài toán hỏi đáp trực quan đa ngôn ngữ” của Viện CMC ATI, anh Nguyễn Tiến Đồng, Trưởng nhóm CMC AI, cho biết, đây là một một ý tưởng sáng tạo riêng, dựa trên những kinh nghiệm làm việc, cũng như khả năng chuyên môn của Viện. Giải pháp này vừa đơn giản lại vừa hiệu quả, không giới hạn trong phạm vi cuộc thi mà còn có thể áp dụng vào thực tiễn. Đây chính là sự giao thoa giữa kỹ thuật xử lý ảnh và xử lý ngôn ngữ tự nhiên. Bên cạnh đó, giải pháp còn kết hợp các thông tin về đặc trưng ảnh với các thực thể có trong ảnh để đưa ra câu trả lời. Đặc biệt, mô hình giải pháp này cho phép đưa ra câu trả lời cũng như sử dụng câu hỏi ở nhiều ngôn ngữ khác nhau, bao gồm tiếng Việt, tiếng Anh và tiếng Nhật.

Đặc biệt, với “Mô hình transformers với khả năng mô hình hoá văn bản dài cho bài toán tóm tắt tóm lược đa văn bản” đã được team CMC AI lựa chọn dựa trên việc thử nghiệm rất nhiều bộ tham số khác nhau. Mô hình này có thể xử lý được các văn bản dài cũng như các bài toán tóm tắt đơn văn bản và đa văn bản.

Ảnh mô tả yêu cầu của một bài toán trong cuộc thi VLSP 2022.

Anh Đồng chia sẻ: “Cả nhóm đã phải thử nghiệm nhiều thuật toán khác nhau nhưng có các thuật toán không đem lại kết quả như kỳ vọng. Khó khăn là vậy, nhưng team đã không nản chí và tiếp tục cố gắng trong suốt quá trình diễn ra cuộc thi để cuối cùng tìm ra một giải pháp tốt nhất và giành được vị trí cao nhất trong cuộc thi. Mỗi thời điểm bài thi được nộp lên hệ thống và thấy kết quả được cải thiện đều là những kỷ niệm đáng nhớ đối với team.”

Ông Nguyễn Trung Chính, Chủ tịch HĐQT/Chủ tịch Điều hành Tập đoàn Công nghệ CMC, Giám đốc Viện Nghiên cứu Ứng dụng Công nghệ CMC ATI, chia sẻ: “Mô hình tổ chức viện nghiên cứu trong tập đoàn rất quan trọng. CMC ATI sẽ là nơi nghiên cứu tạo ra các sản phẩm công nghệ có năng lực cạnh tranh, đem lại sự hữu ích cho sự phát triển của tập đoàn và cho xã hội. Tập đoàn chuẩn bị bước sang tuổi 30 với các thách thức và cơ hội mới. Mong rằng Viện sẽ trở thành hạt nhân để dẫn dắt những chiến lược phát triển về công nghệ kỹ thuật, đồng thời tạo ra nguồn nhân lực nghiên cứu ứng dụng chất lượng cao cho Việt Nam.”

Viện CMC ATI tiền thân là Viện Nghiên cứu Ứng dụng Công nghệ CMC (CIST) được thành lập ngày 15-7-2014. Hiện tại, CMC ATI đang có gần 60 thành viên. Các chức năng chính của Viện bao gồm nghiên cứu khoa học và phát triển công nghệ trong lĩnh vực CNTT – viễn thông; cung cấp các dịch vụ khoa học công nghệ như tư vấn, chuyển giao công nghệ, tham gia đào tạo, bồi dưỡng nâng cao nghiệp vụ chuyên môn, hợp tác trong nước và quốc tế; bên cạnh triển khai thực nghiệm và sản xuất thử nghiệm từ kết quả nghiên cứu khoa học.

Hiện tại, CMC đang tập trung xu hướng dịch chuyển các sản phẩm do Viện nghiên cứu và phát triển mang khả năng ứng dụng cao và thương mại hóa các giải pháp. Việc đổi tên Viện CMC CIST thành Viện CMC ATI cũng đánh dấu một bước chuyển mới trong chiến lược phát triển của Tập đoàn CMC. Chiến lược của CMC trong vòng 5 năm tới là phải trở thành một tập đoàn số và cung cấp dịch vụ về chuyển đổi số cho các doanh nghiệp trong và ngoài nước, đặc biệt là trong khu vực, đồng thời trở thành tập đoàn toàn cầu. Các sản phẩm, giải pháp của CMC ATI là những sản phẩm, chiến lược quan trọng góp phần đưa Tập đoàn CMC đạt được các mục tiêu, chiến lược đã đề ra trong thời gian tới.

L.N.C.

Nguồn do CMC cung cấp.