Dữ liệu quốc gia phải là dữ liệu lớn và dữ liệu “sống” có thể dùng chung
Từ đầu năm 2023 đến nay, cả thế giới – trong đó có Việt Nam – phát sốt phát nóng lên với ứng dụng chatbot siêu trí tuệ nhân tạo AI là ChatGPT do công ty khởi nghiệp công nghệ Mỹ OpenAI phát triển và huấn luyện. Một trong những yếu tố quyết định làm nên sự thông tuệ của ChatGPT chính là ở nguồn dữ liệu khổng lồ mà nó được huấn luyện. Không có dữ liệu thì các chatbot như công cụ này chẳng thể làm nên trò trống gì.
Tìm kiếm trên Google Search vào trung tuần tháng 2-2023, ta có được 16,49 tỷ kết quả với từ khóa “data” và 105 triệu kết quả với từ khóa “dữ liệu”.
Dũ liệu có 2 loại: lưu trữ, sao lưu và phục vụ xử lý công việc. Dữ liệu lưu trữ là dữ liệu chết. Còn dữ liệu sống là dữ liệu được truy xuất phục vụ cho cuộc sống hàng ngày.
DataCamp, một công ty có mục tiêu dân chủ hóa các kỹ năng dữ liệu cho mọi người, đã nêu ra 5 mục đích khiến dữ liệu trở nên quan trọng: cho việc ra quyết định dựa trên thông tin; giải quyết vấn đề; hiểu biết rộng lớn hon; cải thiện các tiến trình; và hiểu cách ứng xử.
Ông Martijn Theuwissen, COO của DataCamp, nói rằng: “Dữ liệu là cốt lõi của một doanh nghiệp ngày nay. Tuy nhiên, hầu hết các công ty chỉ phân tích một phần dữ liệu của họ và làm như vậy không hiệu quả. Nhiều người chuyển giao kiến thức khoa học dữ liệu cho một nhóm nhỏ trong công ty. Do đó, họ phải đối mặt với khoảng cách kỹ năng khổng lồ mà họ không thể tuyển dụng được. Điều này đi ngược lại với các sáng kiến chuyển đổi dữ liệu mà hầu hết các công ty đang trải qua ngày nay. Dân chủ hóa các kỹ năng dữ liệu và làm cho dữ liệu của toàn bộ tổ chức trở nên trôi chảy là mục tiêu của chúng tôi.”
Tại Hội nghị Sơ kết 1 năm triển khai Đề án phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử phục vụ chuyển đổi số quốc gia giai đoạn 2022-2025, tầm nhìn đến năm 2030 (Đề án 06) và tổng kết hoạt động năm 2022, triển khai các nhiệm vụ năm 2023 và trong thời gian tới của Ủy ban Quốc gia về chuyển đổi số tổ chức trực tiếp tại Hà Nội và kết hợp trực tuyến toàn quốc ngày 25-12-2022, Thủ tướng Chính phủ Phạm Minh Chính, Chủ tịch Ủy ban Quốc gia về chuyển đổi số, đã nhấn mạnh: năm 2023 là “Năm Dữ liệu số, tạo lập và khai thác dữ liệu để tạo ra giá trị mới”, dứt khoát phải xây dựng Trung tâm Dữ liệu Quốc gia (DLQG) để phục vụ ngày càng tốt hơn cho người dân, doanh nghiệp. Về quan điểm chỉ đạo, Thủ tướng nhấn mạnh phải xác định chuyển đổi số là quá trình chuyển đổi cả về tư duy, nhận thức và hành động; chuyển từ thủ công truyền thống sang môi trường số; đổi mới căn bản, toàn diện, nâng cao hiệu lực, hiệu quả hoạt động quản lý, quản trị, điều hành của chính phủ, các bộ, ngành, địa phương; đổi mới hoạt động sản xuất kinh doanh của doanh nghiệp, phương thức sống, làm việc của người dân nhằm tăng năng suất lao động, nâng cao năng lực cạnh tranh của doanh nghiệp và quốc gia, góp phần xây dựng nền kinh tế độc lập, tự chủ gắn với hội nhập quốc tế sâu rộng, thực chất, hiệu quả. (Nguồn: Báo Chính phủ).
Lễ khai trương cơ sở dữ liệu quốc gia về dân cư ngày 25-2-2021. (Nguồn: VNPT).
Chuyển đổi số toàn diện quốc gia rõ ràng làm một trong những điều mà người đứng đầu Chính phủ hiện nay có nhiều tâm huyết. Ngày 9-2-2023, trong chuyến công du ở Singapore, Thủ tướng Phạm Minh Chính đã đặt câu hỏi với giới chức liên quan của quốc đảo này: “Yếu tố nào là quan trọng nhất, quyết định cho việc triển khai một chính phủ số thành công?” Trước đó, Thủ tướng đã được ông ông Sim Feng-Ji, Phó Giám đốc Cơ quan Quốc gia Thông minh của Singapore, thuyết trình thêm về chiến lược xây dựng “quốc gia thông minh”. Theo đó, chiến lược này gồm ba nhánh chính là xã hội số, kinh tế số và chính phủ số.
Và cả 3 nhánh của “quốc gia thông minh” đó đều được vận hành dựa trên dữ liệu quốc gia.
Dữ liệu là cốt lõi của mọi hoạt động số ngày nay. Nó là xương sống của chuyển đổi số. Ở Việt Nam, trong thời gian qua, đặc biệt là một vài năm gần đây nhất, nỗ lực xây dựng các cơ sở dữ liệu (CSDL) dùng chung, CSDL quốc gia chuyên ngành về nhiều lĩnh vực đã được đẩy mạnh và đạt được những kết quả ban đầu khích lệ.
Báo cáo tại hội nghị sơ kết 2022 của Ủy ban Quốc gia về chuyển đổi số cho biết: các CSDL quốc gia, chuyên ngành được đẩy mạnh triển khai xây dựng, kết nối, chia sẻ; tạo tiện ích trong việc cung cấp dịch vụ công trực tuyến cho người dân, doanh nghiệp (quản lý dân cư, đăng ký doanh nghiệp, bảo hiểm, hộ tịch điện tử…).
Bộ Công an đã triển khai CSDL quốc gia về dân cư, từng bước hình thành hệ sinh thái công dân số; tính đến nay đã kết nối, liên thông với 12 bộ, ngành, 35 địa phương, và 4 tập đoàn, tổng công ty nhà nước. Dịch vụ công trực tuyến được triển khai ngày càng sâu rộng, hiệu quả. Cổng Dịch vụ Công Quốc gia đã cung cấp gần 4.400 dịch vụ công trực tuyến mức độ 3, 4 (gấp 3 lần năm 2021).
Thực tế cho thấy, các CSDL, đặc biệt là CSDL quốc gia, chỉ có thể phát huy tối đa tác dụng – nhất là về tính đồng bộ, dùng chung – nếu như chúng được tập trung về một đầu mối quản lý điều hành. Điều này còn giúp tăng hiệu quả đầu tư và tính an toàn dữ liệu, bảo mật thông tin. Vì thế, việc xây dựng một trung tâm dữ liệu quốc gia là bức thiết. Bộ Công an đã được chọn là cơ quan chủ trì về cơ sở vật chất của trung tâm này do có những yếu tố thích hợp nhất, nhưng phải xác định đây là một tài sản của quốc gia, mà các bộ, ngành, địa phương cần phối hợp chặt chẽ, tập trung cho nhiệm vụ tích hợp và chia sẻ, kết nối dữ liệu. Thủ tướng nhấn mạnh: Trung tâm DLQG phải lấy người dân là chủ thể phục vụ.
Đại tướng Tô Lâm, Bộ trưởng Bộ Công an, cho biết: việc kết nối và chia sẻ dữ liệu giữa CSDL quốc gia về dân cư với các bộ, ngành, địa phương thời gian qua thực chất mới chỉ là kết nối về vật lý, còn về nội dung bên trong CSDL của nhiều bộ, ngành, địa phương hiện nay còn rất nhiều vấn đề phải bổ sung, hoàn thiện để bảo đảm “đúng, đủ, sạch, sống”.
Cũng theo Bộ Công an, quá trình thực hiện Đề án “Phát triển ứng dụng dữ liệu về dân cư, định danh và xác thực điện tử, phục vụ chuyển đổi số quốc gia giai đoạn 2022-2025, tầm nhìn đến năm 2030” thời gian qua đã bộc lộ một số hạn chế, bất cập về hạ tầng, nhân lực. Nhiều hệ thống công nghệ thông tin được đầu tư từ lâu, thiếu đồng bộ, chưa bảo đảm an ninh an toàn. Nhiều CSDL chưa được thu thập, còn lưu trữ trùng lặp, chưa được chuẩn hóa để kết nối, chia sẻ, khai thác dùng chung…
Bộ Công an đã đề nghị: để chỉ đạo tập trung, tiết kiệm, hiệu quả và rút ngắn thời gian, cần sớm xây dựng trung tâm dữ liệu lớn quốc gia phục vụ chung các bộ, ngành, địa phương.
Ngày 28-1-2023, trong Thông báo số 16/TB-VPCP, Thủ tướng đã đồng ý chủ trương xây dựng trung tâm DLQG, giao Bộ Công an chủ trì, phối hợp với các bộ, ngành, cơ quan liên quan đề xuất xây dựng Đề án Trung tâm DLQG.
Ngày 3-2-2023, Bộ Công an và Tổ Công tác Đề án 06 đã tổ chức Hội thảo cấp quốc gia lần thứ nhất về xây dựng Trung tâm DLQG với chuyên đề “Xác lập chiến lược dữ liệu đúng đắn tạo sức bật phát triển kinh tế xã hội”.
Việc xây dựng trung tâm DLQG là một công việc mới mẻ ở Việt Nam. Trong khi đó, nhiều nước trên thế giới đã có những trung tâm như vậy phục vụ cho việc vận hành chính phủ số, kinh tế số và xã hội số. Riêng ở Châu Á có những nước như Hàn Quốc, Nhật Bản, Ấn Độ, Singapore… đã xây dựng trung tâm dữ liệu quốc gia. Việt Nam có nhiều điển hình để tham khảo. Vấn đề mà mọi người quan tâm vẫn là có được một trung tâm DLQG thật sự có hiệu quả và không gây lãng phí ngân sách Nhà nước. Cụ thể, trung tâm DLQG phải dựa trên nền tảng công nghệ trí tuệ nhân tạo AI, Dữ liệu lớn, với các nguồn dữ liệu sống được tập trung thành một đầu mối (hub) và có thể dùng chung. Dữ liệu thu gom về rồi để đó chỉ là dữ liệu chết, vừa vô tích sự, vừa tốn tiền lưu trữ. Và kinh nghiệm thực tế ở Việt Nam cho thấy, một trung tâm DLQG cần phải có một nhạc trưởng đủ uy lực và thường xuyên giơ cao chiếc đũa giữ nhịp.
- Bản in trên báo Người Lao Động thứ Bảy 11-2-2023 và trên báo NLĐ Online.
ANH PHÚC