Dữ liệu dùng chung khai thông cho chuyển đổi số
Anh Nguyễn Hữu L. hiện thường trú tại Q.5 (TP.HCM) muốn làm giấy chứng nhận độc thân. Chị Lê Thị B.N. quê gốc Trà Vinh nay thường trú tại TP.HCM có chi tiết nhân thân chưa chính xác trong cơ sở dữ liệu quốc gia về dân cư. Trước đây, họ phải về tận các địa phương từng ở hay quê gốc để xác nhận. Còn khi công an phường xã địa phương nơi người dân đang cư trú có thể kết nối với các cơ quan bạn để xác minh và chỉnh sửa sai sót ngay từ cơ sở dữ liệu quốc gia, không cần thiết phải do chính cơ quan gốc mới làm được nữa, người dân sẽ vừa giải quyết được giấy tờ nhanh chóng, vừa tránh được những phiền hà, tốn kém.
Sau nhiều chục năm tiến hành tin học hóa rồi số hóa và triển khai cuộc Cách mạng Công nghiệp lần thứ 4 trên diện rộng cả nước, Việt Nam đang tiến hành công cuộc chuyển đổi số toàn diện quốc gia với lợi thế là kho dữ liệu số khổng lồ – nguồn tài nguyên số quý giá. Vướng mắc nằm ở chỗ, các dữ liệu này hầu hết còn nằm phân tán, rải rác tại các địa phương, bộ ngành có chức năng quản lý. Chẳng hạn, ngành Tư pháp quản lý nên có cơ sở dữ liệu về hộ tịch (sinh, tử, kết hôn); ngành Công an có cơ sở dữ liệu về cư trú, giấy tờ tùy thân; ngành Giáo dục và Đào tạo có cơ sở dữ liệu về học tập; ngành Y tế có cơ sở dữ liệu về sức khỏe,… Tình trạng trùng lắp và cát cứ cục bộ gây lãng phí rất lớn. Chính việc nguồn dữ liệu phân mảnh như vậy đã gây nên tình trạng thiếu đồng bộ trong chuyển đổi số, làm chậm tiến trình xây dựng chính quyền số, kinh tế số và xã hội số.
Thực tế là kho dữ liệu rất mênh mông và có những thông tin chuyên ngành không thể chia sẻ rộng rãi. Vì thế, cần có cơ quan quản lý cấp cao nhất của địa phương (ở đây là UBND tỉnh, thành) cũng như của Chính phủ quy định cụ thể và minh bạch những gì là cơ sở dữ liệu dùng chung, mức độ được truy cập chúng theo từng cấp quản lý và thừa hành.
Chẳng hạn, hồi tháng 2-2023, UBND TP.HCM đã ban hành Quyết định số 328/QĐ-UBND phê duyệt Chiến lược quản trị dữ liệu của TP.HCM đến năm 2025, định hướng đến năm 2030. Và mới nhất, trong tháng 10-2023, Chủ tịch UBND TP.HCM đã ban hành Danh mục cơ sở dữ liệu dùng chung của TP.HCM. Theo đó, TP HCM có tổng cộng 45 cơ sở dữ liệu dùng chung về nhiều lĩnh vực: đô thị, thông giao, y tế, giáo dục, môi trường, lao động – việc làm, hành chính, chính sách, viễn thông… Chúng được tích hợp về Kho dữ liệu dùng chung thành phố để chia sẻ cho các đơn vị có nhu cầu khai thác và sử dụng. Tài liệu hướng dẫn kỹ thuật các dịch vụ chia sẻ dữ liệu cho các đơn vị có nhu cầu khai thác và sử dụng cũng được TP.HCM công bố trên Cổng Thông tin dữ liệu TP.HCM.
Trong việc xây dựng kho dữ liệu dùng chung và hệ sinh thái mở của mình, TP.HCM đưa ra 3 tập thực thể quan trọng nhất là “người dân”, “thửa đất” và “doanh nghiệp”. Từ đó, TP.HCM xây dựng 3 nhóm dữ liệu chính là cơ sở dữ liệu về đất đai – đô thị (bản đồ địa chính, quản lý đất đai, thông tin địa lý); cơ sở dữ liệu người dân (thông tin nhân khẩu – cư trú, hộ tịch); và cơ sở dữ liệu tài chính -doanh nghiệp (đăng ký kinh doanh, người nộp thuế, xuất – nhập khẩu). Tại Triển lãm và Hội nghị TECH4LIFE 2023 với chủ đề “Công nghệ nâng tầm cuộc sống 2023” do TP.HCM tổ chức hồi thượng tuần tháng 10-2023, bà Võ Thị Trung Trinh, Phó Giám đốc Sở Thông tin và Truyền thông, cho biết: bên cạnh việc tập trung xây dựng 3 nhóm dữ liệu số nói trên, TP.HCM đồng thời mở rộng xây dựng hạ tầng số và tăng cường an toàn thông tin. TP.HCM cũng triển khai nền tảng số của các hạ tầng thông tin quy mô thành phố, thực hiện chuyển đổi số, xây dựng hệ sinh thái sáng tạo, đổi mới, triển khai chương trình trí tuệ nhân tạo (AI), nền tảng dữ liệu mở… Bà Võ Thị Trung Trinh nhấn mạnh, đây là những nền tảng cơ bản để thúc đẩy phát triển đột phá kinh tế số tại TP.HCM.
Trong một lần chia sẻ với báo giới trước đây, bà Võ Thị Trung Trinh cũng khẳng định: Cơ sở dữ liệu dùng chung với cái lõi là các thực thể quản lý nhà nước chính là chìa khóa xây dựng chính quyền số.
Tất nhiên, ngoài các kho dữ liệu dùng chung của cấp tỉnh thành và các bộ ngành, chúng ta cần có kho dữ liệu dùng chung cấp quốc gia. Trên quy mô quốc gia, kho dữ liệu dùng chung có nguồn từ các cơ sở dữ liệu quốc gia và các tỉnh thành, bộ ngành. Với đặc thù của mình, Cơ sở dữ liệu Quốc gia về Dân cư do Bộ Công an quản lý là cái lõi của kho dữ liệu dùng chung quốc gia. Ngày 4-11-2022, Bộ Công an đã ban hành Thông tư số 46/2022/TT-BCA quy định về việc kết nối, chia sẻ và khai thác thông tin giữa Cơ sở dữ liệu Quốc gia về Dân cư với cơ sở dữ liệu quốc gia, cơ sở dữ liệu chuyên ngành và hệ thống thông tin khác. Nguyên tắc kết nối, chia sẻ và khai thác thông tin này phải tuân thủ quy định của pháp luật về bảo vệ dữ liệu cá nhân; bảo đảm các quy định về bảo mật, an ninh, an toàn thông tin mạng theo quy định của pháp luật hiện hành. Không làm ảnh hưởng đến quyền lợi và trách nhiệm của cơ quan, tổ chức, cá nhân có liên quan, không được xâm phạm quyền về đời sống riêng tư, bí mật cá nhân, bí mật gia đình trừ trường hợp pháp luật khác có quy định.
Cơ sở dữ liệu dùng chung luôn phải dựa trên hạ tầng số đủ mạnh và an toàn. May mắn là hiện nay chúng ta có đa dạng các công nghệ phần cứng lẫn thuật toán hỗ trợ, như trí tuệ nhân tạo, dữ liệu lớn, đám mây,…
Vấn đề còn lại nằm ở chỗ xây dựng kho dữ liệu dùng chung ra sao và khai thác nó như thế nào. Đặc biệt là chuyện khai thác cần thông thoáng, mở rộng nhưng vẫn bảo đảm an toàn tối đa. Kho dữ liệu dùng chung dù phong phú đến mấy mà không khai thác tối đa được thì quả là một sự lãng phí. Xã hội số trên quy mô quốc gia chắc chắn sẽ cần phải có kho dữ liệu dùng chung được tích hợp với các kho dữ liệu dùng chung cấp tỉnh thành, bộ ngành.
- Bản in trên báo Người Lao Động Thứ Tư 1-11-2023 và trên báo NLĐ Online.
ANH PHÚC