Ứng dụng công nghệ thông tin trong điều tra thống kê và chia sẻ dữ liệu với các bộ, ngành

|

Ứng dụng công nghệ thông tin trong điều tra thống kê và chia sẻ dữ liệu với các bộ, ngành

Công nghệ thông tin được coi là một trong các trụ cột nâng cao chất lượng số liệu thống kê và đặc biệt quan trọng trong bối cảnh ứng dụng Chính phủ điện tử và cuộc cách mạng công nghiệp 4.0. Luật Thống kê quy định Nhà nước ưu tiên đầu tư phát triển và ứng dụng công nghệ thông tin - truyền thông tiên tiến trong hoạt động thống kê nhà nước. Trong những năm qua, Tổng cục Thống kê ứng dụng công nghệ thông tin mạnh mẽ trong công tác thống kê nói chung và trong điều tra thống kê, chia sẻ dữ liệu với các bộ, ngành nói riêng.
 
Kết quả đạt được

Ứng dụng CNTT trong điều tra thống kê


Triển khai Quyết định số 501/QĐ-TTg ngày 10/5/2019 của Thủ tướng Chính phủ về việc phê duyệt Đề án Ứng dụng CNTT-TT trong Hệ thống thống kê nhà nước giai đoạn 2017 - 2025, tầm nhìn đến năm 2030 (viết gọn là Đề án 501), Tổng cục Thống kê đã thực hiện nhiều hoạt động ứng dụng CNTT liên quan phục vụ điều tra thống kê, cụ thể:

Một là chuẩn hóa quy trình nghiệp vụ: Tiếp tục ứng dụng quy trình sản xuất thông tin thống kê (GSBPM) đã được ban hành mô hình cấp cao theo Quyết định số 945/QĐ-TCTK ngày 24/9/2013 của Tổng cục trưởng Tổng cục Thống kê, Dự án hỗ trợ kỹ thuật của Italia đang giúp ngành Thống kê xác định và xây dựng các chuẩn mực thống kê, từ đó xây dựng quy trình sản xuất thông tin thống kê cấp chi tiết. Để giám sát việc tuân thủ quy trình, Tổng cục đang nghiên cứu và sẽ triển khai ứng dụng công cụ Mô hình hiện đại hóa hoàn thiện (Modernisation Maturity Model - MMM).
 
 
Đoàn công tác của TCTK do bà Nguyễn Thị Hương, Phó Tổng cục trưởng TCTK làm trưởng đoàn,
giám sát công tác điều tra thu thập thông tin trong Tổng điều tra Dân số và nhà ở năm 2019
tại TP. Hồ Chí Minh
 
Hai là ứng dụng phiếu điều tra điện tử: Ngành Thống kê đã ứng dụng thành công phiếu điều tra điện tử (CAPI và webform) trong Tổng điều tra dân số và nhà ở năm 2019 đạt 99,9% (cao hơn so với mục tiêu của Đề án 501 là 80%) giúp rút ngắn thời gian thu thập thông tin và xử lý kết quả Tổng điều tra so với phương pháp truyền thống (sử dụng phiếu giấy sau đó nhập tin bàn phím hoặc quét phiếu - scaning). Bên cạnh đó, Tổng cục Thống kê từng bước ứng dụng phiếu điều tra điện tử CAPI cho các cuộc điều tra khác: Lao động việc làm, Biến động dân số, Chỉ số giá tiêu dùng.

Ba là điều hành tác nghiệp và giám sát điều tra: Các cuộc Tổng điều tra và điều tra áp dụng phiếu điện tử đã được giám sát tập trung từ Trung ương tới địa phương và các đối tượng tham gia điều tra nhằm giám sát số liệu điều tra một cách kịp thời và giải đáp các vướng mắc trong quá trình tổ chức điều tra.

Bốn là triển khai các phần mềm thu thập thông tin điều tra phiếu giấy và xử lý kết quả các cuộc điều tra theo hình thức cơ sở dữ liệu tập trung. Nhờ có hạ tầng kết nối thông suốt trong toàn ngành, việc triển khai các phần mềm nghiệp vụ theo hình thức cơ sở dữ liệu tập trung đã cải thiện tình trạng nghẽn trong gửi, nhận dữ liệu. Qua đó, số liệu điều tra được giám sát liên tục từ Trung ương đến địa phương ngay trong khâu nhập tin. Các phần mềm xử lý kết quả điều tra cũng từng bước được tích hợp theo nghiệp vụ chung để chia sẻ các tiện ích dùng chung và quản trị dễ dàng.

Năm là sử dụng dữ liệu lớn: Trong xu hướng sử dụng dữ liệu lớn (big data) trên thế giới, Tổng cục Thống kê đã triển khai nghiên cứu dữ liệu lớn trong biên soạn chỉ số giá tiêu dùng thông qua thu thập giá sản phẩm trên internet và nghiên cứu giá bất động sản. Tuy nhiên, kết quả nghiên cứu mới chỉ được dùng như nguồn tham khảo và tiếp tục đổi mới phương pháp luận để có được kết quả sát với thực tế.

Sáu là xây dựng kho cơ sở dữ liệu các cuộc Tổng điều tra và các phần mềm khai thác dữ liệu vi mô. Một số kho dữ liệu trên nền tảng MS SQL gồm: Kết quả Tổng điều tra dân số và nhà ở các năm 1999, 2009; Tổng điều tra cơ sở kinh tế, hành chính sự nghiệp các năm 2007, 2012; Tổng điều tra nông thôn, nông nghiệp và thủy sản các năm 2006, 2011, 2016; Khảo sát mức sống dân cư, Điều tra Lao động việc làm.
Bảy là phổ biến thông tin thống kê trực quan (infographic) như báo cáo tình hình kinh tế - xã hội và khai thác dữ liệu thống kê một cách tùy biến đối với một số kết quả điều tra trên trang tin điện tử của Tổng cục.

Ứng dụng CNTT trong chia sẻ dữ liệu với các bộ, ngành

Trong thời gian qua, Tổng cục Thống kê đã ký thỏa thuận hợp tác chia sẻ dữ liệu với nhiều bộ, ngành trong đó Bộ Tài chính, Bộ Nông nghiệp và Phát triển nông thôn, Bộ Y tế, Ủy ban Dân tộc, Tổng cục Thuế, Tổng cục Hải quan…Ứng dụng CNTT trong chia sẻ dữ liệu với bộ, ngành sẽ mang lại hiệu quả cao, đến nay năng lực hệ thống CNTT đã hỗ trợ thực hiện như sau:

Thứ nhất, sử dụng dữ liệu hành chính trong công tác thống kê

Ngày 26/5/2016, Bộ trưởng Bộ Kế hoạch và Đầu tư ký Quyết định số 693/QĐ-BKHĐT phê duyệt Đề án hệ thống công nghệ thông tin về kết nối, trao đổi thông tin với Tổng cục Thuế. Đến nay, hai cơ quan đã xây dựng hạ tầng công nghệ thông tin, kết nối truyền đưa dữ liệu một cách tự động. Đồng thời, Tổng cục Thống kê đã và đang triển khai xây dựng và khai thác CSDL nhận được từ Tổng cục Thuế phục vụ cho công tác thống kê nói chung và điều tra doanh nghiệp hàng năm nói riêng.

Hiện, thông tin định danh về đối tượng nộp thuế do Tổng cục Thuế cung cấp được Tổng cục Thống kê sử dụng hiệu quả, đặc biệt trong khâu ra soát doanh nghiệp thuộc Tổng điều tra kinh tế năm 2017; và điều tra doanh nghiệp hàng năm, từ đó xác định và thống nhất với cơ quan Thuế về phạm vi và đơn vị điều tra đối với khu vực doanh nghiệp.

Bên cạnh đó, thông tin khai thác từ báo cáo tài chính được sử dụng để so sánh, đối chiếu, làm sạch dữ liệu của Điều tra doanh nghiệp hàng năm. Từ năm 2018, nguồn dữ liệu này được Tổng cục Thống kê sử dụng để thay thế một số chỉ tiêu về tài chính, bảng tổng kết tài sản,… của doanh nghiệp trong phiếu điều tra doanh nghiệp hàng năm, từ đó giúp tiết kiệm được thời gian thu thập, xử lý và kinh phí của điều tra doanh nghiệp và giảm gánh nặng trả lời bảng hỏi điều tra cho doanh nghiệp.

Hệ thống kết nối, trao đổi thông tin này được xây dựng theo trục tích hợp ESB để Tổng cục Thống kê tiến tới mở rộng kết nối với các bộ, ngành.

Thứ hai, thực hiện chế độ báo cáo quốc gia

Triển khai Nghị định số 60/2018/NĐ-CP ngày 20/4/2018 của Chính phủ quy định chi tiết nội dung Chế độ báo cáo thống kê cấp quốc gia, Tổng cục Thống kê đã xây dựng phần mềm gửi nhận Chế độ báo cáo thống kê cấp quốc gia quản lý tình hình gửi nhận báo cáo từ bộ, ngành. Đây là công cụ giúp bộ, ngành thực hiện trách nhiệm gửi báo cáo thống kê được phân công, qua đó lưu trữ bài bản báo cáo thống kê mỗi bộ, ngành theo thời gian. Hệ thống đã được các bộ, ngành thử nghiệm và đánh giá rất hữu ích. Hệ thống đi vào áp dụng chính thức sẽ giúp ngành Thống kê quản lý tình hình gửi nhận báo cáo và nhận báo cáo thống kê kịp thời.

Thứ ba, chia sẻ dữ liệu thống kê với bộ, ngành

Bên cạnh việc nhận dữ liệu của bộ, ngành, Tổng cục Thống kê cũng chủ động chia sẻ dữ liệu thống kê với các bộ, ngành phục vụ công tác xây dựng và hoạch định chính sách: (i) Tại hệ thống công nghệ thông tin về kết nối, trao đổi thông tin với Tổng cục Thuế, tất cả chỉ tiêu thống kê quốc gia được quản lý tập trung và định kỳ gửi cho Tổng cục Thuế sau khi họp báo công bố số liệu thống kê; (ii) Các dữ liệu thống kê được công bố trên trang tin điện tử của Tổng cục theo báo cáo chuyên đề và dữ liệu tổng hợp; đồng thời cho phép khai thác dữ liệu thống kê một cách tùy biến bằng công cụ PCX hoặc một số kho dữ liệu về Tổng điều tra; (iii) Tổng cục Thống kê phối hợp với Bộ Tài chính xây dựng Trang dữ liệu tóm tắt quốc gia (NSDP) chia sẻ số liệu về tài chính và kinh tế vĩ mô theo các định dạng Excel và SDML đồng thời cung cấp thông tin về metadata liên quan.

Một số hạn chế, bất cập

Tổng cục Thống kê là một trong những cơ quan tiên phong xây dựng Kiến trúc tổng thể, trong đó kiến trúc nghiệp vụ ứng dụng quy trình sản xuất thông tin thống kê năm 2012 bao gồm 7 bước ở quy trình cấp cao. Hiện nay, hầu hết các khâu của quy trình sản xuất thông tin thống kê đã ứng dụng công nghệ thông tin nhưng chưa đồng bộ, mỗi khâu của mỗi công việc ứng dụng theo một cách khác nhau. Hiện chưa có một ứng dụng đồng bộ nào cho toàn bộ quy trình sản xuất. Do vậy, hiện trạng dữ liệu thống kê hiện cũng được quản lý theo nhiều hệ quản trị dữ liệu và phân tán khắp nơi trong ngành Thống kê từ Trung ương đến địa phương (bao gồm cả một số dữ liệu đã tập trung về Trung ương nhưng vẫn chưa thống nhất, thiếu tính liên kết theo không gian và thời gian). Có thể kể đến như: Trong khâu xác định nhu cầu thông tin và khâu chuẩn bị thu thập, chưa có một công cụ hỗ trợ nào, hầu như thực hiện thủ công trên word và excel; Khâu thu thập thông tin: Kênh điều tra thống kê đã được ứng dụng CNTT theo kịp xu thế công nghệ trên thế giới và đang từng bước chuyển đổi từ phiếu giấy (phương pháp nhập tin bàn phím và ứng dụng công nghệ quét - scan- ing) sang phiếu điều tra điện tử. Tuy nhiên, mỗi cuộc điều tra, mỗi kỳ điều tra ứng dụng khác nhau, rất nhỏ lẻ, phân tán, thiếu thống nhất. Kênh báo cáo thống kê và khai thác dữ liệu hành chính mới chỉ bước đầu ứng dụng công nghệ thông tin hiện đã kết nối sử dụng dữ liệu quản lý thuế và thu nhận báo cáo từ các bộ, ngành thông qua ứng dụng; Khâu tổng hợp thông tin: Tổng hợp dữ liệu điều tra đã được thực hiện trực tiếp trên các phần mềm xử lý kết quả cuộc điều tra riêng lẻ. Tuy nhiên, việc sử dụng dữ liệu giữa các cuộc điều tra còn thực hiện thủ công mất nhiều công sức, cụ thể như các phần mềm tổng hợp kết quả trung gian: Phần mềm tính giá trị sản xuất, phần mềm tổng hợp dữ liệu thống kê tổng hợp…; Khâu lưu trữ thông tin: Dữ liệu thống kê, nhất là dữ liệu vi mô được lưu trữ rất phân tán, thiếu liên kết giữa số liệu tổng hợp với dữ liệu vi mô, giữa các lĩnh vực, kể cả cùng lĩnh vực nhưng khó liên kết theo thời gian.

Ngoài ra, công việc chỉ đạo điều hành quá trình sản xuất thông tin thống kê đã từng bước được áp dụng ở một số cuộc Tổng điều tra và điều tra thống kê sử dụng phiếu điện tử nhưng vẫn được quản lý trên các ứng dụng riêng rẽ.

Kế hoạch Ứng dụng CNTT giai đoạn 2020-2025

Triển khai Đề án 501, Tổng cục Thống kê đã xây dựng các hồ sơ dự án hỗ trợ điều tra thống kê và chia sẻ dữ liệu với các bộ, ngành thực hiện trong giai đoạn 2020-2025, với các nội dung cụ thể:

Một là, xây dựng trung tâm dữ liệu đầu vào: Hình thành trung tâm dữ liệu đầu vào tập trung thống nhất trên cơ sở chuẩn hóa nghiệp vụ và công nghệ sử dụng. Tích hợp tất cả dữ liệu từ các nguồn điều tra, nguồn dữ liệu hành chính, từ nguồn chế độ báo cáo định kỳ và từ nguồn dữ liệu lớn;

Hai là, xây dựng cơ sở dữ liệu đặc tả thống kê (metadata) đáp ứng yêu cầu về chuẩn hóa dữ liệu. Metadata mô tả dữ liệu thống kê bao gồm các dữ liệu đặc tả của các cuộc điều tra trong các đơn vị, ngân hàng câu hỏi điều tra và bộ dữ liệu mô tả thống kê. Metadata về cấu trúc Cơ sở dữ liệu gồm mô tả cơ sở dữ liệu, thông tin các trường dữ liệu và luật logic thể hiện mối quan hệ giữa các trường dữ liệu. Dữ liệu danh mục dùng chung: Các danh mục, dữ liệu dùng chung được quản lý tập trung và sử dụng chung giữa các ứng dụng.

Ba là, xây dựng Hệ thống công nghệ thông tin phục vụ Tổng điều tra kinh tế năm 2021 đồng bộ thống nhất, gồm bốn hạng mục chính: (i) Hệ thống thu thập thông tin điều tra CAPI, webformvà giám sát điều tra; (ii) Hệ thống tiếp nhận, chuẩn hoá, xử lý dữ liệu điều tra; (iii) Hệ thống Cơ sở dữ liệu tập trung để lưu trữ, khai thác và báo cáo thống kê, (iv) Hệ thống công bố thông tin.

Bốn là, xây dựng Hệ thống công nghệ thông tin phục vụ hỗ trợ các công đoạn của Tổng điều tra nông thôn, nông nghiệp và thủy sản năm 2025 từ khâu thu thập thông tin; xử lý, phân tích thông tin và phổ biến thông tin Tổng điều tra. Sử dụng phiếu điều tra điện tử trên 80% đối với đối tượng là hộ gia đình và trang trại, 100% đối với các đối tượng là doanh nghiệp và UBND xã, phường.

Năm là, từng bước xây dựng các phần mềm CAPI và webform cho các điều tra hàng năm trong khâu thu thập thông tin điều tra.

Sáu là, xây dựng kho dữ liệu vi mô thống kê phải đảm bảo được các yêu cầu cơ bản: Chuẩn hoá hệ thống chỉ tiêu, dữ liệu theo các kỳ điều tra và hệ thống chủ đề dữ liệu thống nhất, các thông tin danh mục dùng chung; Có khả năng trích lọc, chuyển đổi, kết xuất, tích hợp dữ liệu từ các CSDL chuyên ngành của các đơn vị (nếu có) vào kho dữ liệu vi mô thống kê, cung cấp các công cụ thống kê, phân tích, dự báo liên quan đến các lĩnh vực kinh tế - xã hội để hỗ trợ ra quyết định, xuất bản thông tin. Hỗ trợ trình bày hình ảnh hóa dữ liệu (GIS) sau khi người dùng trích xuất.
 
Bảy là, xây dựng hệ thống kết nối, trao đổi thông tin với Chính phủ và các bộ, ngành tạo môi trường kết nối liên thông để gửi, nhận thông tin, dữ liệu hành chính phục vụ nghiệp vụ sản xuất số liệu thống kê, trao đổi kết quả phổ biến thông tin thống kê giữa Tổng cục Thống kê với Chính phủ và các bộ, ngành. Hệ thống sử dụng nền tảng trục tích hợp dùng chung ESB của Chính phủ điện tử. Các dịch vụ này được tích hợp, vận hành, quản lý tập trung bởi hệ thống quản lý nền tảng trục tích hợp, phục vụ chung cho toàn bộ hệ thống các ứng dụng, CSDL khác bên trong và bên ngoài Tổng cục Thống kê.

Tám là, xây dựng Cổng phổ biến thông tin thống kê công bố các số liệu báo cáo kinh tế - xã hội và dữ liệu thống kê của các cuộc điều tra, thuộc tất cả các lĩnh vực thống kê chuyên ngành theo nhiều hình thức hiển thị, khai thác. Cụ thể là ứng dụng hình ảnh hóa trực quan (infographic và visualization) và khai thác dữ liệu thống kê tùy biến theo phân quyền./.

1. Webform trong Tổng điều tra kinh tế 2021 dự kiến sẽ áp dụng hệ thống e-survey do cơ quan Thống kê Nhật Bản hỗ trợ chuyển giao kỹ thuật. Hệ thống sẽ thử nghiệm trên 02 tỉnh vào tháng 7/2020. Hệ thống e-survey sẽ áp dụng cho 100% khối doanh nghiệp và khối cá thể đối với cơ sở đăng ký khai thông tin trên webform.
 
Nguồn: Tổng cục Thống kê