Thực trạng phát triển hạ tầng big data (dữ liệu lớn) ở Việt Nam hiện nay

PGS. TS. Nguyễn Minh Quang – Học viện Chính trị quốc gia Hồ Chí Minh và ThS. Văn Công Vũ – Trường Đại học Kinh tế, Đại học Đà Nẵng

15/05/2021 23:04

Ở Việt Nam, nhiều lĩnh vực, đơn vị đã có ý thức từ rất sớm trong việc sử dụng dữ liệu lớn trong công tác quản lý nhà nước, trong quá trình sản xuất và kinh doanh. Việt Nam đang sở hữu những lợi thế cho quá trình chuyển đổi số, bắt đầu bằng xây dựng dữ liệu lớn.

Thực trạng phát triển hạ tầng Big Data hiện nay ở Việt Nam

Ở Việt Nam, nhiều lĩnh vực, đơn vị đã có ý thức từ rất sớm trong việc sử dụng dữ liệu lớn (DLL) trong công tác quản lý nhà nước, trong quá trình sản xuất và kinh doanh. Việt Nam đang sở hữu những lợi thế cho quá trình chuyển đổi số, bắt đầu bằng xây dựng DLL. Lợi thế thứ nhất, có thể kể đến đó chính là tỷ lệ dân số sở hữu điện thoại thông minh, máy tính tại Việt Nam tăng nhanh qua các năm, rất thuận lợi cho việc thu thập dữ liệu. Lợi thế thứ hai, đó là các công ty tại Việt Nam còn rất trẻ, chính vì thế, họ có thể bắt đầu xây dựng cơ sở hạ tầng mà không bị ảnh hưởng từ hệ thống cũ tồn tại trước đó. Đây cũng là lợi thế giúp các công ty trẻ tại Việt Nam có được sức bật nhanh chóng nếu được đầu tư một cách nghiêm túc ngay từ đầu.

Điều đáng chú ý nhất trong việc sử dụng DLL tại Việt Nam đó là Nhà nước đã và đang dần xây dựng bộ cơ sở DLL để phát triển thành phố thông minh (TPTM) và chính quyền điện tử giai đoạn 2020 – 2025. Với mục tiêu xây dựng TPTM, Hà Nội đã thực hiện hàng loạt ứng dụng công nghệ vào quản lý điều hành, cũng như cung cấp dịch vụ công ích cho Nhân dân. Trong năm 2017, Hà Nội đã bắt đầu xây dựng một số hệ thống điều hành thông minh. Theo đó, cách làm hướng đến của kế hoạch này là giải quyết bài toán bằng giải pháp số hóa tài liệu chuyên nghiệp, góp phần đẩy mạnh việc ứng dụng công nghệ thông tin để xây dựng, phát triển TPTM1.

Trong kinh doanh, một số đơn vị như FPT, VNG, VCCorp đã tham gia nghiên cứu và ứng dụng DLL trong phân tích hành vi khách hàng. Một số trang bán hàng điện tử áp dụng được một phần của kho DLL trong hoạt động thương mại của mình như trang bán lẻ Sendo.Vn trực thuộc Tập đoàn FPT. Sendo.Vn đã vận dụng phân tích DLL trên 5 triệu sản phẩm được bán bởi 80.000 shop đòi hỏi sự chuyên nghiệp trong quá trình xử lý, nhằm bảo đảm loại trừ chính xác hàng giả, hàng nhái; và kiểm tra độ tin cậy về giá bán cuối cùng của các shop trong lễ hội mua sắm trực tuyến ngày 02/12/20182.

Trong lĩnh vực tài chính – ngân hàng, nhiều ngân hàng đã dùng dữ liệu tiêu dùng, mua, vay, vị trí thanh toán của khách hàng để xác định giao dịch có hợp lệ hoặc có phải bị gian lận hay không.

Về ngành vận chuyển, có thể kể đến Hãng hàng không Vietnamairlines (VNA). VNA là hãng hàng không Việt Nam đầu tiên đã triển khai xong giai đoạn đầu của nền tảng dữ liệu mở Skywise được phát triển bởi Airbus và đối tác Big Data – Palantir. Skywise được đánh giá là “trái tim” của cuộc cách mạng số ngành Hàng không. Hiện nay, VNA đã và đang triển khai tích hợp các cơ sở dữ liệu vào hệ thống Skywise như: thông tin lịch bay, kế hoạch bay (Netlines, FIM), dữ liệu cảm biến trên tàu bay (AGS), các cảnh báo kỹ thuật từ tàu bay (Airman)…3.

Về lĩnh vực cải cách hành chính có Công ty FSI với giải pháp số hóa tài liệu và công nghệ nhận dạng và bóc tách thông tin văn bản. Các công ty bán lẻ dựa trên dữ liệu về mua bán, tiêu thụ tại các cửa hàng, kết hợp với dữ liệu về vị trí cửa hàng, khoảng cách với cửa hàng của đối thủ cạnh tranh gần đó… để dự báo doanh thu, lợi nhuận hằng tháng. Ngoài ra, một số lĩnh vực khác ở Việt Nam như bất động sản, khám, chữa bệnh… đang dần tiếp cận và khai thác những giá trị mà DLL mang lại.

Để có được những kết quả ban đầu trong việc ứng dụng DLL ở các lĩnh vực khác nhau như trên, việc đầu tư, phát triển hạ tầng nhằm đón đầu sự lớn mạnh không ngừng của DLL là mối quan tâm hàng đầu của các nhà nghiên cứu. Trong thời gian qua, Việt Nam cũng đã có nhiều phương án để phát triển hạ tầng DLL.

Một là, trong phát triển hạ tầng hệ thống lưu trữ và máy chủ.

Tại Việt Nam, HPE hiện đang nắm giữ 41,3% thị phần máy chủ x86, 64% thị phần máy chủ phiến (blade server). Dell đứng ở vị trí thứ 2 với 28,6% (máy chủ x86) và 20,6% (máy chủ phiến), tiếp theo, đó là Cisco với 2% thị phần, còn lại là những hãng công nghệ khác như Fujitsu, Hitachi4. Sở dĩ thị trường máy chủ Việt Nam tiếp tục bùng nổ là nhờ chu kỳ phát triển mới của doanh nghiệp (DN) và nhu cầu gia tăng dịch vụ đám mây đi vào giai đoạn chuyển đổi số mạnh mẽ.

Các DN tiếp tục đầu tư cho hạ tầng để hỗ trợ các ứng dụng thế hệ mới và đạt được các lợi ích như điện toán đám mây. Tăng trưởng doanh thu máy chủ nhờ đó được thúc đẩy không ngừng, đặc biệt là HPE với các cấu hình, nền tảng bộ xử lý mới phong phú và những giải pháp công nghệ trọn gói đáng tin cậy. Chiếm thị phần lớn về máy chủ, thị phần thiết bị lưu trữ và thiết bị mạng có dây lẫn không dây, đồng thời đứng trong top 5 về cung cấp hệ thống tích hợp, ở thời điểm hiện tại, HPE là đơn vị sở hữu những giải pháp mạnh trong xây dựng các TPTM. Trong tương lai, HPE sẽ hỗ trợ mạnh mẽ về mặt công nghệ cho các dự án Chính phủ điện tử và TPTM trên khắp cả nước.

Để thúc đẩy phát triển hạ tầng DLL, Thủ tướng Chính phủ đã ban hành Quyết định số 677/QĐ-TTg ngày 18/5/2017 về việc phê duyệt Đề án “Phát triển Hệ tri thức Việt số hóa”. Đây là đề án rất quan trọng, mang tính dài hạn, trong đó giao cho Bộ Khoa học và Công nghệ với tư cách thường trực, phối hợp với các bộ, ngành, địa phương, DN tổ chức thực hiện Đề án. Đề án mang tính kết nối tri thức dựa trên nền tảng những công nghệ mới nhất, như: trí tuệ nhân tạo (AI) và DLL (Big Data). Hệ tri thức Việt số hóa được xây dựng thông qua việc tổng hợp, hệ thống hóa, Việt hóa, số hóa, lưu trữ và phổ biến tri thức trong mọi lĩnh vực, trước hết là hỗ trợ cho giáo dục, đào tạo, đổi mới sáng tạo và các lĩnh vực liên quan trực tiếp đến đời sống của người dân như pháp luật, y tế, kỹ thuật sản xuất… Đồng thời, tạo môi trường thuận lợi thu hút mọi người dân và DN tham gia, với vai trò vừa khai thác vừa đóng góp để làm giàu các tài nguyên tri thức số hóa của Việt Nam.

Hai là, đối với phát triển hạ tầng các phần mềm quản lý, tích hợp dữ liệu, phần mềm phân tích dữ liệu.

Ở nước ta, trong những năm gần đây, nhiều DN đã cung cấp các giải pháp phần mềm và cung ứng thiết bị công nghệ viễn thông trong việc quản lý, tích hợp và phân tích dữ liệu. Một số DN được đánh giá cao, như: FPT, VNPT, CMC TS, MISA, HIPT… Bên cạnh đó, thông qua Đề án “Phát triển Hệ tri thức Việt số hóa”, việc quản lý, tích hợp và phân tích dữ liệu bước đầu có những hiệu quả nhất định. Đến nay, Đề án đã dần hình thành hệ thống nền tảng với các chức năng và công cụ cho phép thu thập, xử lý và chia sẻ các dữ liệu dùng chung trong một số lĩnh vực. Trong đó, Bản đồ số Việt Nam (Vmap) và Hệ thống thông tin nhân đạo (iNhandao) là hai dự án tiên phong của đề án và đã đạt được một số kết quả quan trọng trong giai đoạn 1 để giới thiệu với công chúng.

Ba là, về xây dựng hạ tầng bảo mật.

Việt Nam cũng chú trọng đến vấn đề xây dựng hạ tầng bảo mật dữ liệu, bao gồm việc mã hóa dữ liệu, xác thực người dùng và các quyền truy cập, giám sát hệ thống, xây dựng tường lửa, quản lý DN và các sản phẩm khác để bảo vệ hệ thống và dữ liệu. Tuy nhiên, thực trạng vấn đề bảo mật thông tin ở nước ta vẫn còn nhiều bất cập, dẫn đến nhiều hệ lụy nghiêm trọng.

Thời gian gần đây, các hacker thường xuyên lợi dụng các sơ hở của người dùng cũng như những lỗ hổng bảo mật của hệ thống để tấn công các DN và người dùng Việt Nam, khiến nhiều thông tin quan trọng bị lộ và bị mất, gây ảnh hưởng về cả vật chất và tinh thần. Theo thống kê của Bộ Công an, mỗi năm có hàng nghìn trang mạng của Việt Nam bị tin tặc tấn công nhằm đánh cắp thông tin, chiếm quyền điều khiển, thay đổi, chèn nội dung, cài cắm mã độc… Trong 6 tháng đầu năm 2019, Bộ Công an đã phát hiện trên 2.500 trang tin, cổng thông tin điện tử tên miền quốc gia Việt Nam bị tấn công; hằng trăm ngàn máy tính bị nhiễm mã độc. Đáng lưu ý, Việt Nam xếp thứ 4 trong top 10 quốc gia bị kiểm soát bởi mạng máy tính ma botet5.

Việt Nam có nhiều thuận lợi là lực lượng dân số trẻ, mức độ cập nhật công nghệ cao. Tuy nhiên, với lãnh đạo DN thì chúng ta có một độ trễ nhất định trong việc ứng dụng DLL. Dữ liệu nằm yên một chỗ thì không có ý nghĩa, phải biến nó thành dữ liệu biết nói và nói đúng ngữ cảnh. Từ đó, nó sẽ giúp chúng ta đưa ra hành động hợp lý, tối ưu hóa được nhiều vấn đề. Bên cạnh một số ít DN đã triển khai và có những thành công nhất định trong việc ứng dụng DLL trong sản xuất – kinh doanh thì vẫn còn nhiều DN thương mại điện tử Việt Nam chưa thực sự tiếp cận được với công nghệ DLL, bởi nó đòi hỏi một nền tảng công nghệ thông tin mạnh, kho lưu trữ khổng lồ và các hỗ trợ của Chính phủ trong việc khai thác kho dữ liệu. Do đó, cần phải khẳng định lại vấn đề muốn sử dụng và khai thác DLL một cách hiệu quả, điều cần thiết là phải xây dựng hạ tầng đủ để thu thập và lưu trữ dữ liệu, quản lý, tích hợp, phân tích dữ liệu, đồng thời, cung cấp quyền truy cập và bảo mật thông tin trong khi lưu trữ và chuyển tiếp.

Một số kiến nghị góp phần hoàn thiện hạ tầng dữ liệu lớn ở nước ta

Thứ nhất, xây dựng các trung tâm DLL (data center), các dịch vụ điện toán đám mây. Trung tâm dữ liệu là nơi tập trung nhiều thành phần tài nguyên mật độ cao (hardware, software…) làm chức năng lưu trữ, xử lý toàn bộ dữ liệu hệ thống với khả năng sẵn sàng và độ ổn định cao. Tuy nhiên, khi xây dựng các trung tâm DLL, cần chú ý việc lựa chọn địa điểm đặt trung tâm dữ liệu là bước đầu tiên quan trọng trong quá trình lập dự án triển khai hạ tầng. Địa điểm đặt trung tâm dữ liệu quyết định mức độ an toàn về vật lý, giúp giảm thiểu rủi ro do các yếu tố khách quan mang lại, tăng mức độ an toàn và sẵn sàng của trung tâm dữ liệu. Ngoài ra, việc lựa chọn kiến trúc kết cấu tòa nhà, lựa chọn không gian lắp đặt các thiết bị phụ trợ cho các trung tâm dữ liệu cũng là vấn đề đáng lưu ý.

Thứ hai, hỗ trợ, tạo động lực để các DN, các đơn vị nghiên cứu, cung cấp các giải pháp phần mềm và công cụ hỗ trợ trong việc lưu trữ, quản lý, tích hợp và phân tích dữ liệu. Chẳng hạn như việc thiết lập và xây dựng Hệ sinh thái Hadoop (Hadoop được coi là xương sống trong các dự án DLL). Thư viện phần mềm Hadoop là một nền tảng cho phép các tập DLL được xử lý phân tán thông qua các cụm máy tính sử dụng mô hình lập trình đơn giản, được thiết kế để mở rộng từ một máy chủ lên hàng nghìn máy, mỗi máy chủ có khả năng cung cấp năng lực tính toán và lưu trữ cục bộ6. Hadoop cho phép các ứng dụng có thể làm việc với hàng ngàn node khác nhau và hàng petabyte dữ liệu. Hadoop được phát triển dựa trên ý tưởng từ các công bố của Google về mô hình MapReduce và hệ thống file phân tán Google File System (GFS).

Thứ ba, về phía Chính phủ, đầu tư chính vào các chương trình nghiên cứu cơ bản, chương trình về đổi mới công nghệ và đặc biệt là chương trình về cách mạng công nghệ 4.0. Nằm trong bài toán xây dựng cơ sở DLL, việc tổ chức nhiều hội thảo về Big Data, chính quyền điện tử, TPTM, ứng dụng công nghệ thông tin trong thời đại 4.0… là cơ sở để có thể tiếp thu được nhiều giải pháp tạo lập cơ sở dữ liệu, xây dựng chính quyền điện tử của các DN Việt Nam, các chuyên gia, các nhà khoa học, góp phần hoàn thiện hạ tầng cũng như nhiều mặt khác, đón đầu sự phát triển của DLL.

Thứ tư, chú trọng đầu tư vào công tác đào tạo nguồn nhân lực chất lượng cao trong lĩnh vực công nghệ thông tin, phân tích dữ liệu… Các cơ sở đào tạo ở Việt Nam cần mở những khóa học ngắn hạn, các ngành học, chuyên ngành nghiên cứu về DLL và phân tích dữ liệu, góp phần đáp ứng yêu cầu của sự phát triển DLL trong thời gian tới. Bên cạnh đó, đẩy mạnh đầu tư mở các khóa đào tạo, mở mã ngành nghiên cứu về DLL là thật sự cần thiết để cung cấp số lượng nhân lực chất lượng cao đón đầu sự tăng trưởng và phát triển không ngừng của DLL trong tương lai.

DLL đánh dấu một bước quan trọng trong việc tìm kiếm của con người để định lượng và hiểu thế giới; một ưu thế của những thứ chưa bao giờ được đo lường, lưu trữ, phân tích và chia sẻ trước khi được dữ liệu hóa. DLL đang thay đổi thế giới, nó đã hoàn toàn biến chuyển cách chúng ta sống, tìm kiếm tình yêu, chữa trị ung thư, nghiên cứu khoa học, cải thiện thành quả, điều hành các thành phố, quốc gia và hoạt động kinh doanh… Tuy nhiên, để khai thác DLL một cách hiệu quả cũng như đón đầu sự phát triển mạnh mẽ của DLL, việc xây dựng, phát triển hạ tầng DLL phải được đặt lên hàng đầu. Muốn làm được điều này, cần có tiếng nói của DN, của cộng đồng và của Chính phủ, để xây dựng hạ tầng dữ liệu phục vụ cho phát triển các ứng dụng của DLL.

Chú thích:
1. Công nghiệp 4.0 và thách thức Big Data. https://enternews.vn, ngày 09/5/2018.
2, 6. Nghiên cứu về lợi ích của dữ liệu lớn – Big Data với doanh nghiệp thương mại điện tử trong nước và thế giới. https://tapchicongthuong, ngày 04/8/2019.
3. Hướng tới mục tiêu trở thành hãng hàng không số. http://spirit.vietnamairlines.com, ngày 05/8/2019.
4. Thị trường máy chủ và hệ thống lưu trữ tại Việt Nam vẫn được thống trị bởi HPE. https://congthuong.vn, ngày 03/7/2019.
5. Tình hình an ninh mạng ngày càng diễn biến phức tạp. http://www.antoanthongtin.vn, ngày 30/5/2019.

PGS. TS. Nguyễn Minh Quang – Học viện Chính trị quốc gia Hồ Chí Minh
ThS. Văn Công Vũ –  Trường Đại học Kinh tế, Đại học Đà Nẵng

 

 

Phát triển hạ tầng big data (dữ liệu lớn) ở Việt Nam hiện nay | Tạp chí Quản lý nhà nước (quanlynhanuoc.vn)

PGS. TS. Nguyễn Minh Quang – Học viện Chính trị quốc gia Hồ Chí Minh và ThS. Văn Công Vũ – Trường Đại học Kinh tế, Đại học Đà Nẵng