Lời mở đầu 2 Nội dung 3 1. Tổng quan về Big Data 3
1.1. Khái niệm về Big Data 3
1.2. Đặc trưng của Big Data 3 1.3. Sự khác nhau giữa dữ liệu lớn và dữ liệu truyền thống 4 2. Ứng dụng của Big Data 5 2.1. Ứng dụng của Big Data trong thương mại điện tử 5 2.2. Ứng dụng của Big Data trong y tế 5 Kết luận 6 Tài liệu tham khảo 7 Lời mở đầu Ngày nay, sự phát triển không ngừng của khoa học kỹ thuật, tiêu biểu như sự ra đời của Internet và các thiết bị điện thoại, máy tính cá nhân, đã mang lại những thay đổi lớn trong mọi lĩnh vực đời sống. Trong kỷ nguyên của IoT2 với việc ứng dụng và tích hợp sâu rộng các thiết bị di động như điện thoại di động, ô tô, và máy móc công nghiệp góp phần vào việc tạo và chuyển dữ liệu, dẫn đến sự bùng nổ của dữ liệu có thể thu thập được. Trong dòng thác dữ liệu liên tục được tạo ra từng giây, thuật ngữ Big Data (Dữ liệu lớn) được sử dụng để chỉ những bộ dữ liệu khổng lồ, chủ yếu không có cấu trúc, được thu thập từ nhiều nguồn khác nhau. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thông tin quý giá mà nếu trích xuất thành công, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều kiện giao thông theo thời gian thực. Trong công tác nghiên cứu khoa học, Big Data đang mang lại các nhà nghiên cứu cơ hội tiếp cận và giải quyết rất nhiều vấn đề hóc búa mà trước đây không thể hoặc rất khó thực hiện. Bằng việc tìm hiểu thông tin dựa vào phương pháp thu thập và phân tích số liệu, qua bài viết này, em muốn giới thiệu về khái niệm Big Data đang ngày càng phổ biến và những ứng dụng của nó trong đời sống hiện nay và đặc biệt trong nền kinh tế số. Nội dung 1. Tổng quan về Big Data 1.1. Khái niệm về Big Data Big Data là các tập dữ liệu có khối lượng lớn và phức tạp. Độ lớn đến mức các phần mềm xử lý dữ liệu truyền thống không có khả năng thu thập, quản lý và xử lý dữ liệu trong một khoảng thời gian hợp lý. 1.2. Đặc trưng của Big Data Big Data (Dữ liệu lớn) có 5 đặc trưng cơ bản (mô hình 5V): Đầu tiên đó là khối lượng dữ liệu (Volume): Đây là đặc điểm tiêu biểu nhất của dữ liệu lớn, khối lượng dữ liệu rất lớn. Kích cỡ của Big Data đang tung ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập hợp dữ liệu. Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩa cứng. Nhưng với dữ liệu lớn chúng ta sẽ sử dụng công nghệ “đám mây” mới đáp ứng khả năng lưu trữ được dữ liệu lớn. Thứ hai là tốc độ (Velocity): Tốc độ có thể hiểu theo 2 khía cạnh: Một là khối lượng dữ liệu gia tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web bán hàng của Amazon); thứ hai là xử lý dữ liệu nhanh ở mức thời gian thực (real-time), có nghĩa dữ liệu được xử lý ngay tức thời ngay sau khi chúng phát sinh (tính đến bằng mili giây). Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế – Sức khỏe như hiện nay phần lớn dữ liệu lớn được xử lý real-time. Công nghệ xử lý dữ liệu lớn ngày nay đã cho phép chúng ta xử lý tức thì trước khi chúng được lưu trữ vào cơ sở dữ liệu. Thứ ba là độ đa dạng (Variety): Đối với dữ liệu truyền thống chúng ta hay nói đến dữ liệu có cấu trúc, thì ngày nay hơn 80% dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, bài hát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe...). Big data cho phép liên kết và phân tích nhiều dạng dữ liệu khác nhau. Ví dụ: với các bình luận của một nhóm người dùng nào đó trên Facebook với thông tin video được chia sẻ từ Youtube và Twitter. Thứ tư là độ chính xác (Veracity): Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ chính xác của dữ liệu.Với xu hướng phương tiện truyền thông xã hội (Social Media) và mạng xã hội (Social Network) ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người dùng Mobile làm cho bức tranh xác định về độ tin cậy và chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của Big data. Cuối cùng đó là giá trị (Value): Giá trị là đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khai xây dựng dữ liệu lớn thì việc đầu tiên chúng ta cần phải làm đó là xác định được giá trị của thông tin mang lại như thế nào, khi đó chúng ta mới có quyết định có nên triển khai dữ liệu lớn hay không. Nếu chúng ta có dữ liệu lớn mà chỉ nhận được 1% lợi ích từ nó, thì không nên đầu tư phát triển dữ liệu lớn. Kết quả dự báo chính xác thể hiện rõ nét nhất về giá trị của dữ liệu lớn mang lại. Ví dụ, từ khối dữ liệu phát sinh trong quá trình khám, chữa bệnh sẽ giúp dự báo về sức khỏe được chính xác hơn, sẽ giảm được chi phí điều trị và các chi phí liên quan đến y tế. 1.3. Sự khác nhau giữa dữ liệu lớn và dữ liệu truyền thống Dữ liệu lớn khác với dữ liệu truyền thống (ví dụ, kho dữ liệu – Data Warehouse) ở 4 điểm cơ bản: Dữ liệu đa dạng hơn, lưu trữ dữ liệu lớn hơn, truy vấn dữ liệu nhanh hơn, độ chính xác cao hơn. Dữ liệu đa dạng hơn: Khi khai thác dữ liệu truyền thống (dữ liệu có cấu trúc), chúng ta thường phải trả lời các câu hỏi: Dữ liệu lấy ra kiểu gì? Định dạng dữ liệu như thế nào? Đối với dữ liệu lớn, không phải trả lời các câu hỏi trên. Hay nói khác, khi khai thác, phân tích dữ liệu lớn chúng ta không cần quan tâm đến kiểu dữ liệu và định dạng của chúng. Điều quan tâm là giá trị mà dữ liệu mang lại có đáp ứng được cho công việc hiện tại và tương lai hay không. Lưu trữ dữ liệu lớn hơn: Lưu trữ dữ liệu truyền thống vô cùng phức tạp và luôn đặt ra câu hỏi lưu như thế nào? Dung lượng kho lưu trữ bao nhiêu là đủ? Gắn kèm với câu hỏi đó là chi phí đầu tư tương ứng. Công nghệ lưu trữ dữ liệu lớn hiện nay đã phần nào có thể giải quyết được vấn đề trên nhờ những công nghệ lưu trữ đám mây, phân phối lưu trữ dữ liệu phân tán và có thể kết hợp các dữ liệu phân tán lại với nhau một cách chính xác và xử lý nhanh trong thời gian thực. Truy vấn dữ liệu nhanh hơn: Dữ liệu lớn được cập nhật liên tục, trong khi đó kho dữ liệu truyền thống thì lâu lâu mới được cập nhật và trong tình trạng không theo dõi thường xuyên gây ra tình trạng lỗi cấu trúc truy vấn dẫn đến không tìm kiếm được thông tin đáp ứng theo yêu cầu. Độ chính xác cao hơn: Dữ liệu lớn khi đưa vào sử dụng thường được kiểm định lại dữ liệu với những điều kiện chặt chẽ, số lượng thông tin được kiểm tra thông thường rất lớn, và đảm bảo về nguồn lấy dữ liệu không có sự tác động của con người vào thay đổi số liệu thu thập. 2. Ứng dụng của Big Data Dữ liệu lớn đã được ứng dụng trong nhiều lĩnh vực như: hoạt động chính trị, giao thông, y tế, thể thao, tài chính, thương mại, thống kê... dưới đây là một số ví dụ về ứng dụng dữ liệu lớn. 2.1. Ứng dụng của Big Data trong thương mại điện tử Big Data giúp quản lý chuỗi cung ứng: Phân tích dự đoán dữ liệu đo từ xa thời gian thực được thu thập từ các cảm biến thông minh được phân phối dọc theo dây chuyền sản xuất cũng có thể giúp các nhà cung cấp ngăn chặn sự cố và giảm thiểu thời gian chết. Nếu xảy ra lỗi, các mô hình Big data có thể xác định nguyên nhân và ngăn chặn các trục trặc tương tự tái diễn trong tương lai. Big Data cho biết trải nghiệm của khách hàng: Không có nghi ngờ rằng trải nghiệm cá nhân hóa là rất quan trọng đối với nhận thức tích cực của khách hàng về bất kỳ cửa hàng thương mại điện tử nào. Big Data có thể cung cấp thông tin chuyên sâu về hành vi khách hàng từ nhiều kênh tương tác của người tiêu dùng với một thương hiệu, như trang web, phương tiện truyền thông xã hội, tìm kiếm duyệt, bảng câu hỏi trực tuyến. Qua đó, các doanh nghiệp có thể nắm được nhu cầu, sở thích của khách hàng để gợi ý sản phẩm, dịch vụ muốn sử dụng trong thời gian thực. Điều này làm tăng trải nghiệm cá nhân hóa của khách hàng. Big Data giúp thanh toán trực tuyến an toàn: Các giải pháp Big Data đi sâu vào thông tin khách hàng và mua hàng trong quá khứ và theo dõi các mẫu lặp đi lặp lại để phân biệt giữa các giao dịch hợp pháp và đáng ngờ và đề xuất hướng hành động phù hợp nhất để chống lại tội phạm mạng. 2.2. Ứng dụng của Big Data trong y tế Big Data có thể lưu hồ sơ sức khỏe điện tử: Đây là ứng dụng rộng rãi nhất của Big Data trong y học. Mỗi bệnh nhân đều có hồ sơ kỹ thuật số của riêng mình, bao gồm nhân khẩu học, lịch sử bệnh, dị ứng, kết quả xét nghiệm trong phòng thí nghiệm,... .Hồ sơ được chia sẻ qua hệ thống thông tin an toàn và có sẵn cho các nhà cung cấp từ cả khu vực công và tư nhân. Mọi hồ sơ đều bao gồm một tệp có thể sửa đổi, có nghĩa là bác sĩ có thể thực hiện các thay đổi theo thời gian mà không cần thủ tục giấy tờ và không có nguy cơ sao chép dữ liệu. Big Data giúp tăng cường sự tham gia của bệnh nhân: Nhiều bệnh nhân đã quan tâm đến các thiết bị thông minh ghi lại mọi bước họ thực hiện, nhịp tim, thói quen ngủ, ... của họ một cách thường xuyên. Tất cả thông tin quan trọng này có thể được kết hợp với các dữ liệu có thể theo dõi khác để xác định các nguy cơ sức khỏe tiềm ẩn đang rình rập. Ví dụ, mất ngủ mãn tính và nhịp tim tăng cao có thể báo hiệu nguy cơ mắc bệnh tim trong tương lai. Bệnh nhân trực tiếp tham gia vào việc theo dõi sức khỏe của chính họ và các ưu đãi từ bảo hiểm y tế có thể thúc đẩy họ có lối sống lành. Như vậy, Big Data đang ngày càng trở thành chìa khóa để có chuỗi cung ứng hiệu quả và giảm chi phí. Trên thực tế, giờ đây Big Data đã trở thành một tiêu chuẩn để thu nhập và phân tích lượng thông tin khổng lồ để giúp tăng doanh thu. Các chuyên gia dự đoán xu hướng sẽ tiếp tục mở rộng và chỉ riêng việc tiết kiệm chi phí trong tái cấu trúc chuỗi cung ứng, tiềm năng Big Data không chỉ mang lại hiệu quả đáng kể mà còn là cơ sở cho việc phát triển vận hành hiệu quả. Song đó là sự tận dụng công nghệ này rất linh hoạt và hiệu quả của các doanh nghiệp Việt Nam giúp cho nền kinh tế nước ta phát triển mạnh mẽ hơn, bắt kịp xu thế hệ thống thông tin thế giới để không phải tuột lại phía sau trong cuộc chạy đua đổi mới công nghệ thông tin. Kết luận Tóm lại, Big Data đem lại rất nhiều lợi ích trong thời đại kinh tế số hiện nay. Tuy nhiên, Big Data chính là thách thức đặt ra cho các doanh nghiệp trong thời đại công nghệ số. Các doanh nghiệp cần hiểu rõ Dữ liệu lớn- Big Data là gì? và tận dụng được tối đa nguồn dữ liệu lớn thì sẽ có hội thành công sẽ lớn hơn nhiều lần. Xa hơn một chút Big Data có thể giúp các cơ quan Chính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để tập trung đầu tư cho các hạng mục đó, cắt giảm chi phí, kích thích tăng trưởng kinh tế, thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó. Tuy vẫn còn những chỉ trích về Bigdata nhưng đây là một lĩnh vực còn rất mới nên chúng ta hãy chờ đón sự tiến hóa của Big Data trong tương lai.
Tài liệu tham khảo
1. Giáo trình Kinh tế số 2. TOPDev 3. GSOT 4. PACE