Lịch sử về Big Data, công nghệ và trường hợp sử dụng Big Data

Tìm hiểu lịch sử phát triển của Big Data và những công nghệ quan trọng như Hadoop, Apache Spark, và Apache Flink.

Bài viết này sẽ khám phá các con số thú vị về Big Data và các ứng dụng thực tế của nó trong các lĩnh vực như tài chính, chăm sóc sức khỏe, viễn thông, và nhiều lĩnh vực khác

Chúng ta cũng sẽ thảo luận về các công nghệ sử dụng trong Big Data như:

  • Hadoop
  • Apache Spark
  • Flink

Và các trường hợp sử dụng, ứng dụng thực tế khác nhau của Big Data cũng được thảo luận trong bài viết này.

Lịch sử – Công nghệ – Các trường hợp sử dụng của Big Data

Lịch sử của Big Data

Ngày qua ngày, thế giới internet lớn đang tạo ra 2,5 triệu triệu byte dữ liệu, theo thống kê tỷ lệ phần trăm dữ liệu được tạo ra so với 2 năm trước là 90%. Dữ liệu này đến từ nhiều ngành công nghiệp như thông tin khí hậu được thu thập bởi cảm biến, các nội dung khác nhau từ các trang truyền thông xã hội, hình ảnh kỹ thuật số và video, các hồ sơ khác nhau về giao dịch mua hàng. Đây chính là Big Data.

Nói về sự lịch sử của Big Data thì chắc chắn cần phải gắn với sự phát triển của Hadoop. Bởi hệ sinh thái ngày càng phát triển của công nghệ này.

Hai cột mốc quan trọng trong sự phát triển của Hadoop cũng đã tạo thêm niềm tin vào Sức mạnh của nguồn mở và Công nghệ Big Data.

Chỉ hai năm sau khi phát hành lần đầu tiên, vào năm 2008, Hadoop đã chiến thắng trong Terabyte Sort Benchmark.

Và đây cũng là lần đầu tiên Java hoặc chương trình nguồn mở giành chiến thắng.

Vào năm 2010, Facebook cũng đã tuyên bố rằng họ có Hadoop cluster lớn nhất thế giới với 21 PB dung lượng lưu trữ cho nền tảng nhắn tin của họ.

Các sự kiện và số liệu về Big Data

  • 91% các nhà lãnh đạo tiếp thị tin rằng các thương hiệu thành công sử dụng dữ liệu khách hàng để thúc đẩy các quyết định kinh doanh.
  • Tỷ lệ phần trăm tổng số dữ liệu trên toàn thế giới đã được tạo ra chỉ trong vòng hai năm qua là 90%.
  • 87% công ty đồng ý nắm bắt và chia sẻ dữ liệu phù hợp là rất quan trọng để đo lường hiệu quả ROI trong chính công ty của họ.
  • Kỷ lục 500 triệu cuộc gọi được phân tích hàng ngày bởi IBM để dự đoán số lượt truy cập của khách hàng.
  • 350 tỷ lần đọc hàng năm được IBM chuyển đổi thông qua Dữ liệu lớn để dự đoán mức tiêu thụ năng lượng tốt hơn.
  • Trên Facebook, 30 tỷ mẩu nội dung được người dùng chia sẻ mỗi tháng.

Các công nghệ Big Data

Mặc dù chủ đề về Big Data rất rộng và bao gồm nhiều xu hướng và sự phát triển công nghệ mới.
Nhưng các công nghệ mới nổi hàng đầu được đưa ra dưới đây đang giúp người dùng xử lý Big Data một cách hiệu quả.

Apache Hadoop

Đây là Xương sống của mọi giải pháp Big Data. Dự đoán rằng 75% dữ liệu trên thế giới sẽ được lưu trữ trong Hadoop trong vài năm tiếp theo.

Apache Spark

Apache Spark được coi là công cụ Big Data thế hệ tiếp theo. Nó đang làm cluster computing engine trở nên nhanh hơn, nhanh hơn 100 lần so với Hadoop-MapReduce

Apache Flink

Apache Flink được gọi là 4G của Big Data. Nó là một Framework nguồn mở có thể xử lý truyền phát dữ liệu hàng loạt.

Cùng xem một số thông số của các thương hiệu lớn

Facebook

Vì có hàng Tỷ người dùng, Facebook đang thu thập một lượng dữ liệu khổng lồ mỗi ngày.

Mỗi khi bạn nhấp vào thông báo, truy cập trang, tải lên ảnh hoặc kiểm tra liên kết của một người bạn, bạn đang tạo dữ liệu, tạo ra hành vi số cho facebook lưu lại để theo dõi và phân tích.
Người dùng đã chia sẻ 2,5 tỷ nội dung hàng ngày (cập nhật trạng thái + bài đăng trên tường + ảnh + video + bình luận).
300 triệu ảnh được người dùng tải lên mỗi ngày.
105 terabyte dữ liệu được quét qua Hive, ngôn ngữ truy vấn Hadoop của Facebook trong mỗi 30 phút.
70.000 truy vấn được thực hiện trên các cơ sở dữ liệu này mỗi ngày.
500 + terabyte dữ liệu mới được nhập vào cơ sở dữ liệu mỗi ngày

Twitter

Twitter – mạng xã hội lớn thứ hai tạo ra ít dữ liệu xã hội hơn so với ứng dụng hẹn hò, Tinder.

Người dùng Tinder vuốt 290.278 lần mỗi phút – đó là khoảng 35 triệu người yêu thích mỗi giờ!

Mặt khác, người dùng twitter tạo ra 347.222 Tweets mỗi phút – hoặc 21 triệu Tweets mỗi giờ.

Youtube

Video chiếm một phần lớn trong cuộc sống hàng ngày của chúng ta trên internet và mặc dù Facebook cũng đang rất cố gắng để cạnh tranh ở mảng video, nhưng với hơn 3 tỷ lượt xem video mỗi ngày YouTube vẫn là vua.

Mỗi phút người dùng đang tải lên hơn 300 giờ video mới trên YouTube.

Các trường hợp sử dụng, ứng dụng thực tế của Big Data trong các lĩnh vực

Ứng dụng Big Data Các dịch vụ tài chính

  • Nhận định 360 độ về khách hàng
  • Giám sát và quản lý rủi ro và gian lận
  • Theo dõi và phân tích giao dịch thời gian thực

Khoa học chăm sóc sức khỏe và đời sống

  • Phân tích chẩn đoán bệnh
  • Phân tích hồ sơ bệnh án
  • Phân tích bộ gen

Ứng dụng Big Data trong lĩnh vực Viễn thông

  • Ghi lại chi tiết cuộc gọi thời gian thực Xử lý và phân tích CDR
  • Hồ sơ khách hàng kiếm tiền và phân tích
  • Giám sát yếu tố mạng thời gian thực
  • Phân tích lỗi mạng thời gian thực
  • IVR gọi phân tích

Ứng dụng Big Data trong Digital Media

  • Kết hợp, phân tích và nhắm mục tiêu quảng cáo theo thời gian thực
  • Phân tích trang web và theo dõi chuyển đổi trên website

Ứng dụng Big Data trong Bán lẻ

  • Tiếp thị chéo
  • Phân cụm và phân khúc khách hàng
  • Phân tích nhấp chuột
  • Phân tích dung lượng thị trường
  • Khuyến nghị thời gian thực
  • Phân tích cảm xúc

Ứng dụng trong lĩnh vực thực thi pháp luật

  • Giám sát đa phương thức
  • Phát hiện lỗ hổng an ninh mạng thời gian thực
  • Năng lượng và tính tiện ích
  • Phân tích đồng hồ thông minh
  • Quản lý tài sản

Lời kết

Trên đây là sơ lược về Lịch sử của Big Data và các con số thực tế, các công nghệ sử dụng để phân tích Big Data cũng như một số trường hợp có thể sử dụng, ứng dụng Big Data.

Big Data đã và đang được các doanh nghiệp lớn, các doanh nghiệp tạo ra nhiều dữ liệu sử dụng để tìm kiếm lợi thế cạnh tranh cho mình.

Và thực tế, các công nghệ Big Data rất mạnh trong việc phân tích và xử lý dữ liệu trong tình huống phức tạp. Các doanh nghiệp nhỏ cũng có thể tận dụng sức mạnh của các công nghệ Big Data để tối ưu hóa việc xử lý dữ dạng này trước khi tiến tới xử lý Big Data.

Về TechX

TechX Corp. được thành lập bởi đội ngũ các chuyên gia hàng đầu với sứ mệnh hỗ trợ các doanh nghiệp Việt Nam trong hành trình chuyển đổi số và khai thác dữ liệu nhằm thúc đẩy kinh doanh.

Xác định dữ liệu là chìa khoá thành công cho mọi doanh nghiệp, TechX đã và đang vận dụng tối ưu các dịch vụ và công nghệ đám mây tiên tiến trên nền tảng AWS để mang tới các giải pháp chuyển đổi số và phân tích dữ liệu phù hợp, đúng thời điểm, giúp khách hàng có thể đưa ra các quyết định dựa trên dữ liệu và mang lại thành công lâu dài.  

Hiện nay, TechX Corp tự hào là đối tác tư vấn và triển khai giải pháp công nghệ và phân tích dữ liệu cho nhiều doanh nghiệp ở những lĩnh vực khác nhau, đặc biệt trong các lĩnh vực như Ngân Hàng và Tài Chính, Thương Mại Điện Tử, Sản Xuất Chế Tạo, Công Nghệ Blockchain,… 

TechX 2 năm liền vinh dự nhận danh hiệu Đối tác AWS của năm – AWS Partner of the Year 20212022 tại Việt Nam.