5 Xu hướng định hình tương lai ngành khoa học dữ liệu và học máy

Vừa qua, Gartner, Inc. đã điểm qua các xu hướng chính có ảnh hưởng tới tương lai của lĩnh vực khoa học dữ liệu và học máy (DSML). Với tốc độ phát triển chóng mặt, ngành này đang nâng tầm để đáp ứng sự bùng nổ dữ liệu trong trí tuệ nhân tạo (AI), và điều này trở nên càng quan trọng khi đầu tư vào GenAI đang ngày càng được quan tâm. 

Tại sự kiện Gartner Data & Analytics Summit tại Sydney, ông Peter Krensky, Giám đốc Phân tích dữ liệu tại Gartner đã nhấn mạnh: “Trong bối cảnh áp dụng học máy đang gia tăng với tốc độ chóng mặt, khoa học dữ liệu và học máy (DSML) đang tiến hóa từ việc chú trọng vào mô hình dự đoán sang một hệ sinh thái cởi mở, linh hoạt và chú trọng dữ liệu. Sự hứng thú đối với GenAI cũng đang góp phần thúc đẩy xu hướng này. Mặc dù vẫn tồn tại nhiều rủi ro không lường trước, nhưng bên cạnh đó cũng mở ra vô số cơ hội và ứng dụng mới cho các chuyên gia dữ liệu và tổ chức.”

Dưới đây là một số các xu hướng dẫn đầu định hình tương lai của khoa học dữ liệu và máy học do Gartner công bô.

Xu hướng 1: Hệ sinh thái dữ liệu điện toán đám mây (Cloud Data Ecosystems)

Hệ sinh thái dữ liệu đang dần chuyển từ phần mềm độc lập hoặc triển khai kết hợp sang giải pháp điện toán đám mây toàn diện. Gartner dự báo vào năm 2024, khoảng 50% các hoạt động triển khai hệ thống mới trên nền tảng đám mây sẽ nằm trên cơ sở của hệ sinh thái dữ liệu đám mây tích hợp, thay thế cho các giải pháp tích hợp điểm một cách thủ công.

Theo Gartner, các tổ chức nên đánh giá hệ sinh thái dữ liệu của mình dựa trên khả năng đối phó với những thách thức của dữ liệu phân tán và khả năng kết nối cũng như tích hợp với các nguồn dữ liệu ngoại vi so với môi trường nội bộ hiện tại của họ.

Xu hướng 2: Công nghệ Edge AI

Edge AI đang trở nên phổ biến, cho phép việc xử lý dữ liệu ngay tại thời điểm tạo ra trên Edge. Điều này mở ra khả năng thu thập thông tin chính xác và tức thì, nhận diện xu hướng mới và tuân thủ chặt chẽ các tiêu chuẩn về bảo mật thông tin cá nhân. Hơn nữa, Edge AI đang là chìa khóa giúp các tổ chức tối ưu hóa quá trình phát triển, tích hợp và triển khai giải pháp AI của mình.

Đến năm 2025, trên 55% các quá trình phân tích dữ liệu sẽ được thực hiện trực tiếp tại điểm thu thập dữ liệu của hệ thống Edge, tăng vọt so với con số dưới 10% vào năm 2021. Các tổ chức cần phải xác định rõ ràng các ứng dụng cần thiết, cũng như quá trình đào tạo và kết luận AI để có thể chuyển giao suôn sẻ đến môi trường Edge, ngay sát các điểm cuối của IoT.

Xu hướng 3: Trí tuệ nhân tạo (AI) có trách nhiệm

AI có trách nhiệm (Responsible AI) biến AI thành lực lượng tích cực, thay vì trở thành mối đe dọa cho xã hội và chính bản thân nó, bao gồm nhiều khía cạnh của việc đưa ra các lựa chọn kinh doanh đúng đắn và có đạo đức khi áp dụng AI, những vấn đề mà các tổ chức thường xử lý một cách độc lập như tạo ra giá trị kinh doanh và xã hội, rủi ro, niềm tin, sự minh bạch và trách nhiệm giải trình. Gartner dự đoán sự tập trung vào các mô hình AI được đào tạo sẵn chỉ trong tay 1% nhà cung cấp AI vào năm 2025 sẽ biến AI có trách nhiệm thành một vấn đề của xã hội.

Gartner khuyến nghị các tổ chức nên áp dụng cách tiếp cận tương xứng với rủi ro để mang lại giá trị từ AI và thận trọng khi áp dụng các giải pháp và mô hình. Cần tìm kiếm sự cam kết từ nhà cung cấp để đảm bảo họ đang quản lý rủi ro và nghĩa vụ pháp lý của mình, bảo vệ tổ chức doanh nghiệp khỏi những rủi ro tài chính tiềm ẩn, các vấn đề pháp lý và tổn hại về uy tín.

Xu hướng 4: AI tập trung vào dữ liệu

AI tập trung vào dữ liệu hay Data-centric AI đánh dấu sự chuyển hướng từ cách tiếp cận trọng tâm mô hình và mã lệnh sang việc tập trung nhiều hơn vào dữ liệu để xây dựng hệ thống AI mạnh mẽ hơn. Các giải pháp như quản lý dữ liệu đặc thù cho AI, dữ liệu tổng hợp và công nghệ gán nhãn dữ liệu, nhằm giải quyết nhiều thách thức liên quan đến dữ liệu bao gồm khả năng tiếp cận, khối lượng, quyền riêng tư, an ninh, độ phức tạp và phạm vi.

Việc sử dụng Gen AI để tạo ra dữ liệu tổng hợp là một lĩnh vực đang phát triển nhanh chóng, giảm bớt gánh nặng trong việc thu thập dữ liệu thế giới thực để có thể huấn luyện mô hình học máy một cách hiệu quả. Gartner dự đoán đến năm 2024, 60% dữ liệu cho AI sẽ là dữ liệu tổng hợp để mô phỏng thực tế, kịch bản tương lai và giảm thiểu rủi ro cho AI, tăng từ 1% vào năm 2021.

Xu hướng 5: Tăng tốc đầu tư vào AI

Đầu tư vào AI sẽ tiếp tục được tăng tốc bởi các tổ chức triển khai giải pháp, cũng như các ngành đang tìm kiếm cơ hội phát triển thông qua AI và hoạt động kinh doanh dựa trên công nghệ này. Đến cuối năm 2026, Gartner dự đoán rằng hơn 10 tỷ USD sẽ được đầu tư vào các công ty khởi nghiệp AI dựa trên các mô hình nền tảng – các mô hình AI lớn được đào tạo dựa trên lượng dữ liệu khổng lồ.

Một cuộc khảo sát gần đây của Gartner với hơn 2.500 nhà lãnh đạo đã chỉ ra rằng 45% trong số họ đang tăng tốc đầu tư vào AI do ảnh hưởng từ sức bật từ ChatGPT, 70% thừa nhận vẫn đang trong quá trình tìm tòi, nghiên cứu và 19% đã bắt tay vào thử nghiệm và phát triển sản phẩm về AI.

Về TechX Corp.

TechX Corp. là đối tác AWS tại Việt Nam được thành lập năm 2019 bởi các chuyên gia có trên 15 năm kinh nghiệm đến từ các công ty đa quốc gia và tập đoàn đi đầu về chuyển đổi số. Sứ mệnh của TechX là tạo lập môi trường cho những con người đầy đam mê, nhiệt huyết thỏa sức khám phá và kiến tạo, mang đến những sản phẩm công nghệ đơn giản và thân thiện, góp phần đẩy nhanh quá trình xây dựng một Việt Nam số trên nền tảng công nghệ điện toán đám mây.

TechX 2 năm liền nhận danh hiệu Đối tác AWS của năm – AWS Partner of the Year tại Việt Nam