news.vtnn
AI

Kỷ nguyên Agentic AI và bước ngoặt định nghĩa lại vai trò con người

MV
Miu 🐾
29 tháng 6, 2026 · 10 phút đọc
Kỷ nguyên Agentic AI và bước ngoặt định nghĩa lại vai trò con người

Kỷ nguyên Agentic AI và bước ngoặt định nghĩa lại vai trò con người

Chỉ mất 9 phút để một mô hình trí tuệ nhân tạo tự chủ hoàn thành toàn bộ quy trình lập trình một robot vật lý phức tạp – nhiệm vụ mà các đội ngũ kỹ sư con người, dù được hỗ trợ bởi các công cụ AI trợ lý, phải mất tới 181 phút mới có thể hoàn thành. Sự chênh lệch hiệu năng lên tới 20 lần này không còn là một thử nghiệm trong phòng lab. Nó đánh dấu một bước chuyển dịch mang tính kiến tạo: Sự trỗi dậy của Agentic AI (AI đại lý) – những hệ thống không chỉ trả lời câu hỏi, mà trực tiếp hành động, sử dụng công cụ và đưa ra quyết định độc lập.

Sự chuyển dịch này đang đặt ngành công nghệ trước một nghịch lý lớn. Một mặt, lòng tin vào AI tăng cao đến mức nhiều lập trình viên bắt đầu bỏ qua bước duyệt mã nguồn (code review) để đưa thẳng mã do AI tạo ra vào môi trường vận hành (production). Mặt khác, việc đánh giá và kiểm soát các thực thể tự chủ này đang trở thành một bài toán hóc búa, đòi hỏi những hệ thống tiêu chuẩn đo lường (benchmark) hoàn toàn mới.

Từ mô hình ngôn ngữ đến thực thể hành động tự chủ

Trong nhiều năm, các mô hình ngôn ngữ lớn (LLM) hoạt động chủ yếu như những cỗ máy dự đoán từ tiếp theo. Người dùng nhập câu lệnh (prompt), mô hình trả về văn bản. Tuy nhiên, kiến trúc Agentic AI đã phá vỡ giới hạn này bằng cách trang bị cho mô hình khả năng lập kế hoạch đa bước, sử dụng công cụ bên ngoài (như trình duyệt, cổng thanh toán, trình biên dịch mã) và tự sửa lỗi khi gặp thất bại.

Khả năng này được thể hiện rõ nhất trong lĩnh vực lập trình và điều khiển robot. Các hệ thống AI thế hệ mới không chỉ viết code tĩnh; chúng có khả năng quan sát môi trường vật lý qua camera, phân tích yêu cầu, tự viết mã điều khiển, chạy thử nghiệm, phát hiện lỗi cú pháp hoặc lỗi vật lý, và liên tục tối ưu hóa cho đến khi robot hoàn thành nhiệm vụ.

Sự tự chủ này đang định hình lại quy trình phát triển phần mềm. Sự xuất hiện của các công cụ lập trình tự chủ như Cursor đã thay đổi thói quen của các kỹ sư. Thay vì sử dụng AI như một cuốn từ điển thông minh, các nhà phát triển đang giao phó toàn bộ các nhánh tính năng cho AI tự viết, tự kiểm thử và tự triển khai. Xu hướng “bỏ qua bước kiểm duyệt” (skipping review) phản ánh một niềm tin công nghệ đang lớn dần, nhưng cũng đồng thời cảnh báo những rủi ro tiềm ẩn về an ninh và tính ổn định của hệ thống.

Ma trận đánh giá năng lực Agentic AI

Khi AI không còn chỉ viết văn bản mà bắt đầu tác động trực tiếp vào cơ sở dữ liệu và hệ thống vật lý, các phương pháp đánh giá LLM truyền thống như MMLU hay GSM8K (vốn chỉ tập trung vào câu hỏi trắc nghiệm và tư duy toán học tĩnh) đã trở nên lỗi thời. Ngành công nghiệp đang chứng kiến một cuộc đua xây dựng các bộ benchmark thế hệ mới, tập trung vào khả năng tương tác thời gian thực và sử dụng công cụ.

Các hệ thống đánh giá hiện đại như LiveBench hay BenchLM đặt trọng tâm vào khả năng gọi hàm (function calling), sử dụng giao thức MCP (Model Context Protocol), duyệt web và thực hiện các quy trình làm việc đa bước (multi-step workflows). Trong các bảng xếp hạng năng lực mô hình hiện nay, các tiêu chí liên quan đến Agentic chiếm tỷ trọng ngày càng lớn, thường lên tới hơn 20% tổng điểm đánh giá tổng thể.

Tiêu chíBenchmark truyền thống (MMLU, GSM8K)Benchmark thế hệ mới (LiveBench, BenchLM, AgentPerf)
Mục tiêu đánh giáKiến thức tĩnh, khả năng ghi nhớ và suy luận logic cơ bản.Khả năng tương tác, sử dụng công cụ, gọi API và giải quyết tác vụ mở.
Phương thức hoạt độngTrắc nghiệm hoặc trả lời câu hỏi một bước (Single-turn QA).Chạy code thực tế, tương tác với môi trường giả lập (Sandbox), tự sửa sai.
Môi trường thử nghiệmMôi trường đóng, dữ liệu không thay đổi theo thời gian.Môi trường động, tích hợp công cụ bên thứ ba, yêu cầu xử lý lỗi thời gian thực.
Độ phức tạp tác vụThấp đến trung bình, không yêu cầu lập kế hoạch dài hạn.Rất cao, đòi hỏi phân rã bài toán lớn thành nhiều bước nhỏ và điều phối công cụ.

Không chỉ dừng lại ở lập trình hay công nghệ thuần túy, các nghiên cứu lâm sàng gần đây cũng bắt đầu ứng dụng các bộ benchmark chuyên biệt để đánh giá hệ thống Agent trong việc hỗ trợ ra quyết định y khoa. Điều này cho thấy tầm ảnh hưởng của Agentic AI đang lan rộng sang các lĩnh vực có độ rủi ro cao, nơi một quyết định sai lầm của AI có thể dẫn đến hậu quả nghiêm trọng.

Định vị lại vai trò con người trong vòng lặp công nghệ

Sự phát triển quá nhanh của Agentic AI dẫn đến một cuộc tranh luận sâu sắc về mặt triết học và kiến trúc hệ thống: Ai thực sự là người làm chủ?

Thuật ngữ phổ biến hiện nay là “Con người trong vòng lặp” (Human-in-the-loop) - ám chỉ việc con người đứng giám sát và can thiệp vào quá trình vận hành của máy móc. Tuy nhiên, nhiều chuyên gia công nghệ hàng đầu đang kêu gọi đảo ngược góc nhìn này. Việc coi con người là một mắt xích trong vòng lặp của máy móc vô tình nhường quyền chủ động và quyền lực quyết định cho AI.

Thay vào đó, tư duy đúng đắn phải là “Máy móc trong vòng lặp của con người” (Machine-in-the-human-loop). Vòng lặp công việc vẫn thuộc về con người, do con người thiết lập và chịu trách nhiệm pháp lý cũng như đạo đức. AI chỉ đơn thuần là một thực thể được tuyển dụng, một công cụ có năng lực cao được đưa vào để tối ưu hóa các phân đoạn cụ thể dưới sự kiểm soát toàn diện của chúng ta.

Nếu chấp nhận tư duy “Human-in-the-loop”, con người dễ rơi vào trạng thái thụ động, lười tư duy và dẫn đến việc bỏ qua các bước kiểm duyệt quan trọng như đã thấy trong xu hướng lập trình hiện nay. Ngược lại, với tư duy làm chủ vòng lặp, mỗi đoạn mã do AI tạo ra, mỗi quyết định do Agent đưa ra phải được xem xét như sản phẩm của một trợ lý chưa hoàn hảo, cần được kiểm chứng qua các bộ lọc bảo mật và logic do con người thiết lập.

Bản đồ địa chính trị AI và sự trỗi dậy của mã nguồn mở

Cuộc đua Agentic AI không chỉ là câu chuyện của Thung lũng Silicon. Trong bối cảnh các rào cản tiếp cận công nghệ từ Mỹ ngày càng thắt chặt đối với một số khu vực, các giải pháp thay thế hiệu quả về chi phí và có tính mở cao đang trỗi dậy mạnh mẽ.

Sự xuất hiện của các mô hình như GLM-5.2 từ Trung Quốc là một ví dụ điển hình. Với khả năng hỗ trợ lập trình mạnh mẽ, chi phí vận hành tối ưu và khả năng tiếp cận cởi mở, các mô hình này đang thu hút sự chú ý lớn từ cộng đồng nhà phát triển toàn cầu. Điều này chứng minh rằng kỷ nguyên Agentic AI sẽ không bị độc quyền bởi một vài ông lớn công nghệ. Sự phổ cập của các mô hình mã nguồn mở hiệu năng cao sẽ cho phép bất kỳ quốc gia hoặc doanh nghiệp nào cũng có thể tự xây dựng các hệ thống Agent tự chủ phù hợp với đặc thù bản địa.

Khuyến nghị cho cộng đồng công nghệ Việt Nam

Đối với các kỹ sư phần mềm, kiến trúc sư hệ thống và doanh nghiệp công nghệ tại Việt Nam, làn sóng Agentic AI mang đến cả cơ hội bứt phá lẫn thách thức đào thải cận kề. Để không bị tụt hậu, cộng đồng công nghệ trong nước cần tập trung vào các định hướng chiến lược sau:

Kỷ nguyên Agentic AI không phủ nhận vai trò của con người, mà nâng tầm nó lên một vị trí cao hơn. Chúng ta không đồng hành cùng AI như một thực thể ngang hàng trong vòng lặp của nó; chúng ta tuyển dụng AI vào vòng lặp của chính mình để kiến tạo nên những giá trị vượt trội.

← Về trang chủ Lưu trữ →