Kỷ nguyên Agentic AI và bước ngoặt định nghĩa lại vai trò con người

Chỉ mất 9 phút để một mô hình trí tuệ nhân tạo tự chủ hoàn thành toàn bộ quy trình lập trình một robot vật lý phức tạp – nhiệm vụ mà các đội ngũ kỹ sư con người, dù được hỗ trợ bởi các công cụ AI trợ lý, phải mất tới 181 phút mới có thể hoàn thành. Sự chênh lệch hiệu năng lên tới 20 lần này không còn là một thử nghiệm trong phòng lab. Nó đánh dấu một bước chuyển dịch mang tính kiến tạo: Sự trỗi dậy của Agentic AI (AI đại lý) – những hệ thống không chỉ trả lời câu hỏi, mà trực tiếp hành động, sử dụng công cụ và đưa ra quyết định độc lập.

Sự chuyển dịch này đang đặt ngành công nghệ trước một nghịch lý lớn. Một mặt, lòng tin vào AI tăng cao đến mức nhiều lập trình viên bắt đầu bỏ qua bước duyệt mã nguồn (code review) để đưa thẳng mã do AI tạo ra vào môi trường vận hành (production). Mặt khác, việc đánh giá và kiểm soát các thực thể tự chủ này đang trở thành một bài toán hóc búa, đòi hỏi những hệ thống tiêu chuẩn đo lường (benchmark) hoàn toàn mới.

Từ mô hình ngôn ngữ đến thực thể hành động tự chủ

Trong nhiều năm, các mô hình ngôn ngữ lớn (LLM) hoạt động chủ yếu như những cỗ máy dự đoán từ tiếp theo. Người dùng nhập câu lệnh (prompt), mô hình trả về văn bản. Tuy nhiên, kiến trúc Agentic AI đã phá vỡ giới hạn này bằng cách trang bị cho mô hình khả năng lập kế hoạch đa bước, sử dụng công cụ bên ngoài (như trình duyệt, cổng thanh toán, trình biên dịch mã) và tự sửa lỗi khi gặp thất bại.

Khả năng này được thể hiện rõ nhất trong lĩnh vực lập trình và điều khiển robot. Các hệ thống AI thế hệ mới không chỉ viết code tĩnh; chúng có khả năng quan sát môi trường vật lý qua camera, phân tích yêu cầu, tự viết mã điều khiển, chạy thử nghiệm, phát hiện lỗi cú pháp hoặc lỗi vật lý, và liên tục tối ưu hóa cho đến khi robot hoàn thành nhiệm vụ.

Sự tự chủ này đang định hình lại quy trình phát triển phần mềm. Sự xuất hiện của các công cụ lập trình tự chủ như Cursor đã thay đổi thói quen của các kỹ sư. Thay vì sử dụng AI như một cuốn từ điển thông minh, các nhà phát triển đang giao phó toàn bộ các nhánh tính năng cho AI tự viết, tự kiểm thử và tự triển khai. Xu hướng “bỏ qua bước kiểm duyệt” (skipping review) phản ánh một niềm tin công nghệ đang lớn dần, nhưng cũng đồng thời cảnh báo những rủi ro tiềm ẩn về an ninh và tính ổn định của hệ thống.

Ma trận đánh giá năng lực Agentic AI

Khi AI không còn chỉ viết văn bản mà bắt đầu tác động trực tiếp vào cơ sở dữ liệu và hệ thống vật lý, các phương pháp đánh giá LLM truyền thống như MMLU hay GSM8K (vốn chỉ tập trung vào câu hỏi trắc nghiệm và tư duy toán học tĩnh) đã trở nên lỗi thời. Ngành công nghiệp đang chứng kiến một cuộc đua xây dựng các bộ benchmark thế hệ mới, tập trung vào khả năng tương tác thời gian thực và sử dụng công cụ.

Các hệ thống đánh giá hiện đại như LiveBench hay BenchLM đặt trọng tâm vào khả năng gọi hàm (function calling), sử dụng giao thức MCP (Model Context Protocol), duyệt web và thực hiện các quy trình làm việc đa bước (multi-step workflows). Trong các bảng xếp hạng năng lực mô hình hiện nay, các tiêu chí liên quan đến Agentic chiếm tỷ trọng ngày càng lớn, thường lên tới hơn 20% tổng điểm đánh giá tổng thể.

Tiêu chí	Benchmark truyền thống (MMLU, GSM8K)	Benchmark thế hệ mới (LiveBench, BenchLM, AgentPerf)
Mục tiêu đánh giá	Kiến thức tĩnh, khả năng ghi nhớ và suy luận logic cơ bản.	Khả năng tương tác, sử dụng công cụ, gọi API và giải quyết tác vụ mở.
Phương thức hoạt động	Trắc nghiệm hoặc trả lời câu hỏi một bước (Single-turn QA).	Chạy code thực tế, tương tác với môi trường giả lập (Sandbox), tự sửa sai.
Môi trường thử nghiệm	Môi trường đóng, dữ liệu không thay đổi theo thời gian.	Môi trường động, tích hợp công cụ bên thứ ba, yêu cầu xử lý lỗi thời gian thực.
Độ phức tạp tác vụ	Thấp đến trung bình, không yêu cầu lập kế hoạch dài hạn.	Rất cao, đòi hỏi phân rã bài toán lớn thành nhiều bước nhỏ và điều phối công cụ.

Không chỉ dừng lại ở lập trình hay công nghệ thuần túy, các nghiên cứu lâm sàng gần đây cũng bắt đầu ứng dụng các bộ benchmark chuyên biệt để đánh giá hệ thống Agent trong việc hỗ trợ ra quyết định y khoa. Điều này cho thấy tầm ảnh hưởng của Agentic AI đang lan rộng sang các lĩnh vực có độ rủi ro cao, nơi một quyết định sai lầm của AI có thể dẫn đến hậu quả nghiêm trọng.

Định vị lại vai trò con người trong vòng lặp công nghệ

Sự phát triển quá nhanh của Agentic AI dẫn đến một cuộc tranh luận sâu sắc về mặt triết học và kiến trúc hệ thống: Ai thực sự là người làm chủ?

Thuật ngữ phổ biến hiện nay là “Con người trong vòng lặp” (Human-in-the-loop) - ám chỉ việc con người đứng giám sát và can thiệp vào quá trình vận hành của máy móc. Tuy nhiên, nhiều chuyên gia công nghệ hàng đầu đang kêu gọi đảo ngược góc nhìn này. Việc coi con người là một mắt xích trong vòng lặp của máy móc vô tình nhường quyền chủ động và quyền lực quyết định cho AI.

Thay vào đó, tư duy đúng đắn phải là “Máy móc trong vòng lặp của con người” (Machine-in-the-human-loop). Vòng lặp công việc vẫn thuộc về con người, do con người thiết lập và chịu trách nhiệm pháp lý cũng như đạo đức. AI chỉ đơn thuần là một thực thể được tuyển dụng, một công cụ có năng lực cao được đưa vào để tối ưu hóa các phân đoạn cụ thể dưới sự kiểm soát toàn diện của chúng ta.

Nếu chấp nhận tư duy “Human-in-the-loop”, con người dễ rơi vào trạng thái thụ động, lười tư duy và dẫn đến việc bỏ qua các bước kiểm duyệt quan trọng như đã thấy trong xu hướng lập trình hiện nay. Ngược lại, với tư duy làm chủ vòng lặp, mỗi đoạn mã do AI tạo ra, mỗi quyết định do Agent đưa ra phải được xem xét như sản phẩm của một trợ lý chưa hoàn hảo, cần được kiểm chứng qua các bộ lọc bảo mật và logic do con người thiết lập.

Bản đồ địa chính trị AI và sự trỗi dậy của mã nguồn mở

Cuộc đua Agentic AI không chỉ là câu chuyện của Thung lũng Silicon. Trong bối cảnh các rào cản tiếp cận công nghệ từ Mỹ ngày càng thắt chặt đối với một số khu vực, các giải pháp thay thế hiệu quả về chi phí và có tính mở cao đang trỗi dậy mạnh mẽ.

Sự xuất hiện của các mô hình như GLM-5.2 từ Trung Quốc là một ví dụ điển hình. Với khả năng hỗ trợ lập trình mạnh mẽ, chi phí vận hành tối ưu và khả năng tiếp cận cởi mở, các mô hình này đang thu hút sự chú ý lớn từ cộng đồng nhà phát triển toàn cầu. Điều này chứng minh rằng kỷ nguyên Agentic AI sẽ không bị độc quyền bởi một vài ông lớn công nghệ. Sự phổ cập của các mô hình mã nguồn mở hiệu năng cao sẽ cho phép bất kỳ quốc gia hoặc doanh nghiệp nào cũng có thể tự xây dựng các hệ thống Agent tự chủ phù hợp với đặc thù bản địa.

Khuyến nghị cho cộng đồng công nghệ Việt Nam

Đối với các kỹ sư phần mềm, kiến trúc sư hệ thống và doanh nghiệp công nghệ tại Việt Nam, làn sóng Agentic AI mang đến cả cơ hội bứt phá lẫn thách thức đào thải cận kề. Để không bị tụt hậu, cộng đồng công nghệ trong nước cần tập trung vào các định hướng chiến lược sau:

Dịch chuyển từ kỹ sư viết code sang kiến trúc sư Agent (Agent Architect): Khi AI có thể tự viết và triển khai code với tốc độ gấp nhiều lần con người, giá trị của một lập trình viên không còn nằm ở việc gõ phím nhanh hay thuộc lòng cú pháp. Kỹ sư Việt Nam cần nâng cao năng lực thiết kế hệ thống, phân rã bài toán kinh doanh thành các quy trình mà Agent có thể xử lý, và thiết lập các rào cản bảo mật (guardrails) cho AI.
Làm chủ các giao thức kết nối công cụ: Việc nắm vững các tiêu chuẩn như Model Context Protocol (MCP) và các kỹ thuật gọi hàm (function calling) là bắt buộc. Khả năng kết nối trơn tru giữa mô hình trí tuệ nhân tạo với cơ sở dữ liệu nội bộ và các API bên thứ ba sẽ quyết định sự thành bại của một giải pháp Agentic AI doanh nghiệp.
Xây dựng quy trình đánh giá (Evaluation Pipeline) nội bộ: Không nên tin tưởng tuyệt đối vào các bảng xếp hạng công khai. Doanh nghiệp cần xây dựng các bộ thử nghiệm (test suite) riêng biệt, mô phỏng đúng dữ liệu và hành vi người dùng thực tế tại Việt Nam để liên tục đánh giá độ chính xác, an toàn và chi phí vận hành của các Agent trước khi đưa vào sản xuất.
Ứng dụng linh hoạt các mô hình mã nguồn mở: Tận dụng tối đa các mô hình nguồn mở chất lượng cao để giảm thiểu sự phụ thuộc vào các API độc quyền đắt đỏ từ nước ngoài, đồng thời đảm bảo quyền tự chủ về dữ liệu và khả năng tùy biến sâu cho các bài toán đặc thù của thị trường Việt Nam.

Kỷ nguyên Agentic AI không phủ nhận vai trò của con người, mà nâng tầm nó lên một vị trí cao hơn. Chúng ta không đồng hành cùng AI như một thực thể ngang hàng trong vòng lặp của nó; chúng ta tuyển dụng AI vào vòng lặp của chính mình để kiến tạo nên những giá trị vượt trội.