Nội Dung
OpenAI vừa công bố một bước tiến đáng kể trong cuộc đua phát triển trợ lý AI thông minh khi ra mắt ChatGPT Agent - một hệ thống AI đa năng có khả năng thực hiện nhiều tác vụ phức tạp trên máy tính thay mặt người dùng. Sản phẩm này đánh dấu nỗ lực táo bạo nhất của OpenAI nhằm chuyển đổi ChatGPT từ một công cụ trả lời câu hỏi đơn thuần thành một trợ lý có thể hành động và giải quyết các tác vụ thực tế.
ChatGPT Agent kết hợp các khả năng từ những công cụ trước đây của OpenAI, bao gồm Operator với khả năng điều hướng website và Deep Research với năng lực tổng hợp thông tin từ hàng chục trang web thành báo cáo nghiên cứu súc tích. Điều đặc biệt là người dùng có thể tương tác với agent này hoàn toàn bằng ngôn ngữ tự nhiên, không cần phải học các lệnh phức tạp.
Khả Năng Vượt Trội
Agent mới của OpenAI có thể tự động điều hướng lịch của người dùng, tạo ra các bài thuyết trình và slideshow có thể chỉnh sửa, và chạy mã lệnh. Những khả năng này vượt xa những gì OpenAI đã từng thử nghiệm với các agent trước đây. Hệ thống có thể kết nối với các ứng dụng như Gmail và GitHub thông qua ChatGPT connectors, cho phép agent tìm kiếm thông tin liên quan đến yêu cầu của người dùng.
OpenAI đưa ra những ví dụ ấn tượng về khả năng của ChatGPT Agent như "lập kế hoạch và mua nguyên liệu để làm bữa sáng Nhật Bản cho bốn người" hoặc "phân tích ba đối thủ cạnh tranh và tạo một slideshow". Những tác vụ này đòi hỏi agent phải phân tích các trang web, lập kế hoạch hành động và sử dụng các công cụ - những nhiệm vụ phức tạp hơn nhiều so với những gì OpenAI đã từng thử nghiệm.
Hiệu Suất Ấn Tượng
Theo OpenAI, mô hình nền tảng của ChatGPT Agent đạt hiệu suất hàng đầu trên nhiều benchmark. Trên Humanity's Last Exam, một bài kiểm tra khó khăn gồm hàng nghìn câu hỏi từ hơn một trăm lĩnh vực, ChatGPT Agent đạt 41,6% - gấp đôi so với các mô hình o3 và o4-mini của OpenAI.
Trên FrontierMath, một trong những benchmark toán học khó nhất, ChatGPT Agent đạt 27,4% khi có quyền truy cập vào các công cụ như terminal để thực thi mã. Con số này vượt xa điểm số 6,3% của o4-mini - mô hình trước đây đạt hiệu suất tốt nhất.
Triển Khai và Truy Cập
ChatGPT Agent được triển khai vào thứ Năm dành cho người đăng ký các gói Pro, Plus và Team của OpenAI. Để kích hoạt công cụ, người dùng có thể chọn "agent mode" trong menu thả xuống của ChatGPT. Việc tích hợp này cho thấy OpenAI đang tập trung vào việc tạo ra một trải nghiệm liền mạch cho người dùng hiện tại thay vì tạo ra một sản phẩm hoàn toàn mới.
Thách Thức Về An Toàn
OpenAI đã phát triển ChatGPT Agent với việc ưu tiên an toàn làm trọng tâm, đặc biệt vì sản phẩm này mang đến những khả năng mới có thể trở nên nguy hiểm trong tay những kẻ xấu. Trong báo cáo an toàn, OpenAI đã phân loại mô hình này là "high capability" trong lĩnh vực vũ khí sinh học và hóa học, được định nghĩa là mô hình có khả năng "khuếch đại các con đường hiện có dẫn đến tác hại nghiêm trọng".
Các biện pháp bảo vệ mới bao gồm một hệ thống giám sát hoạt động thời gian thực khi người dùng tương tác với sản phẩm. OpenAI chạy một bộ phân loại trên mỗi lời nhắc được nhập vào ChatGPT Agent, xác định liệu yêu cầu có liên quan đến sinh học hay không. Nếu có, hệ thống sẽ chạy phản hồi của ChatGPT Agent qua một monitor thứ hai để xác định liệu nội dung có thể được sử dụng để tạo ra mối đe dọa sinh học.
OpenAI cũng đã vô hiệu hóa tính năng memory của ChatGPT cho agent này để ngăn chặn việc lạm dụng. Trong các phần khác của ChatGPT, tính năng memory cho phép chatbot tham chiếu thông tin từ các cuộc trò chuyện trước đó của người dùng. Tuy nhiên, OpenAI lo ngại rằng những kẻ xấu có thể sử dụng tính năng này trong ChatGPT Agent để đánh cắp dữ liệu nhạy cảm thông qua các cuộc tấn công prompt injection.
Bối Cảnh Thị Trường
Việc ra mắt ChatGPT Agent diễn ra trong bối cảnh các công ty Silicon Valley bao gồm OpenAI, Google và Perplexity đã công bố hàng chục AI agent trong những năm gần đây, hứa hẹn sẽ có thể thực hiện các tác vụ thay mặt người dùng. Tuy nhiên, những phiên bản AI agent đầu tiên này đã tỏ ra gặp khó khăn với các tác vụ phức tạp và dường như kém hấp dẫn như các sản phẩm so với tầm nhìn cuối cùng mà các giám đốc điều hành công nghệ đưa ra về AI agent.
Tương Lai Của AI Agent
Mặc dù ChatGPT Agent nghe có vẻ ấn tượng, vẫn còn phải chờ xem nó thực sự có khả năng như thế nào trong thế giới thực. Cho đến nay, công nghệ agent đã tỏ ra tương đối mong manh khi tương tác với thế giới thực. Tuy nhiên, OpenAI tuyên bố rằng họ đã phát triển một mô hình có khả năng hơn, có thể thực hiện được lời hứa về AI agent.
Sự ra mắt của ChatGPT Agent đại diện cho một bước tiến quan trọng trong cuộc đua phát triển AI agent thực sự hữu dụng. Với khả năng kết hợp nhiều tính năng từ các công cụ trước đây và hiệu suất vượt trội trên các benchmark, ChatGPT Agent có thể trở thành tiêu chuẩn mới cho việc phát triển AI agent trong tương lai.
Kết Luận
ChatGPT Agent của OpenAI đánh dấu một bước ngoặt quan trọng trong sự phát triển của công nghệ AI agent, mang đến khả năng thực hiện các tác vụ phức tạp vượt xa những gì đã từng có. Với hiệu suất ấn tượng trên các benchmark khó khăn và khả năng tương tác tự nhiên, sản phẩm này có tiềm năng thay đổi cách chúng ta làm việc với máy tính.
Tuy nhiên, những thách thức về an toàn và độ tin cậy trong thế giới thực vẫn là những vấn đề cần được giải quyết. OpenAI đã thể hiện sự thận trọng đáng khen ngợi trong việc phát triển các biện pháp bảo vệ, nhưng chỉ có thời gian mới cho thấy ChatGPT Agent có thể đáp ứng được những kỳ vọng cao mà nó đặt ra hay không.
Việc ra mắt này không chỉ là một bước tiến của OpenAI mà còn là một thử thách đối với toàn bộ ngành công nghiệp AI, đặt ra câu hỏi về việc liệu các đối thủ cạnh tranh có thể theo kịp tốc độ đổi mới này hay không.








