ChatGPT đang nhận được một bản nâng cấp cực kỳ lớn, được thiết kế để tăng tốc cuộc sống của bạn và loại bỏ những tác vụ lặp đi lặp lại thường làm chúng ta mất tập trung khỏi công việc, giải trí và nhiều hơn thế nữa. Tính năng mới ChatGPT Agent ra mắt khả năng duyệt web tự động hoàn toàn bằng tác nhân AI – và nó sẽ sớm có mặt với người dùng.
OpenAI Nâng Tầm ChatGPT Với Sức Mạnh Của Agent
ChatGPT đang được bổ sung khả năng sử dụng các tác nhân AI tự động hoàn toàn, được gọi là ChatGPT Agent. Hãy hình dung thế này: Cho đến nay, ChatGPT có thể duyệt web và tìm kiếm thông tin cho bạn, nhưng bạn vẫn cần phải tương tác và hướng dẫn quá trình nghiên cứu của nó.
ChatGPT Agent hiển thị lựa chọn trong cửa sổ chat.
Tuy nhiên, giờ đây ChatGPT Agent có thể tự động hóa hoàn toàn tất cả các quy trình, yêu cầu và tác vụ này, hoàn thành chúng gần như không cần bất kỳ sự can thiệp nào từ người dùng. Theo nhiều cách, ChatGPT Agent kết hợp hai công cụ trước đây của OpenAI – Operator và Deep Research – để tạo ra một công cụ mạnh mẽ hơn đáng kể, có khả năng tự động hoàn thành các hành động. Operator là nỗ lực trước đây của OpenAI về một tác nhân AI, có khả năng duyệt web, đặt lịch và hoàn thành một số tác vụ cơ bản. Trong khi đó, Deep Research là một công cụ nghiên cứu chuyên sâu, được thiết kế để đi sâu vào bất kỳ yêu cầu nào được đưa ra, tạo ra các báo cáo toàn diện với phân tích dữ liệu từ nhiều nguồn, nhưng nó không được thiết kế cho mức độ tương tác web như Operator.
Kết hợp các công cụ này với sức mạnh của AI tác nhân mang đến một công cụ có thể duyệt web hoàn toàn cho bạn, tính đến hầu hết mọi thông tin bạn cung cấp. Ngoài ra, ChatGPT Agent có thể truy cập “ChatGPT connectors” cho phép bạn liên kết các ứng dụng và tài khoản với tác nhân, nơi nó có thể tìm thấy thông tin rất cụ thể về bạn và các yêu cầu của bạn. Ví dụ, bạn có thể kết nối Gmail, ứng dụng lịch của mình, v.v., và biến tác nhân AI thành một trợ lý cá nhân chính hiệu.
OpenAI ChatGPT Agent đang duyệt web một cách tự động.
Bạn có thể chia nhỏ nó thành ba lĩnh vực chính:
- Tác vụ Tự động Hóa (Autonomous Tasks): ChatGPT Agent có thể hoàn thành các tác vụ phức tạp, đa bước mà không yêu cầu người dùng nhập liệu liên tục.
- Duyệt Web (Web Browsing): Tác nhân có thể duyệt web bên trong ChatGPT, bắt chước chính xác hành vi của một con người thực với các cú nhấp và di chuyển của nó. Nó cũng có thể điều hướng các biểu mẫu, điều rất quan trọng trong internet ngày nay. Đó là một máy tính ảo bên trong ChatGPT, có cả giao diện dựa trên văn bản và trình duyệt trực quan, mà Agent có thể lựa chọn để sử dụng.
- Bộ Công Cụ Đa Dạng (Tools): OpenAI đã xác nhận rằng ChatGPT Agent có thể sử dụng tất cả các công cụ đã có sẵn để hoàn thành tác vụ của mình, chẳng hạn như truy cập API, thao tác tệp, nhập dữ liệu, suy luận và thậm chí lập trình để hoàn thành công việc. Ví dụ, Agent có quyền truy cập vào terminal riêng để làm việc trên các tác vụ cụ thể hoặc sử dụng AI tạo sinh để tạo ra hình ảnh độc đáo.
Minh họa ChatGPT Agent sử dụng tính năng kết nối (connector).
Đây là mô hình đầu tiên mà OpenAI đã huấn luyện có thể di chuyển liền mạch giữa các chức năng khác nhau và “bộ công cụ hợp nhất”. Sử dụng học tăng cường (reinforcement learning), Agent có thể quyết định khi nào sử dụng bất kỳ công cụ nào trong số các công cụ sẵn có, cho phép nó xử lý các yêu cầu và tác vụ phức tạp từng bước một. Nhưng theo thời gian, nó sẽ trở nên hiệu quả hơn trong việc hoàn thành các tác vụ, đẩy nhanh quá trình và tăng độ chính xác.
ChatGPT Agent: Bảo Mật Và Tính An Toàn
Buổi livestream của OpenAI đã làm nổi bật một vài tính năng bảo mật chính được tích hợp trong ChatGPT Agent.
Đầu tiên, mặc dù nó có thể hoàn thành các tác vụ theo yêu cầu, nhưng nó sẽ nhắc nhở bạn khi đến lúc gửi biểu mẫu, đăng nhập vào trang web và các tác vụ quan trọng khác. Những gián đoạn này được thiết kế để ngăn chặn các vấn đề phát sinh cụ thể trong các tình huống này. Tự động hóa thật tuyệt vời, nhưng hiện tại, sự nhập liệu của người dùng vẫn rất quan trọng.
OpenAI cũng đã huấn luyện Agent từ chối các yêu cầu nguy hiểm, không an toàn hoặc mơ hồ mà nó không thể thực hiện. Nó tuân thủ chặt chẽ các tiêu chuẩn an toàn hiện có của OpenAI, điều này sẽ đảm bảo nó không đi quá xa khỏi ranh giới hiện tại của ChatGPT. Điều này chắc chắn sẽ làm một số người bực mình khi họ tin rằng ChatGPT đã bị khóa quá chặt, nhưng điều đó là hợp lý khi đưa các tác nhân AI tự động ra thế giới.
Hơn nữa, khi ra mắt, nó cũng sẽ không thực hiện bất kỳ giao dịch mua nào mà không có xác nhận.
Agent cũng đi kèm với một số công cụ mới để bảo vệ chống lại prompt injection, một loại tấn công độc hại mới tập trung vào các công cụ AI. Prompt injection là một vấn đề đối với tất cả các loại AI tạo sinh, nhưng lại là mối lo ngại đặc biệt hiện nay khi các công cụ này sẽ bắt đầu duyệt web một cách tự động.
Trong đó, OpenAI đã xây dựng một số biện pháp bảo vệ mới vào Agent. Ví dụ, ChatGPT Agent chạy trong một môi trường sandboxed (hộp cát). Mặc dù nó có thể thay đổi lịch của bạn, tải xuống tệp, v.v., OpenAI không muốn nó tương tác trực tiếp với hệ điều hành của bạn ở mức độ có thể gây hại, vì vậy nó cô lập công cụ. Ngoài ra, nó sử dụng các bộ phân loại cụ thể để xác định các cuộc tấn công prompt injection và các loại thao túng khác, và được thiết kế để ngăn chặn chúng.
Thời Điểm Ra Mắt ChatGPT Agent
Thực tế, trong một khoảnh khắc hiếm hoi đối với OpenAI, Sam Altman đã xác nhận rằng Agent sẽ ra mắt ngay lập tức. Người đăng ký ChatGPT Pro sẽ nhận được 400 truy vấn mỗi tháng, trong khi người đăng ký Plus và Team sẽ có giới hạn hơn với 40 yêu cầu.
Tuy nhiên, giống như hầu hết các tính năng mới của ChatGPT, ngay cả khi nó ra mắt ngay lập tức, vẫn mất vài ngày để nó đến được tài khoản cụ thể của bạn, ngay cả khi bạn đã đăng ký một trong các gói trên.
Đừng quên rằng, lĩnh vực duyệt web bằng tác nhân trong trình duyệt là một không gian rất sôi động. Đầu năm 2025, Opera đã ra mắt trình duyệt Neon ấn tượng của mình với tác nhân AI, trong khi Perplexity cũng đang thử nghiệm trình duyệt Comet được hỗ trợ bởi AI. Và đừng quên rằng gã khổng lồ chống virus Norton cũng sẽ ra mắt Neo, một trình duyệt được hỗ trợ bởi AI khác, vào khoảng năm 2025. Như đã nói, các trình duyệt được hỗ trợ AI đã có mặt, và chúng đang đến ồ ạt!
Tóm lại, ChatGPT Agent là một bước tiến vượt bậc của OpenAI, hứa hẹn thay đổi cách chúng ta tương tác với công nghệ bằng cách tự động hóa các tác vụ phức tạp và duyệt web một cách thông minh. Với những tính năng bảo mật vững chắc và khả năng học hỏi liên tục, Agent không chỉ nâng cao hiệu suất mà còn đảm bảo an toàn cho người dùng. Hãy sẵn sàng trải nghiệm một trợ lý AI cá nhân mạnh mẽ và đáng tin cậy. Hãy chia sẻ suy nghĩ và kỳ vọng của bạn về ChatGPT Agent trong phần bình luận bên dưới!