Bản cập nhật ChatGPT mới nhất của OpenAI đã mang đến một bước đột phá đáng kinh ngạc, đặc biệt là khả năng tạo và chỉnh sửa hình ảnh của mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o mà không cần bắt đầu một cuộc trò chuyện mới. Đây là một nâng cấp đáng giá, định hình lại cách chúng ta tương tác với AI tạo sinh. Tuy nhiên, vẫn còn một hạn chế nhỏ đối với người dùng ChatGPT miễn phí – ít nhất là ở thời điểm hiện tại.
Nâng Cấp Vượt Trội Về Khả Năng Tạo Và Chỉnh Sửa Hình Ảnh Của ChatGPT
Mô hình GPT-4o của OpenAI đang là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT. Nó được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” và thực tế đã chứng minh khả năng cung cấp thông tin nhanh chóng, chính xác trên nhiều lĩnh vực, ban đầu chủ yếu là văn bản.
Sau bản cập nhật vào ngày 25 tháng 3 năm 2025, GPT-4o đã có thể tạo ra những hình ảnh chất lượng cao với độ chi tiết đáng kinh ngạc, vượt xa chất lượng của mô hình mà nó gần như thay thế là DALL-E 3. Hơn nữa, GPT-4o giờ đây có thể thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh vượt xa khả năng của DALL-E 3. Các tác vụ như chỉnh sửa ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm/bớt đối tượng tiền cảnh và hậu cảnh đều có thể thực hiện được một cách linh hoạt.
Hình ảnh người thợ săn quái vật giả tưởng với sẹo trên mặt mua sắm trong siêu thị hiện đại, tạo bởi DALL-E
Hình ảnh người thợ săn quái vật phong trần với tóc trắng và sẹo, đang mua hàng trong siêu thị, tạo bởi GPT-4o
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện một cách rõ rệt. Việc tạo văn bản chưa bao giờ là điểm mạnh của DALL-E 3 (hoặc hầu hết các mô hình AI khác), nhưng GPT-4o giờ đây có thể tạo ra các bảng thông tin (infographics) chi tiết với giải thích cụ thể về gần như bất kỳ chủ đề nào. Vị trí văn bản trong hình ảnh giờ đây rất chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra hình ảnh bị mờ hoặc “lỗi AI”. Khả năng giữ lại chi tiết cũng là một cải tiến rõ ràng khác, với các đặc điểm cụ thể dễ dàng được chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Một phần của chất lượng hình ảnh được nâng cấp đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trả lời phỏng vấn với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác hướng dẫn của con người trên một phạm vi rộng các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên con người” để hoàn thành.
Hình ảnh người đàn ông giống Einstein đang thưởng thức kem tại Công viên Trung tâm, tạo bởi DALL-E
Hình ảnh người đàn ông có nét giống Einstein ăn kem ở Central Park, được tạo bởi GPT-4o
Khả năng tạo ảnh mới của ChatGPT thực sự rất ấn tượng, và bất cứ ai cũng nên thử trải nghiệm nó trên mọi chủ đề mong muốn. Mặc dù vẫn chưa hoàn hảo, bởi không có công cụ tạo ảnh AI nào hoàn hảo tuyệt đối, nhưng đây là một bước nhảy vọt đáng kể về chất lượng so với các mô hình tạo ảnh AI trước đây như DALL-E 3 – vốn hữu ích nhưng chưa thực sự vượt trội.
Tính Năng Tạo Ảnh Mới Của ChatGPT (Gần Như) Đang Được Triển Khai Cho Mọi Người
Đáng tiếc, do nhu cầu sử dụng GPT-4o quá lớn, người dùng ChatGPT miễn phí một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, CEO của OpenAI, Sam Altman, đã xác nhận sự chậm trễ này nhưng không đưa ra thời gian cụ thể cho việc kết thúc nó.
Sự gia tăng đột biến về số lượng người dùng là điều được mong đợi, nhưng không đến mức quá lớn như vậy. Thật không may, điều đó có nghĩa là bạn sẽ phải chờ đợi lâu hơn một chút hoặc nâng cấp lên gói ChatGPT Plus với mức phí 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn rất nhiều, thậm chí còn hơn cả thời điểm ra mắt mô hình trước đó của OpenAI là GPT-4.5.
Cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh cũ của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại vẫn chưa có lộ trình cụ thể nào cho sự thay đổi này.
Với những cải tiến vượt bậc về khả năng tạo và chỉnh sửa hình ảnh, GPT-4o đang mở ra một kỷ nguyên mới cho trí tuệ nhân tạo, cho phép người dùng biến ý tưởng thành hình ảnh trực quan một cách dễ dàng và chất lượng hơn bao giờ hết. Dù người dùng miễn phí có thể phải chờ đợi, sự nâng cấp này chắc chắn sẽ củng cố vị thế của ChatGPT như một công cụ AI đa năng và mạnh mẽ. Hãy tiếp tục theo dõi thuthuatmeohay.com để cập nhật những thông tin công nghệ mới nhất và trải nghiệm các tính năng AI đột phá này ngay khi chúng được triển khai rộng rãi!