Bản cập nhật mới nhất của OpenAI cho ChatGPT mang đến một trong những cải tiến đáng kể nhất từ trước đến nay, đặc biệt là nâng cấp vượt bậc về khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, thay vì phải chuyển sang DALL-E 3, người dùng có thể tạo ra những hình ảnh chất lượng cực cao trực tiếp bằng GPT-4o ngay trong cuộc trò chuyện mà không cần khởi tạo một cuộc hội thoại mới. Đây là một bước tiến lớn trong công nghệ tạo ảnh AI, hứa hẹn mang lại trải nghiệm liền mạch và mạnh mẽ hơn. Tuy nhiên, một điểm đáng lưu ý là tính năng tiên tiến này hiện tại vẫn còn giới hạn đối với người dùng ChatGPT miễn phí.
ChatGPT: Bước Đột Phá Mới Trong Tạo Ảnh AI Với GPT-4o
Mô hình GPT-4o của OpenAI từ lâu đã là lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” bởi khả năng cung cấp thông tin nhanh chóng và chính xác. Trước đây, điểm mạnh này chủ yếu tập trung vào việc xử lý văn bản.
Tuy nhiên, với bản cập nhật ngày 25 tháng 3 năm 2025, GPT-4o đã được trang bị khả năng tạo ảnh chất lượng cao với chi tiết đáng kinh ngạc, vượt xa chất lượng của DALL-E 3 – mô hình mà nó đang dần thay thế. Không chỉ dừng lại ở việc tạo ảnh, GPT-4o giờ đây còn có thể thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh phức tạp hơn nhiều so với DALL-E 3. Các tác vụ như chỉnh sửa hình ảnh, điều chỉnh màu sắc và phong cách, thay đổi tinh tế, thêm/bớt đối tượng tiền cảnh và hậu cảnh, và nhiều hơn thế nữa đều có thể thực hiện được.
Hình ảnh một thợ săn quái vật giả tưởng tóc trắng có sẹo, đang mua sắm trong siêu thị hiện đại, tạo bởi DALL-E 3.
Hình ảnh một thợ săn quái vật tóc trắng đầy sẹo, mua sắm trong siêu thị hiện đại, được tạo bởi GPT-4o với độ chi tiết cao.
Khả năng tạo văn bản trong hình ảnh cũng được cải thiện một cách đáng kinh ngạc. Trong khi việc tạo văn bản của DALL-E 3 chưa bao giờ là điểm mạnh (tương tự như hầu hết các mô hình AI khác), GPT-4o giờ đây có thể tạo ra các infographic chi tiết với phần giải thích đầy đủ về gần như mọi chủ đề. Việc đặt văn bản trong ảnh trở nên chính xác, với khả năng sử dụng các kiểu chữ và hướng cụ thể mà không lo tạo ra các hình ảnh AI bị mờ hoặc không rõ nét. Khả năng duy trì chi tiết cũng là một cải tiến rõ rệt khác, cho phép dễ dàng chuyển đổi các tính năng cụ thể từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn cảnh hoặc tạo ra một hình ảnh mới.
Hình ảnh người đàn ông giống Einstein ăn kem tại Công viên Trung tâm, minh họa khả năng của DALL-E 3.
Hình ảnh một người đàn ông giống Einstein thưởng thức kem ở Central Park, cho thấy chất lượng từ GPT-4o.
Một phần của chất lượng hình ảnh được nâng cấp đến từ các quan hệ đối tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để chỉ ra các lỗi mà GPT-4o mắc phải trong quá trình tạo ảnh. Theo chia sẻ với Wall Street Journal, nhà nghiên cứu chính Gabriel Goh giải thích rằng kỹ thuật học tăng cường này giúp GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một loạt các yêu cầu tạo ảnh, và quá trình này chỉ cần “hơn 100 nhân viên” để hoàn thành.
GPT-4o Tạo Ảnh: Giới Hạn Hiện Tại Với Người Dùng Miễn Phí
Mặc dù khả năng tạo ảnh mới của GPT-4o thực sự ấn tượng, nhưng đáng tiếc là do nhu cầu sử dụng GPT-4o tăng đột biến chưa từng có, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi để trải nghiệm tính năng này. Vào ngày 26 tháng 3 năm 2025, CEO OpenAI Sam Altman đã xác nhận sự chậm trễ này nhưng không đưa ra khoảng thời gian cụ thể cho việc kết thúc.
Sự gia tăng đột biến về số lượng người dùng miễn phí là điều đã được dự đoán trước, nhưng mức độ vượt quá mong đợi. Điều này có nghĩa là bạn sẽ phải chờ đợi thêm một thời gian hoặc nâng cấp lên gói ChatGPT Plus với mức phí 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với việc ra mắt bản nâng cấp mô hình trước đó của OpenAI, GPT-4.5.
Cũng cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo ảnh kế thừa của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có lộ trình cụ thể nào cho sự thay đổi này.
Tóm lại, bản cập nhật GPT-4o mang đến một cuộc cách mạng trong lĩnh vực tạo ảnh AI, biến ChatGPT thành một công cụ đa năng hơn bao giờ hết. Khả năng tạo và chỉnh sửa ảnh chất lượng cao trực tiếp trong cuộc trò chuyện sẽ mở ra vô vàn tiềm năng sáng tạo cho người dùng. Mặc dù người dùng miễn phí có thể phải chờ đợi, nhưng đây chắc chắn là một lý do thuyết phục để cân nhắc nâng cấp lên ChatGPT Plus để trải nghiệm sức mạnh của AI tạo ảnh tiên tiến nhất hiện nay. Hãy chia sẻ cảm nhận của bạn về tính năng mới này và cách bạn dự định ứng dụng nó vào công việc hoặc sáng tạo cá nhân nhé!