DALL-E, công cụ AI tạo sinh hình ảnh của OpenAI, đã có những bước tiến vượt bậc kể từ khi ra mắt, đưa khả năng biến văn bản thành hình ảnh lên một tầm cao mới. Tuy nhiên, dù ấn tượng đến đâu, DALL-E vẫn còn xa mới đạt đến sự hoàn hảo. Đối với một chuyên gia SEO và biên tập viên công nghệ tại thuthuatmeohay.com, chúng tôi hiểu rằng việc nắm rõ cả ưu điểm lẫn các nhược điểm của DALL-E là tối quan trọng để tận dụng tối đa công cụ này hoặc lựa chọn giải pháp thay thế phù hợp. Bài viết này sẽ đi sâu vào 9 vấn đề lớn mà DALL-E vẫn đang gặp phải, đặc biệt là khi bạn sử dụng nó một cách thường xuyên. Những hạn chế này bao gồm từ tính không nhất quán trong phong cách hình ảnh cho đến việc xử lý kích thước vật thể không chính xác, ảnh hưởng trực tiếp đến chất lượng và tính ứng dụng của các tác phẩm do DALL-E tạo ra.
1. DALL-E Khó Xử Lý Văn Bản Trong Ảnh
Mặc dù trí tuệ nhân tạo đã có nhiều tiến bộ, việc tạo ra văn bản rõ ràng và chính xác trong hình ảnh vẫn là một thách thức lớn đối với hầu hết các trình tạo ảnh AI. Trong số đó, DALL-E thường được đánh giá là một trong những công cụ kém hiệu quả nhất về mặt này. Dù bạn đưa ra các prompt rất rõ ràng, DALL-E vẫn gặp khó khăn. Ví dụ điển hình là khi cố gắng viết các ký tự đặc biệt như dấu huyền trong chữ “Café”, phần mềm thường bỏ sót hoặc hiển thị sai.
DALL-E tạo ảnh quán cà phê với chữ "Café" bị lỗi dấu, minh họa hạn chế của AI với văn bản
Qua nhiều thử nghiệm, DALL-E còn thường xuyên mắc lỗi chính tả, thậm chí là làm biến dạng văn bản dù đã được hướng dẫn chi tiết và thử lại nhiều lần. Bạn cũng sẽ nhận thấy rằng DALL-E không thể tạo ra văn bản dễ đọc cho các đối tượng như biển báo đường phố hay các vật thể tương tự.
2. Vấn Đề Về Kích Thước: DALL-E Không Thay Đổi Kích Thước Ảnh Khi Yêu Cầu
DALL-E khá tốt trong việc hiểu yêu cầu tạo một hình ảnh, nhưng lại kém trong việc thay đổi kích thước của chúng khi được chỉ định. Ví dụ, khi chúng tôi yêu cầu DALL-E thay đổi kích thước ảnh cho các mục đích cụ thể như blog, phần mềm thường có xu hướng tạo lại một bức ảnh mới thay vì điều chỉnh kích thước bức ảnh hiện có.
Mặc dù việc cắt và thay đổi kích thước ảnh có thể dễ dàng thực hiện bằng các công cụ miễn phí như Canva, nhưng sẽ tiện lợi hơn nhiều nếu DALL-E có thể xử lý trực tiếp mà không cần phụ thuộc vào phần mềm bên thứ ba. Đây là một hạn chế đáng kể, đặc biệt khi người dùng cần tạo ra hàng loạt hình ảnh với kích thước tùy chỉnh.
3. Hạn Chế Về Tính Chân Thực Của Hình Ảnh (Photorealistic)
DALL-E không gặp quá nhiều vấn đề với độ sâu trường ảnh, nhưng khả năng tạo ra hình ảnh chân thực (photorealistic) của nó còn khá tệ. Lấy ví dụ, khi yêu cầu AI tạo ra hình ảnh một chú chó Golden Retriever trên núi mà không chỉ định phong cách, kết quả thu được khá tốt nhưng vẫn lộ rõ dấu hiệu của ảnh AI tạo ra.
Ảnh chó Golden Retriever trong núi do DALL-E tạo trông không chân thực, minh họa hạn chế photorealistic
Thậm chí, khi chúng tôi yêu cầu DALL-E làm cho hình ảnh đó trở nên “photorealistic” hơn, kết quả lại càng trông giả tạo và đôi khi có phần đáng sợ.
Thử tạo ảnh chó Golden Retriever chân thực hơn bằng DALL-E nhưng kết quả tệ hơn và trông giả
Mặc dù việc sử dụng Photorealistic Custom GPT (yêu cầu gói trả phí) có thể cải thiện tình hình, nhưng đối với người dùng thông thường, đây vẫn là một điểm yếu. Thay vào đó, một số trình tạo ảnh AI khác như Adobe Firefly thường được khuyến nghị cho khả năng tạo ảnh chân thực vượt trội.
4. DALL-E “Phớt Lờ” Yêu Cầu Phủ Định
Một trong những mẹo để viết prompt hiệu quả hơn trong các công cụ AI như Midjourney hay ChatGPT là chỉ rõ những gì bạn không muốn phần mềm làm. Điều này thường mang lại kết quả tốt hơn. Tuy nhiên, DALL-E lại là một ngoại lệ.
Trong nhiều trường hợp, dù đã yêu cầu DALL-E không đưa một số yếu tố nhất định vào hình ảnh, công cụ này vẫn thêm chúng vào. Đôi khi, việc tạo lại hình ảnh có thể khắc phục được vấn đề, nhưng sẽ tốt hơn nếu không cần phải thực hiện bước này. Ngược lại, chúng tôi hiếm khi gặp phải vấn đề này khi sử dụng Adobe Firefly.
5. Thiếu Nhất Quán Trong Một Số Lĩnh Vực Cụ Thể
Nhiều trình tạo ảnh AI có những điểm yếu riêng. DALL-E cũng mắc lỗi về tính không nhất quán trong nhiều lĩnh vực khác nhau. Mặc dù DALL-E rất giỏi trong việc tạo ra các hình ảnh tổng quát, nhưng nó lại không luôn tốt trong việc tạo hình ảnh người đang cầm vật thể. Điều kỳ lạ là phần mềm này cũng kém hiệu quả trong việc tạo màn hình máy tính, thường cho ra một cụm hình dạng ngẫu nhiên. Yêu cầu phần mềm tắt màn hình máy tính đôi khi (nhưng không phải luôn luôn) có thể giúp ích.
6. Phong Cách Hình Ảnh Không Đồng Nhất
DALL-E có khả năng tạo ra nhiều loại hình ảnh khác nhau, từ nghệ thuật trông như tranh vẽ đến hình ảnh 3D. Tuy nhiên, sự đa dạng này đôi khi dẫn đến sự không nhất quán về phong cách hình ảnh.
Khi yêu cầu DALL-E tạo một hình ảnh, bạn cần phải thật cụ thể về những gì mình muốn. Nếu không, bạn có thể nhận được bất kỳ loại kết quả nào. Điều này không phải là vấn đề nếu bạn chỉ đang thử nghiệm ứng dụng, nhưng lại trở thành trở ngại lớn nếu bạn muốn duy trì một phong cách nhất quán cho toàn bộ dự án của mình.
7. Kích Thước Vật Thể (Artifact Sizing) Bị Lệch
Việc đảm bảo các vật thể trong hình ảnh có tỷ lệ cân đối như trong đời thực là rất quan trọng để có những bức ảnh chính xác. Thật không may, DALL-E đôi khi không thể làm cho các vật thể trông đúng tỷ lệ. Ví dụ, nếu bạn yêu cầu phần mềm tạo hình ảnh một người đang cầm điện thoại trên tay, chiếc điện thoại đôi khi sẽ có kích thước quá lớn.
Người cầm điện thoại do DALL-E tạo với kích thước điện thoại không cân đối, minh họa lỗi Artifact Sizing
Ban đầu, chúng tôi nghĩ rằng việc yêu cầu phần mềm tạo hình ảnh với góc nhìn rộng hơn sẽ giải quyết được vấn đề. Tuy nhiên, điều này thực tế lại làm mọi thứ tệ hơn, và người trong ảnh cuối cùng trông còn giả tạo hơn. Mặc dù thử các prompt chỉnh sửa DALL-E khác nhau có thể hiệu quả với bạn, nhưng chúng tôi vẫn chưa tìm ra giải pháp cho vấn đề này.
8. DALL-E Khó Khăn Khi Tạo Vật Liệu Bên Ngoài (External Materials)
Ban đầu, chúng tôi nghĩ rằng DALL-E sẽ là một công cụ tuyệt vời để tạo lịch cá nhân, thiệp sinh nhật, hình nền điện thoại và nhiều thứ khác. Tuy nhiên, chúng tôi nhanh chóng nhận ra rằng phần mềm này không thực sự hiệu quả trong lĩnh vực này.
Ví dụ, khi cố gắng tạo bìa thiệp sinh nhật bằng DALL-E với ý định sau đó tải lên một dịch vụ in ấn, chúng tôi liên tục nhận được một thiết kế bao gồm một chiếc thiệp sinh nhật nằm bên trong bức ảnh đã tạo.
Lỗi DALL-E 3 khi tạo thiệp sinh nhật: thiệp xuất hiện trong ảnh, minh họa khó khăn với vật liệu bên ngoài
Nếu bạn thực sự muốn sử dụng DALL-E cho các loại thiết kế này, chúng tôi khuyên bạn không nên chỉ định mục đích “thiệp sinh nhật”. Thay vào đó, hãy chỉ rõ những gì bạn muốn chương trình tạo ra (ví dụ: “một bó hoa”, “một chiếc bánh kem”). Sau đó, bạn có thể điều chỉnh kích thước và thêm văn bản trong một ứng dụng khác.
9. Chất Lượng Ảnh Kém Khi Yêu Cầu Nhiều Tùy Chọn
Đôi khi, người dùng không biết chính xác thiết kế AI nào mình muốn sử dụng. Trong những trường hợp này, việc yêu cầu các trình tạo ảnh tạo ra nhiều biến thể hình ảnh có vẻ hợp lý. Tuy nhiên, từ kinh nghiệm cá nhân, DALL-E thường khá “lười biếng” khi cung cấp nhiều tùy chọn.
Trong nhiều trường hợp, các bức ảnh nhận được thường rất giống nhau, khiến bạn phải rất cụ thể trong yêu cầu của mình. Chúng tôi cũng nhận thấy rằng việc tạo từng hình ảnh một có hiệu quả hơn so với việc yêu cầu nhiều biến thể cùng lúc.
Kết luận
DALL-E là một công cụ AI tạo sinh hình ảnh mạnh mẽ với tiềm năng to lớn, nhưng rõ ràng nó vẫn chưa hoàn hảo. Những nhược điểm được đề cập ở trên, từ khả năng xử lý văn bản kém, không thể thay đổi kích thước ảnh theo yêu cầu, đến việc tạo ra hình ảnh không chân thực hoặc thiếu nhất quán, đều là những thách thức mà người dùng có thể gặp phải. Việc DALL-E “phớt lờ” yêu cầu phủ định và gặp khó khăn khi tạo vật liệu bên ngoài cũng là những điểm cần cải thiện.
Tuy nhiên, với vai trò là chuyên gia công nghệ tại thuthuatmeohay.com, chúng tôi vẫn khuyến nghị bạn nên tự mình trải nghiệm DALL-E. Việc hiểu rõ những hạn chế này sẽ giúp bạn điều chỉnh kỳ vọng, tối ưu hóa các prompt, và thậm chí là kết hợp DALL-E với các công cụ khác để đạt được kết quả tốt nhất. Hãy khám phá và chia sẻ trải nghiệm của bạn với DALL-E trong phần bình luận bên dưới, để cộng đồng người dùng công nghệ của thuthuatmeohay.com có thể cùng nhau học hỏi và phát triển.