Đánh Giá Khả Năng AI Tái Tạo Ảnh Lịch Sử Chân Thực Với Fotor AI

Table of Contents

Trong kỷ nguyên công nghệ hiện đại, trí tuệ nhân tạo (AI) đã đạt được những bước tiến vượt bậc, đặc biệt trong lĩnh vực tạo ảnh từ văn bản (text-to-image). Các mô hình AI tân tiến như Midjourney hay DALL-E đã cho thấy khả năng kiến tạo những hình ảnh ấn tượng, đôi khi khó phân biệt với ảnh chụp thực tế. Tuy nhiên, liệu AI có thể thực sự tái tạo lại vẻ đẹp, tinh thần và cảm xúc của những bức ảnh biểu tượng, mang tính lịch sử đã định hình thế kỷ 20?

Thử nghiệm này được thực hiện nhằm kiểm chứng giới hạn của AI trong việc tái tạo ảnh chụp thực tế, đặc biệt là các tác phẩm nhiếp ảnh kinh điển. Mục tiêu là tìm hiểu xem liệu một mô hình AI có thể nắm bắt được không chỉ hình ảnh bề mặt mà còn cả chiều sâu văn hóa và cảm xúc mà một bức ảnh lịch sử truyền tải. Dù công nghệ AI đang phát triển mạnh mẽ, nhiếp ảnh truyền thống vẫn giữ vị thế độc tôn trong việc ghi lại hiện thực và cảm xúc chân thật. Những bức ảnh lịch sử không chỉ là kiệt tác nghệ thuật mà còn là những “viên nang thời gian”, lưu giữ ký ức và bối cảnh của một thời đại. Liệu một hình ảnh được AI tạo ra có thể mang lại giá trị văn hóa tương tự?

Công cụ được lựa chọn cho thử nghiệm này là Fotor AI, một trình tạo ảnh từ văn bản tương đối đơn giản nhưng mang lại kết quả khá ổn định. Mặc dù Fotor AI nổi bật với nhiều phong cách nghệ thuật khác nhau, khả năng “nhiếp ảnh” của nó đôi khi còn yếu kém. Điều này càng trở nên rõ rệt khi cố gắng điều chỉnh mô hình để tái tạo chính xác bối cảnh và phong cách của một thời kỳ cụ thể trong lịch sử nhiếp ảnh.

I. AI Xử Lý Chủ Thể Con Người Trong Ảnh Lịch Sử Như Thế Nào?

Thử nghiệm đầu tiên tập trung vào khả năng của AI trong việc xử lý các chủ thể con người, đặc biệt là trong những bức ảnh biểu cảm và giàu cảm xúc.

1. “Người Mẹ Di Cư” của Dorothea Lange: Thử Thách Cảm Xúc

Bức ảnh “Migrant Mother” (Người Mẹ Di Cư) của Dorothea Lange là một trong những tác phẩm nhiếp ảnh kinh điển mọi thời đại. Ban đầu, tôi cho rằng Fotor AI sẽ “nhận diện” được bức ảnh này, nhưng thực tế mô hình này không giỏi về tên riêng. Do đó, tôi phải mô tả chi tiết hình ảnh cho đến khi AI nắm bắt được ý tưởng.

Một bức ảnh mang tính biểu tượng của Dorothea Lange mô tả một người mẹ ôm con mình trong thời kỳ Đại Suy Thoái.

Kết quả mà Fotor AI tạo ra khá ổn định. Tuy nhiên, khi kiểm tra kỹ hơn, vấn đề lớn nhất nằm ở ánh sáng. Trong bức ảnh gốc, chủ thể được chiếu sáng bằng ánh sáng tự nhiên, trong khi AI lại tạo ra ánh sáng theo kiểu studio hiện đại cho “người mẹ” của chúng ta. Bức ảnh do AI tạo ra cũng trông quá “mượt mà” so với phong cách ảnh cũ, dù điều này có thể được khắc phục bằng cách thêm một chút nhiễu và grain.

Hình ảnh do AI tạo ra mô tả một người mẹ trong thời kỳ Đại Suy Thoái ôm hai đứa con.

Về bố cục, đây là một thất bại nhỏ. Dorothea Lange đã cẩn thận sắp xếp bố cục để kể câu chuyện về một người bị ảnh hưởng bởi cuộc Đại Suy Thoái, với từng chi tiết từ góc chụp đến ánh sáng đều góp phần vào thông điệp. Mặt khác, AI vẫn gặp khó khăn với ý nghĩa ngầm, do đó không có điều nào trong số đó được dịch sang kết quả cuối cùng.

Fotor cũng cung cấp tùy chọn sử dụng chế độ image-to-image (tạo ảnh từ ảnh), và điều này mang lại kết quả gần hơn (ít nhất là về bố cục):

Hình ảnh do AI tạo ra mô tả một người mẹ trong thời kỳ Đại Suy Thoái ôm hai đứa con.

Mặc dù những bức ảnh này khó phân biệt, tôi vẫn chưa hài lòng với kết quả vì Fotor dường như chỉ áp dụng một bộ lọc làm đẹp chất lượng thấp lên chủ thể.

2. “Nixon Ở Trung Quốc” của Oliver F. Atkins: Phức Tạp Bối Cảnh

Để tăng độ phức tạp của thử thách, chúng ta cùng đến những năm 70 với bức ảnh “Nixon in China” của Oliver F. Atkins.

Bức ảnh mô tả cựu Tổng thống Richard Nixon đang dùng bữa tối với các quan chức Trung Quốc.

Dưới đây là phiên bản của Fotor AI. Điều đầu tiên dễ nhận thấy là Fotor dường như không biết Richard Nixon là ai (có lẽ mô hình sẽ “phát nổ” nếu tôi sử dụng prompt “Watergate”).

Hình ảnh do AI tạo ra mô tả một người đàn ông dùng đũa tại bàn ăn, xung quanh là các quan chức Trung Quốc.

Ý chính của bức ảnh có ở đó (bao gồm cả sự ngạc nhiên với một miếng thức ăn trong đũa), nhưng bố cục và bối cảnh quá khác biệt. Có lẽ tôi sẽ không thể nhận ra hình ảnh do AI tạo ra được dựa trên bức ảnh gốc nếu tôi chưa từng thấy bản gốc.

Chế độ image-to-image cho ra bố cục tương tự nhưng chất lượng tổng thể lại giảm đi đáng kể. Các khuôn mặt bị biến dạng, đây là một trong nhiều dấu hiệu nhận biết ảnh được tạo bởi AI kém chất lượng.

Hình ảnh do AI tạo ra mô tả cựu Tổng thống Richard Nixon đang ăn tại nhà hàng, xung quanh là các quan chức Trung Quốc.

II. AI Tái Tạo Vật Thể Vô Tri và Cảnh Quan Phức Tạp: Giới Hạn Hiện Tại

Tiếp theo, chúng ta sẽ xem xét khả năng của AI trong việc xử lý các vật thể vô tri và các cảnh quan phức tạp, không có yếu tố con người.

1. “Thảm Họa Hindenburg” của Sam Shere: Sự Kiện Lịch Sử

Bức kiệt tác “The Hindenburg Disaster” của Sam Shere là một bức ảnh phức tạp, chỉ có một lần trong đời, đây sẽ là một thử thách tốt cho AI.

Bức ảnh ghi lại khoảnh khắc khinh khí cầu Hindenburg gặp nạn.

Fotor ít nhiều đã hiểu được yêu cầu của tôi.

Hình ảnh do AI tạo ra mô tả cảnh khinh khí cầu Hindenburg gặp nạn.

Tôi dùng từ “ít nhiều” vì khinh khí cầu vẫn còn nguyên vẹn mặc dù nó đang bốc cháy. Nó cũng quá gần mặt đất, và không thể tái tạo được bố cục của bức ảnh gốc.

Khi sử dụng ảnh gốc làm đầu vào (input), gần như không thể phân biệt được hai hình ảnh này:

Sự tái tạo thảm họa Hindenburg do AI tạo ra.

2. Khinh Khí Cầu Xương Rồng của Leon Gimpel: Phong Cách Độc Đáo

Thử nghiệm với một cảnh không dễ nhận biết ngay lập tức, bức ảnh “Cactus Hot Air Balloon” của Leon Gimpel là lựa chọn hoàn hảo.

Bức ảnh mô tả hai quả khinh khí cầu ở Paris.

Đây cũng là một trong những ví dụ hiếm hoi về việc sử dụng nhiếp ảnh màu đầu những năm 1900, vì vậy sẽ rất thú vị để xem liệu AI có thể tái tạo lại vẻ ngoài độc đáo này không. Kết quả: không thể.

Hình ảnh do AI tạo ra mô tả hai quả khinh khí cầu trong một không gian kín ở Paris.

Bối cảnh (Grand Palais, Paris) thì đúng, nhưng bố cục và chủ thể hầu như không giống bản gốc. Màu sắc cũng không đúng với thời kỳ. Sử dụng ảnh gốc làm prompt mang lại kết quả tốt hơn nhiều:

Hình ảnh do AI tạo ra mô tả hai quả khinh khí cầu trong một không gian kín ở Paris.

Tuy nhiên, có một vấn đề nhỏ. Có vẻ như Fotor chỉ đơn giản tái tạo lại hình ảnh gốc theo phong cách màu nước/pastel, mặc dù đã sử dụng “negative prompts” để ngăn mô hình làm như vậy. Do đó, bạn không nên mong đợi nhiều về sự cải thiện chất lượng ở đây.

III. AI Với Phong Cảnh và Cảnh Đô Thị: Thử Thách Về Ánh Sáng và Chi Tiết

Phần cuối của thử nghiệm sẽ đánh giá cách AI xử lý các cảnh quan rộng lớn và phức tạp của đô thị.

1. “Bình Minh, Hernandez, New Mexico” của Ansel Adams: Nắm Bắt Tương Phản

Với việc sử dụng các bộ lọc đen trắng màu cam và vàng để tạo ra độ tương phản, cùng với kỹ thuật phòng tối điêu luyện, phong cách của Ansel Adams dễ dàng nhận biết và rất khó tái tạo.

Bức ảnh mô tả mặt trăng phía trên một thị trấn sa mạc tối tăm.

Tất nhiên, tôi quyết định thử thách Fotor AI. Mặc dù cảnh không giống bản gốc một chút nào, nhưng độ tương phản gợi ý phong cách của Ansel Adams.

Hình ảnh do AI tạo ra mô tả một cảnh tối tăm với mặt trăng trên một thị trấn sa mạc.

Chế độ image-to-image tốt hơn nhiều về tổng thể nhưng hình ảnh đã mất tất cả các chi tiết tinh xảo.

Hình ảnh do AI tạo ra mô tả một phong cảnh tối tăm với mặt trăng chiếu sáng một thị trấn sa mạc.

2. “Nụ Hôn Chia Tay Chiến Tranh” của Victor Jorgensen: Khoảnh Khắc Tự Nhiên

Tôi là một người hâm mộ lớn của nhiếp ảnh đường phố, nhưng không may, hầu hết các bức ảnh đường phố biểu tượng vẫn chưa thuộc phạm vi công cộng. Do đó, bức ảnh biểu tượng “Kissing the War Goodbye” của Victor Jorgensen sẽ là một lựa chọn phù hợp.

Hình ảnh mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.

Đúng như mong đợi từ Fotor ở thời điểm này, kết quả cuối cùng khá ổn. Tuy nhiên, có hai vấn đề.

Hình ảnh do AI tạo ra mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.

Thứ nhất, nó giống một bức ảnh khác của cảnh này do Alfred Eisenstadt chụp, và thứ hai, giờ đây nó trông hoàn toàn bị dàn dựng (trong khi bản gốc thì không).

Về mặt kỹ thuật, ánh sáng giống ánh sáng studio hiện đại và bức ảnh quá tương phản so với sở thích của tôi. Hãy thử sử dụng hình ảnh gốc làm prompt:

Hình ảnh do AI tạo ra mô tả một thủy thủ hôn một y tá ở Quảng trường Thời Đại.

Kết quả này khá lẫn lộn. Mặc dù tôi thích vẻ ngoài của các chủ thể chính, nhưng khuôn mặt của những người ở hậu cảnh giờ đây trông giống như trong một bộ phim kinh dị – một điều không hề mong muốn.

Kết Luận: Giới Hạn Của AI Trong Việc Tái Tạo Ảnh Chân Thực

Qua loạt thử nghiệm chuyên sâu với Fotor AI trong việc tái tạo các bức ảnh lịch sử và biểu tượng, có thể thấy rằng mặc dù AI đã đạt được những tiến bộ đáng kể, khả năng tái tạo ảnh chân thực của nó vẫn còn nhiều hạn chế và chưa thực sự nhất quán. Fotor AI đôi khi nắm bắt được ý tưởng tổng thể, nhưng lại gặp khó khăn trong việc sao chép chính xác các chi tiết tinh tế, ánh sáng tự nhiên, bố cục phức tạp, và đặc biệt là chiều sâu cảm xúc hay ý nghĩa ngầm mà một bức ảnh gốc truyền tải.

Các vấn đề thường gặp bao gồm: ánh sáng không chân thực, thiếu chi tiết hoặc làm biến dạng khuôn mặt khi chuyển từ văn bản sang hình ảnh phức tạp, và xu hướng “làm đẹp” hoặc thay đổi phong cách ảnh gốc (ví dụ như thành màu nước) thay vì tái tạo lại sự chân thực. Trong nhiều trường hợp, kết quả hình ảnh do AI tạo ra trông bị dàn dựng hoặc thiếu đi sự tự nhiên, ngẫu hứng vốn có của nhiếp ảnh đời thực.

So với các mô hình AI tạo ảnh hàng đầu khác như Midjourney hay DALL-E, Fotor AI cho thấy rõ sự thiếu nhất quán và chưa đạt đến mức độ chân thực cần thiết cho việc tái tạo nhiếp ảnh cao cấp. Midjourney và DALL-E vẫn vượt trội hơn hẳn khi nói đến việc tạo ra các hình ảnh trông như thật từ prompt văn bản.

Tóm lại, dù AI là một công cụ mạnh mẽ và đầy tiềm năng cho các nhà sáng tạo, nhưng nó vẫn chưa thể thay thế hoàn toàn giá trị của nhiếp ảnh truyền thống trong việc ghi lại hiện thực, cảm xúc và bối cảnh lịch sử một cách chân thực và đầy đủ. Những bức ảnh được chụp bởi con người không chỉ là hình ảnh, mà còn là những câu chuyện, những khoảnh khắc được lưu giữ với chiều sâu cảm xúc và ý nghĩa văn hóa không thể tái tạo bằng thuật toán.

Bạn đã từng thử sử dụng AI để tạo ảnh chưa? Hãy chia sẻ trải nghiệm và suy nghĩ của bạn về khả năng của AI trong nhiếp ảnh ở phần bình luận bên dưới nhé!