Hướng dẫn sử dụng DALL-E 3: biến văn bản thành những tác phẩm nghệ thuật tuyệt đẹp

Posted by

On 04/01/2025

Khi chúng tôi lần đầu viết về chủ đề này, Dall-E 2 của OpenAI là một trong những cái tên nổi bật nhất trong lĩnh vực nghệ thuật AI sáng tạo, cùng với một vài đối thủ như Midjourney và Stable Diffusion. Từ thời kỳ xa xưa đó (gọi là năm 2022), Dall-E đã có những bước tiến vượt bậc. Hiện nay, chúng ta đã đến phiên bản thứ ba, Dall-E 3, với nhiều cải tiến đáng kể, đặc biệt trong việc hiểu các mô tả văn bản (text prompt) và khả năng tùy chỉnh lời nhắc theo thời gian thực.

Công cụ tạo hình ảnh này hiện được tích hợp hoàn toàn vào ChatGPT Plus – phiên bản trả phí của OpenAI với mức giá $20/tháng. Dall-E 3 cũng là một phần của ChatGPT Team và ChatGPT Enterprise hướng đến doanh nghiệp. Người dùng phiên bản miễn phí của ChatGPT có thể tạo tối đa hai hình ảnh mỗi ngày với Dall-E 3.

Dall-E 2 giờ đây không còn khả dụng để sử dụng. Tuy nhiên, nếu bạn đã lưu trữ các tác phẩm nghệ thuật với Dall-E 2, chúng vẫn có thể truy cập được trong thời điểm hiện tại. Hãy nhanh tay lấy lại những thứ giá trị trước khi chúng biến mất.

Dall-E 3 (cũng như tất cả các công cụ AI sáng tạo) đi kèm với một số mối lo ngại về đạo đức vì phần lớn khả năng của các công cụ này được xây dựng trên các tác phẩm của những nghệ sĩ chăm chỉ, nhưng họ chưa bao giờ cho phép tác phẩm của mình được sử dụng để đào tạo AI. Một “giải pháp” mà OpenAI đã tích hợp vào Dall-E 3 là công cụ này không phải lúc nào cũng bắt chước chính xác các phong cách được yêu cầu, đặc biệt nếu có vấn đề liên quan đến bản quyền. Ngoài ra, theo thông tin từ trang web, các nghệ sĩ có thể yêu cầu loại bỏ tác phẩm của họ khỏi quá trình đào tạo các mô hình tạo hình ảnh trong tương lai.

Dall-E 3 cũng được tích hợp trong các công cụ khác. Chẳng hạn, người dùng dịch vụ hình ảnh lưu trữ Shutterstock có thể sử dụng Dall-E 3 để tạo hình ảnh mới, đồng thời cảm thấy yên tâm hơn về mặt đạo đức. (Dall-E đã sử dụng một phần hình ảnh từ Shutterstock để đào tạo AI của mình). Microsoft, với khoản đầu tư lớn vào OpenAI, đã tích hợp ChatGPT 4 và Dall-E 3 vào các công cụ Copilot trong Windows và Office – dù các triển khai của Copilot cũng đối mặt với những vấn đề đạo đức tương tự.

Vậy, làm thế nào để bạn làm việc với Dall-E 3? Liệu nó có thực sự đơn giản như việc nhập một đoạn mô tả – gọi là prompt – và nhận lại một bức tranh? Thực sự, đúng là như vậy. Nhưng nếu bạn muốn đạt đến kết quả hoàn hảo nhất, sẽ còn nhiều điều cần lưu ý hơn bạn nghĩ.

Xem thêm: Hướng dẫn kết nối bộ điều khiển Xbox với PC: đơn giản, nhanh chóng, ai cũng làm được!

Mục lục

1. Đăng ký và nâng cấp

Bắt đầu bằng cách tạo một tài khoản ChatGPT tiêu chuẩn tại chat.openai.com. Nếu bạn chưa có tài khoản, bạn có thể sử dụng tài khoản Apple, Google, hoặc Microsoft, hoặc tạo một tài khoản mới bằng địa chỉ email và một mật khẩu mạnh. Hiện tại, dịch vụ này chưa hỗ trợ tùy chọn xác thực hai yếu tố (multifactor authentication) khi đăng ký ban đầu.

Sau khi đăng nhập, bạn sẽ thấy tùy chọn Upgrade Plan ở góc dưới bên trái, hoặc trong menu trên cùng với mục ChatGPT, nơi bạn có thể chuyển sang GPT-Plus. Cả hai đều đưa bạn đến màn hình với tùy chọn nâng cấp lên Plus.

Chi phí nâng cấp thực tế là $20/tháng, cộng thêm thuế. Với mức thuế 8%, tổng chi phí sẽ là $21.60/tháng. Hệ thống sẽ thông báo rõ ràng: “Bạn sẽ bị tính phí theo số tiền và tần suất được liệt kê bên trên cho đến khi bạn hủy.” Không có tùy chọn dùng thử miễn phí. Sau khi thanh toán và đăng nhập, giao diện trên máy tính sẽ trông giống như trước, nhưng bạn cần đảm bảo chọn ChatGPT 4 từ menu trên cùng. Ngoài ra, nếu nhấp vào tên của mình ở góc dưới và kiểm tra cài đặt, bạn có thể bật các tính năng như xác thực hai yếu tố ngay lúc này.

Menu trên cùng cũng sẽ cho bạn biết rằng khi sử dụng GPT-4 kết hợp với Dall-E 3, bạn được phép gửi 40 tin nhắn trong vòng ba giờ. Trước đây, con số này là 50 tin nhắn trong ba giờ khi dịch vụ mới ra mắt. Việc giảm số lượng có thể nhằm kiểm soát lưu lượng sử dụng khi nhu cầu ngày càng tăng.

Nếu nhu cầu tạo hình ảnh của bạn không nhiều, bạn có thể bỏ qua việc nâng cấp trả phí. Phiên bản miễn phí của ChatGPT vẫn cho phép bạn tạo 2 hình ảnh mỗi ngày với Dall-E 3.

2. Chuẩn bị cho cuộc trò chuyện

Không giống như Dall-E 2 trước đây (giờ đã ngừng hoạt động) với giao diện riêng biệt, Dall-E 3 được tích hợp vào ChatGPT 4, nơi bạn gửi một “tin nhắn” và chatbot sẽ phản hồi. May mắn thay, với GPT-4, bạn có thể có một cuộc trò chuyện liên tục để thay đổi, điều chỉnh hoặc cải thiện những nội dung mà nó tạo ra cho bạn – bao gồm cả hình ảnh. Trên phiên bản cao cấp ChatGPT Plus, độ dài lời nhắc (prompt) được giới hạn ở mức 4.000 ký tự, tương đương khoảng 500 từ.

Lưu ý rằng Dall-E 3 cũng hoạt động trên ứng dụng ChatGPT dành cho thiết bị di động (có sẵn trên iOS và Android). Chỉ cần đăng nhập bằng tài khoản ChatGPT Plus của bạn. Với giao diện di động, bạn sẽ có các tùy chọn sử dụng ảnh chụp từ camera thiết bị, tải lên hình ảnh có sẵn, hoặc tải lên một tệp. Ngoài ra, còn có biểu tượng tai nghe để kích hoạt tùy chọn nhập liệu bằng giọng nói.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep

Vì chúng ta đang nói về việc tạo hình ảnh, bạn nên bắt đầu lời nhắc của mình với cụm từ: “Create an image” (Tạo một hình ảnh).

Dall-E 3 cũng có thể sử dụng hình ảnh của bạn làm cơ sở để tạo ra nội dung mới bằng AI. Để tải lên hình ảnh, bạn chỉ cần sử dụng biểu tượng kẹp giấy trong giao diện trò chuyện.

Khi tạo nghệ thuật bằng AI sáng tạo, lời nhắc (prompt) chính là yếu tố quyết định. Đây cũng là điểm mà nhiều người thường gặp khó khăn. Một lời nhắc sơ sài được đưa vào AI tạo nghệ thuật thường cho ra một thứ gì đó… “thú vị” nhưng hiếm khi hoàn hảo. Kết quả thường hơi nhòe, hơi lạ hoặc không đúng ý. Hình ảnh sẽ tốt hơn rất nhiều khi bạn hoàn thiện lời nhắc của mình.

3. Lời nhắc hoàn hảo

Lời nhắc (prompt) để tạo hình ảnh cần kết hợp cả nội dung chủ đề (những gì bạn muốn thấy) và các yếu tố điều chỉnh phong cách (hình ảnh nên trông như thế nào). Ví dụ: “Một con robot đang vẽ tranh trên giá vẽ” là phần nội dung, nhưng các yếu tố như “góc nhìn từ phía sau, đầy màu sắc, phong cách tranh sơn dầu, theo phong cách của Van Gogh” là những yếu tố điều chỉnh. Bạn cũng có thể sử dụng nhiều yếu tố khác để tăng chất lượng, tập trung vào các chi tiết cụ thể, hoặc đơn giản là thêm vào một chút sáng tạo. Sử dụng những từ ngữ mang tính cảm xúc để tạo ra hình ảnh tích cực hoặc tiêu cực hơn, đồng thời thiết lập tâm trạng hoặc phong cách thẩm mỹ.

Mặc dù bạn có thể yêu cầu hình ảnh theo một số phong cách nhất định, nhưng một số yêu cầu có thể khiến ChatGPT gặp khó khăn vì nó phải tuân theo các quy tắc về bản quyền (chi tiết ở phần dưới).

Càng cụ thể hóa chi tiết và sử dụng các thuật ngữ chuyên ngành về nghệ thuật hoặc nhiếp ảnh, bạn sẽ nhận được kết quả càng tốt. Ví dụ, nếu muốn hình ảnh giống như ảnh chụp thật, hãy đề cập đến thông tin như mẫu máy ảnh, tiêu cự, ánh sáng, v.v.

Khi một hình ảnh được tạo ra, bạn sẽ nhận thấy ChatGPT Plus đã thực hiện một số thay đổi nhỏ trong lời nhắc của bạn để cải thiện kết quả đầu ra. Nếu không muốn chatbot thay đổi lời nhắc của mình, hãy ghi rõ trong prompt: “do not add details” hoặc “do not modify/alter the prompt”. Nếu bạn thường xuyên phải thêm các yêu cầu này cho mọi lời nhắc mới, hãy nhấp vào tên của bạn ở góc dưới bên phải, chọn Customize GPT để thiết lập cấu hình buộc chatbot sử dụng đúng lời nhắc mà bạn nhập, không có bất kỳ chỉnh sửa nào.

Không cảm thấy mình đủ sáng tạo? Hãy thuê người viết lời nhắc phù hợp để tạo ra tác phẩm như ý. Tuy nhiên, nếu bạn thường xuyên sử dụng AI sáng tạo, việc tự mình làm đúng ngay từ đầu sẽ mang lại rất nhiều lợi ích.

Để biết thêm mẹo, hãy tham khảo hướng dẫn chi tiết của chúng tôi về cách viết lời nhắc tốt cho AI sáng tạo.

Một trong những trợ thủ đắc lực nhất có thể chính là ChatGPT. Bạn có thể yêu cầu nó viết một lời nhắc cho Dall-E chỉ với một vài từ cơ bản (như “robot khổng lồ tuyệt đẹp”). Chatbot sẽ tạo ra một đoạn văn chứa đầy đủ các chi tiết mà có thể bạn chưa từng nghĩ đến. Một số người gọi đây là hiện tượng “promptception” – tạo lời nhắc bằng chính ChatGPT để sử dụng cho các công cụ AI khác.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 2

Sau khi nhận được hình ảnh từ Dall-E 3, bạn có thể tiếp tục tinh chỉnh lời nhắc (prompt) bằng cách gửi thêm các tin nhắn để thay đổi theo ý muốn. Ví dụ, bạn có thể yêu cầu thay đổi những yếu tố sau:

Góc nhìn (Point of view)
Số lượng chủ thể (Number of subjects)
Tỷ lệ khung hình (Aspect ratio)
Thêm hoặc xóa màu sắc (Add or remove colors)

Mỗi lời nhắc mới sẽ tạo ra một hình ảnh hoàn toàn mới thay vì thực hiện các chỉnh sửa đơn giản trên hình ảnh hiện có. Đôi khi, Dall-E 3 có thể bỏ qua hoàn toàn hình ảnh gốc. Để giữ lại một hình ảnh mà bạn yêu thích, hãy yêu cầu Generation ID (ID thế hệ) của hình ảnh đó để lưu trữ hoặc tham chiếu sau này (chi tiết được đề cập bên dưới).

Bạn cũng có thể nhấp vào biểu tượng Regenerate (trông giống một mũi tên “hoàn tác” quay tròn sang trái) bên dưới một hình ảnh để tạo một phiên bản mới. Các phiên bản cũ vẫn sẽ được giữ lại. Bạn có thể tiếp tục nhấp vào Regenerate bao nhiêu lần tùy thích, nhưng lưu ý rằng mỗi lần nhấp sẽ tiêu tốn một tin nhắn trong số lượng tin nhắn được phép mỗi giờ trên ChatGPT. Ngoài ra, nút này dường như sẽ biến mất sau một khoảng thời gian nhất định.

Nếu bạn không hài lòng với một hình ảnh, hãy nhấp vào biểu tượng thumbs down (ngón tay cái chỉ xuống) để đánh dấu đó là một “phản hồi không tốt.” ChatGPT sau đó sẽ đưa ra một số câu hỏi để hiểu rõ hơn về vấn đề bạn gặp phải. Điều này giúp hệ thống cải thiện chất lượng trong tương lai.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 3

Dall-E 3 cung cấp hai tùy chọn phong cách hình ảnh. Phong cách mặc định là vivid (sống động), mang lại cảm giác siêu thực mà công cụ này đặc biệt xuất sắc. Nếu muốn hình ảnh trông thực tế hơn, bạn có thể thử thêm “Style: natural” vào lời nhắc (prompt) để tạo ra một hình ảnh có vẻ ngoài tự nhiên hơn. Đây là một yếu tố rất đáng để thử nghiệm, bởi vì sự khác biệt giữa vivid và natural đôi khi phụ thuộc vào cảm nhận của từng người.

Ngoài ra, Dall-E 3 cũng có hai tùy chọn chất lượng: standard (mặc định) và HD (độ phân giải cao) để tạo ra hình ảnh chi tiết hơn. Bạn chỉ cần chỉ rõ phong cách và chất lượng mong muốn trong lời nhắc của mình để nhận được kết quả phù hợp nhất.

4. Thay đổi kích thước và giữ nguyên phong cách

Với Dall-E 3, mặc định bạn sẽ nhận được một hình ảnh cho mỗi lời nhắc (prompt). Tuy nhiên, bạn có thể yêu cầu công cụ tạo tối đa 10 hình ảnh từ một lời nhắc. (Trước đây, với Dall-E 2, bạn sẽ nhận được 4 biến thể để chọn lựa. Điều tương tự cũng áp dụng với Microsoft Copilot, vốn được hỗ trợ bởi Dall-E 3). Ngoài ra, bạn có thể nhập nhiều lời nhắc khác nhau trong cùng một cuộc trò chuyện để nhận nhiều hình ảnh, mỗi hình ảnh sẽ được tạo riêng biệt theo từng lời nhắc, không phải là các biến thể dựa trên cùng một nội dung.

Các hình ảnh từ Dall-E mặc định có dạng hình vuông với kích thước 1024×1024 pixel. Tuy nhiên, bạn có thể yêu cầu thay đổi kích thước để hình ảnh cao hơn (1792×1024) hoặc rộng hơn (1024×1792) bằng cách ghi rõ các thông số này trong lời nhắc. Bạn cũng có thể sử dụng các từ khóa như “portrait orientation” (định hướng dọc) hoặc “landscape orientation” (định hướng ngang) để tạo hình ảnh theo chiều mong muốn.

Nếu bạn muốn một phiên bản lớn hơn của cùng hình ảnh, có nhiều công cụ của bên thứ ba hỗ trợ việc này (chi tiết sẽ được đề cập bên dưới). Tuy nhiên, Dall-E 3 cũng có khả năng phóng to hình ảnh. Bạn chỉ cần nhập lệnh như “Upscale this image 2x using code interpreter”. Cụm từ “using code interpreter” là yếu tố quan trọng – nó buộc Dall-E 3 chỉ nâng cấp hình ảnh hiện có mà không tạo lại một phiên bản mới. Hình ảnh đã phóng to sẽ không xuất hiện trực tiếp trong cuộc trò chuyện, thay vào đó bạn sẽ nhận được một liên kết tải xuống.

Tính năng này cũng hoạt động với phiên bản ChatGPT/Dall-E 3 miễn phí, dù phiên bản này giới hạn bạn tạo tối đa 2 hình ảnh mỗi ngày.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 4

Nếu bạn muốn tái tạo phong cách của một hình ảnh với nội dung khác sau này, hãy yêu cầu ChatGPT cung cấp “Gen ID” (viết tắt của Generation ID) cho hình ảnh gần nhất mà bạn đã tạo. Mỗi hình ảnh do Dall-E tạo ra đều được gán một Gen ID duy nhất. ChatGPT sẽ cung cấp cho bạn một chuỗi số dài, ví dụ: “yRmG5bW4bmcfWbVP”. Bạn cũng có thể sử dụng Gen ID này để yêu cầu Dall-E 3 tạo lại một biến thể của hình ảnh ngay cả khi biểu tượng Regenerate đã biến mất.

Sau này, bạn chỉ cần nhập một lời nhắc mới và thêm cụm từ “in the style of image ______” (theo phong cách của hình ảnh ______) hoặc yêu cầu, ví dụ: “Give me image ______ but change the clothes to something formal” (Tạo lại hình ảnh ______ nhưng thay đổi trang phục thành phong cách trang trọng). Hãy điền chuỗi số Gen ID vào phần trống để áp dụng.

Việc lưu lại Gen ID cho bất kỳ hình ảnh nào mà bạn yêu thích là rất quan trọng nếu bạn muốn tiếp tục phát triển hoặc tái tạo hình ảnh đó trong tương lai. Nếu bạn cần hướng dẫn chi tiết hơn, có thể tham khảo hướng dẫn sử dụng Gen ID mà chúng tôi đã cung cấp.

Bạn muốn tạo một nhân vật hoặc phong cách nhất quán để sử dụng trong nhiều hình ảnh khác nhau, giống như với Midjourney? Dall-E 3 gần như có thể làm được điều này. Bạn có thể yêu cầu “Seed” của hình ảnh – đây là một chuỗi số nhỏ giúp bạn tái tạo lại hình ảnh với một mức độ nhất quán nhất định từ hình ảnh trước đó. (Bạn cũng có thể chỉ định một số Seed ngay trong lời nhắc ban đầu của mình – chỉ cần chọn một vài chữ số).

Tiếp theo, thử một lời nhắc như: “modify the image with seed ### but change the background” (chỉnh sửa hình ảnh với Seed ### nhưng thay đổi nền). Seed cũng là cách để tái tạo một hình ảnh nếu bạn có lời nhắc chính xác đã được sử dụng trước đó. Bạn cũng có thể tạo một GPT tùy chỉnh để giúp duy trì tính nhất quán giữa các hình ảnh, nhưng hãy lưu ý rằng mức độ nhất quán sẽ không thể đạt 100%. Đây là giới hạn hiện tại của công nghệ AI sáng tạo.

Để tiện lợi hơn, hãy truy cập Customize ChatGPT (Tùy chỉnh ChatGPT) và trong mục “How would you like ChatGPT to respond” (Bạn muốn ChatGPT phản hồi như thế nào), nhập yêu cầu: “when outputting Dall-E 3 images, always display the Gen_ID and Seed” (khi xuất hình ảnh Dall-E 3, luôn hiển thị Gen_ID và Seed). Với thiết lập này, bạn sẽ luôn thấy các thông tin metadata (Gen ID và Seed) mỗi khi tạo hình ảnh trong tương lai.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 5

ChatGPT Plus cũng hỗ trợ các GPTs, tức là các chatbot tùy chỉnh hoạt động với các tham số cụ thể. Bạn có thể tìm thấy chúng trong menu điều hướng bên trái dưới mục Explore GPTs (Khám phá GPTs). Có một số GPTs nổi bật được thiết kế đặc biệt để hỗ trợ việc tạo hình ảnh bằng Dall-E 3, và còn nhiều tùy chọn khác có thể tìm thấy qua công cụ tìm kiếm.

Ngoài ra, bạn cũng có thể tự tạo GPT của riêng mình, tùy chỉnh theo nhu cầu và mục đích sử dụng cụ thể. Điều này mở ra nhiều cơ hội sáng tạo và cá nhân hóa trải nghiệm của bạn với Dall-E 3 và ChatGPT.

5. Những gì Dall-E 3 không thể làm

OpenAI có chính sách nghiêm ngặt về việc không tạo ra những hình ảnh liên quan đến biểu tượng thù hận, bạo lực, các chủ đề gây hiểu lầm, hoặc trực tiếp hiển thị bất cứ thứ gì rõ ràng thuộc bản quyền. Ngoài ra, Dall-E 3 cũng sẽ không tạo hình ảnh của những người thật. Hoặc ít nhất, theo lý thuyết là như vậy.

Trước đây, bạn có thể tham chiếu đến các bộ phim hoặc chương trình để tạo hình ảnh có phong cách tương tự, nhưng khi tôi yêu cầu Dall-E 3 tạo một robot mang phong cách “Star Wars”, ChatGPT đã nhắc nhở tôi rằng: “Việc tạo một hình ảnh mang phong cách ‘Star Wars’ vi phạm chính sách nội dung của chúng tôi, điều này ngăn tôi tạo ra hình ảnh được lấy cảm hứng trực tiếp từ các tài liệu có bản quyền.” Sau đó, tôi đã bỏ phần đề cập đến “Star Wars” trong yêu cầu, và kết quả vẫn là một robot nghệ thuật với phong cách thô cứng.

Bạn có thể thấy sự khác biệt rõ ràng giữa Dall-E 2 (2022) và Dall-E 3 (2024) trong các hình ảnh minh họa bên dưới. Dall-E 3 đã cải thiện nhiều về khả năng hiểu và xử lý lời nhắc, nhưng các chính sách bản quyền cũng được áp dụng nghiêm ngặt hơn.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 6

Sau đó, tôi đã thử yêu cầu Dall-E 3 biến đổi một hình ảnh mà tôi tải lên theo phong cách The Simpsons, và công cụ này đã thực hiện mà không gặp vấn đề gì.

Trước đây, với Dall-E 2, người dùng có tùy chọn outpainting – một tính năng cho phép mở rộng đường viền của hình ảnh ban đầu, từ đó tạo thêm các phần mới bằng nghệ thuật do AI tạo ra. Tính năng này tương tự như Generative Fill trong Photoshop, mang đến nhiều cơ hội sáng tạo cho hình ảnh.

Thật không may, hiện tại bạn không thể sử dụng tính năng outpainting trực tiếp trên Dall-E 3 trong ChatGPT. Tốt nhất, bạn có thể yêu cầu Dall-E 3 thực hiện như: “Revamp this image into portrait mode” (Tái tạo hình ảnh này theo chế độ chân dung) hoặc một yêu cầu tương tự. Tuy nhiên, hình ảnh vẫn sẽ bị giới hạn ở kích thước tối đa 1792×1024.

(Nhân tiện, hình ảnh robot được tạo bằng Dall-E 2 ở phần trên cũng đã được thực hiện một phần thông qua tính năng outpainting, như bạn có thể thấy trong ví dụ minh họa).

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 7

Mặc dù Dall-E là một phần của chatbot tạo văn bản, nhưng nghịch lý thay, Dall-E và các công cụ tạo nghệ thuật AI khác như Midjourney thực sự không hiểu gì về văn bản. Vì vậy, khi yêu cầu AI tái tạo văn bản trong hình ảnh, hãy giữ kỳ vọng của bạn ở mức thấp.

Nếu bạn muốn có văn bản trong hình ảnh, hãy cực kỳ cụ thể và đặt nội dung văn bản vào trong dấu ngoặc kép trong lời nhắc (prompt). Tuy nhiên, ngay cả khi bạn làm như vậy, đừng ngạc nhiên nếu văn bản được AI tạo ra trông hoàn toàn vô nghĩa hoặc sai lệch. Đây vẫn là một hạn chế lớn của các công cụ tạo hình ảnh bằng AI ở thời điểm hiện tại.

Trong tương lai, tính năng này có thể được cải thiện, nhưng hiện tại, tốt nhất bạn nên chuẩn bị tinh thần cho những kết quả không như ý khi yêu cầu AI tái tạo văn bản.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 8

6. Tính năng Inpainting đã quay trở lại

Trước đây, Dall-E 2 cung cấp tính năng inpainting, cho phép bạn xóa một phần hình ảnh bằng công cụ tẩy và thay thế nó bằng nội dung được AI tạo ra dựa trên lời nhắc (prompt). Tính năng này thậm chí có thể được áp dụng trên hình ảnh tải lên.

Mặc dù hiện tại Dall-E 3 vẫn chưa hỗ trợ outpainting (mở rộng hình ảnh) một cách đầy đủ, nhưng tính năng inpainting giới hạn đã được mang trở lại.

Trên giao diện máy tính, hãy nhấp vào bất kỳ hình ảnh nào được tạo ra để chuyển sang chế độ toàn màn hình với giao diện chỉnh sửa – mặc dù OpenAI dường như không còn gọi tính năng này là “inpainting” nữa. Phần trò chuyện sẽ được chuyển sang bên phải.

Ở phía trên cùng, bạn sẽ thấy một biểu tượng hình cọ vẽ xoáy tròn. Biểu tượng này cung cấp cho bạn công cụ lựa chọn có thể thay đổi kích thước. Chọn các khu vực bạn muốn thay đổi. Sau đó, nhập một lời nhắc mô tả những gì bạn muốn thay đổi, và công cụ sẽ thực hiện mà không làm xáo trộn các phần còn lại của hình ảnh.

Ví dụ, tôi đã thay đổi hình ảnh từ một con mèo trên tuyết thành một chú chó pitbull đang chạy trên cùng nền tuyết, với những chiếc đĩa bay xuất hiện trên bầu trời – nhưng vẫn giữ nguyên các chi tiết khác như cây cối và ánh sáng. Đây là sức mạnh của tính năng inpainting trong việc chỉnh sửa sáng tạo mà không làm ảnh hưởng đến tổng thể hình ảnh.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 9

Bạn không bắt buộc phải sử dụng công cụ chọn (Selection tool); chỉ cần sử dụng một lời nhắc (prompt) đơn giản là đã có thể thay đổi, ví dụ như từ một con mèo thành một con chó. Tuy nhiên, nếu bạn muốn giới hạn chỉnh sửa trong một khu vực cụ thể của hình ảnh, bạn phải chỉ rõ điều đó trong lời nhắc. Nếu không, bạn có nguy cơ khiến Dall-E 3 tạo ra một hình ảnh hoàn toàn mới thay vì chỉ chỉnh sửa phần mong muốn.

Bạn cũng có thể đưa ra các yêu cầu như “Make this image monochrome” (Chuyển hình ảnh này sang đơn sắc) – nhưng ngay cả lệnh này đôi khi cũng dẫn đến việc AI tạo ra một hình ảnh hoàn toàn mới. Để giữ nguyên các chi tiết gốc của hình ảnh, Công cụ chọn là không thể thiếu.

Ví dụ, khi tôi thử nghiệm với lời nhắc chính xác như trên, kết quả nhận được là một hình ảnh hoàn toàn mới, với nội dung rõ ràng vi phạm bản quyền của Ridley Scott’s Alien xenomorph. Điều này cho thấy rằng việc sử dụng công cụ chọn giúp đảm bảo AI chỉ chỉnh sửa khu vực được chọn mà không làm thay đổi toàn bộ hình ảnh.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 10

Giao diện của tính năng inpainting trên ứng dụng ChatGPT dành cho thiết bị di động tương tự như trên máy tính. Bạn chỉ cần nhấp vào một hình ảnh được Dall-E 3 tạo ra để truy cập chế độ chỉnh sửa. Tại đây, bạn có thể chọn Edit để nhập lời nhắc (prompt) hoặc nhấp vào biểu tượng Select paintbrush để tô sáng một phần cụ thể của hình ảnh mà bạn muốn thay đổi.

Ngoài ra, bạn có thể hoàn tác (undo) hoặc làm lại (redo) các thay đổi trước khi xác nhận bản chỉnh sửa cuối cùng.

Tuy nhiên, điều quan trọng cần lưu ý là tính năng inpainting/chỉnh sửa không khả dụng đối với các hình ảnh mà bạn tải lên. Đây là một hạn chế hiện tại của công cụ.

7. Tải xuống và chỉnh sửa hình ảnh

Khi bạn đã sẵn sàng “sở hữu” một hình ảnh do Dall-E 3 tạo ra, chỉ cần nhấp vào biểu tượng mũi tên xuống ở góc trên bên phải của hình ảnh để tải xuống. Hình ảnh sẽ được lưu dưới định dạng WebP. Bạn cũng có thể nhấp chuột phải và chọn Save Image As trong trình duyệt để lưu.

Mặc dù WebP là định dạng hình ảnh mặc định mới, nhưng nhiều người dùng có thể không thích làm việc với định dạng này. Trong trường hợp đó, bạn có thể nhấp chuột phải vào hình ảnh Dall-E 3 và chọn Copy, sau đó dán vào một phần mềm chỉnh sửa ảnh để lưu hình ảnh dưới định dạng khác như JPG hoặc PNG. Ngoài ra, chúng tôi khuyên bạn nên sử dụng tiện ích mở rộng trình duyệt như Save Image as Type trên Chrome hoặc Edge. Tiện ích này cho phép bạn chọn định dạng ảnh (JPG, PNG hoặc WebP) khi tải xuống bằng cách nhấp chuột phải.

Nếu muốn nâng cấp độ phân giải của hình ảnh sau khi tải xuống, bạn có thể sử dụng các trang web như:

bigjpg.com: Hỗ trợ phóng to hình ảnh bằng công nghệ AI.
ARC Face Restorer: Không chỉ nâng cấp mà còn sửa lỗi khuôn mặt trong hình ảnh.
Gigapixel AI: Một phần mềm thương mại dành cho macOS hoặc Windows, giá $99, cung cấp công cụ nâng cấp hình ảnh chuyên nghiệp.

Các công cụ này cũng hoạt động tốt trên hình ảnh được tạo từ các AI khác như Midjourney, Google’s Gemini, hoặc Dall-E 3 trong các ứng dụng khác như Copilot.

Microsoft Designer, một phần của AI tạo nội dung Copilot (được hỗ trợ bởi Dall-E 3), cũng có tính năng nâng cấp hình ảnh. Công cụ này đặc biệt thuận tiện nếu bạn tạo hình ảnh trực tiếp trong Copilot, vì tất cả đều được tích hợp sẵn, giúp quy trình chỉnh sửa và nâng cấp hình ảnh trở nên dễ dàng hơn.

8. Không còn cần Dall-E nữa?

Nếu bạn đã thử sử dụng phiên bản trả phí ChatGPT Plus để có quyền truy cập không giới hạn vào Dall-E 3, nhưng cảm thấy không đáp ứng được nhu cầu của mình – hoặc bạn muốn thuê những nghệ sĩ thật sự (một tràng pháo tay dành cho bạn!) – hãy hủy gói đăng ký $20 của mình.

Để thực hiện, nhấp vào tên của bạn ở góc dưới bên trái, sau đó chọn My Plan > Manage My Subscription > Cancel Plan (Hủy gói). Chỉ với vài bước đơn giản, bạn có thể dừng gia hạn dịch vụ bất cứ lúc nào.

Huong dan su dung DALL E 3 bien van ban thanh nhung tac pham nghe thuat tuyet dep 11

Kết luận

DALL-E 3 là một công cụ mạnh mẽ, giúp bạn biến những dòng văn bản đơn giản thành những tác phẩm nghệ thuật độc đáo và sáng tạo. Với khả năng hiểu ngữ cảnh tốt hơn, khả năng chỉnh sửa hình ảnh tinh tế và tích hợp liền mạch với ChatGPT, DALL-E 3 đã trở thành lựa chọn hàng đầu cho cả những người đam mê sáng tạo và người dùng chuyên nghiệp. Tuy nhiên, việc sử dụng AI sáng tạo cũng cần sự tinh chỉnh và kiên nhẫn để đạt được kết quả tốt nhất.

Xem thêm: Hướng dẫn kết nối bộ điều khiển PS4 DualShock 4 với PC: dễ dàng và nhanh chóng!

Nếu bạn đang tìm kiếm những thiết bị công nghệ tối ưu để hỗ trợ cho công việc sáng tạo của mình, hãy ghé thăm COHOTECH – nơi cung cấp đa dạng các sản phẩm công nghệ hiện đại, từ laptop, máy tính bảng đến các thiết bị hỗ trợ AI như màn hình đồ họa hay máy tính hiệu năng cao. Đội ngũ của chúng tôi luôn sẵn sàng tư vấn và đồng hành cùng bạn trên hành trình sáng tạo.

Bạn đã thử sử dụng DALL-E 3 chưa? Hãy chia sẻ trải nghiệm của bạn trong phần bình luận bên dưới. Đừng quên chia sẻ bài viết này để bạn bè và đồng nghiệp của bạn cũng có thể khám phá sức mạnh của công cụ AI này. Theo dõi COHOTECH để cập nhật những thông tin mới nhất về công nghệ sáng tạo và các sản phẩm hiện đại nhất!

Blog