Tuần trước, OpenAI đã giới thiệu một mô hình AI mới mang tên Sora, khiến cộng đồng công nghệ bất ngờ. Mô hình này cho phép người dùng tạo các video ngắn chỉ từ vài dòng mô tả văn bản, mở ra khả năng sáng tạo nội dung video mà không cần đến thiết bị chuyên nghiệp hay kỹ năng chỉnh sửa hay nền tảng phức tạp. .
Theo đó, công nghệ cốt lõi của Sora đến từ sự kết hợp giữa kiến trúc khuếch tán và biến áp. Kiến trúc khuếch tán, được chứng minh bằng thành công của DALL-E 3 trong việc tạo hình ảnh từ văn bản, hiện được áp dụng cho video, cho phép Sora tạo ra các chuỗi hình ảnh động và chi tiết từ đầu vào ngẫu nhiên.
Phương pháp này giúp dự đoán và chuyển đổi đầu vào thành nội dung trực quan rõ ràng và có cấu trúc. Trong khi đó, kiến trúc máy biến áp với khả năng xử lý dữ liệu tuần tự hiệu quả cũng được tích hợp để xử lý và tạo ra nội dung phù hợp với lời nhắc, dựa trên sự hiểu biết sâu sắc về ngôn ngữ và cú pháp. bối cảnh
Video tổng hợp được Sora tạo từ lệnh văn bản, có độ trung thực tốt đến mức khó có thể nhận ra.
Chất lượng của các video do Sora tạo ra là điểm đáng chú ý nhất, có độ sống động và chân thực cao, ngay cả trong bối cảnh phức tạp. Mặc dù vẫn còn một vài lỗi nhỏ (chẳng hạn như hành động, cử chỉ hơi thiếu thực tế của nhân vật chính trong video) nhưng những lỗi này rất khó nhận ra nếu không quan sát kỹ. Điều này nêu bật tiềm năng của Sora trong việc tạo nội dung video chất lượng cao.
Khả năng tùy biến mạnh mẽ của Sora, thay đổi phong cách và bối cảnh chỉ bằng vài lệnh
Không chỉ giới thiệu khả năng chuyển đổi từ văn bản sang video, Sora còn gây ấn tượng với khả năng tùy biến mạnh mẽ. Công cụ này cho phép người dùng thực hiện các điều chỉnh hình ảnh sâu rộng, từ thay đổi khung cảnh cho đến biến đổi hoàn toàn nhân vật và môi trường xung quanh, mang đến sức mạnh sáng tạo ấn tượng.
Một ví dụ điển hình về sức mạnh tùy biến của Sora AI được minh họa qua loạt video được đăng tải lên mạng xã hội Twitter (hoặc X) của Min Choi – một chuyên gia AI từng có cơ hội trải nghiệm công cụ sớm. của OpenAI, Choi đã chia sẻ cách Sora AI không chỉ tạo video từ mô tả văn bản mà còn có khả năng biến đổi toàn bộ phong cách và môi trường của video.
Ví dụ: video gốc do Sora tạo cho thấy một chiếc siêu xe màu đỏ lướt xuống đường, với những hàng cây dài rợp bóng hai bên đường. Tuy nhiên, trong một video sau đó, khung cảnh xung quanh đã thay đổi.
Đoạn video gốc ghi lại cảnh một chiếc ô tô đang di chuyển trên con đường xuyên rừng. Nguồn: Choi Min/Twitter
Trong một video, chiếc ô tô dường như đang lướt qua một cảnh dưới nước, trong khi ở một video khác, nó biến thành một chiếc ô tô cổ được lồng ghép vào khung cảnh những năm 1920, chỉ sử dụng lệnh “Thay đổi cảnh”. Khung cảnh những năm 1920 với một chiếc ô tô cũ và chắc chắn rằng nó vẫn còn màu đỏ”. Trong một tùy chỉnh khác, chiếc siêu xe được thay thế bằng xe ngựa, được đặt trong môi trường thời trung cổ, tạo nên một khung cảnh và cảm giác hoàn toàn mới.
Chỉ với một lệnh, video trên có thể chuyển thành một video hoàn toàn khác, khi chiếc ô tô hiện đại đã biến thành ô tô cổ điển, với khung cảnh xung quanh là thành phố năm 1920. Nguồn: Choi Min/Twitter
Khi mệnh lệnh tiếp tục thay đổi, khung cảnh và đối tượng chính trong video gốc chuyển sang cảnh xe ngựa kéo thời trung cổ. Nguồn: Choi Min/Twitter
Hiện tại, chỉ một nhóm nhỏ chuyên gia được OpenAI cho phép truy cập vào công cụ này để đánh giá và kiểm tra tính sáng tạo cũng như xác định các rủi ro tiềm ẩn. Các video demo được nhóm này chia sẻ cho thấy chất lượng thậm chí còn cao hơn những gì được trình bày trong thông báo ra mắt của OpenAI, từ video một con khỉ chơi cờ với độ chi tiết ấn tượng cho đến những sợi lông, đến cảnh một người đi xe đạp xuống dốc và thậm chí là cảnh hai giọt nước nhảy múa với nhau.
Nhìn chung, các ví dụ được đăng ở trên không chỉ thể hiện khả năng sản xuất video của Sora mà còn mở ra câu hỏi về tương lai của sự khác biệt giữa nội dung thực tế và nội dung do AI tạo ra. Câu hỏi đặt ra là liệu một ngày nào đó chúng ta không thể phân biệt được đâu là hình ảnh thật và các tác phẩm do AI tạo ra, dẫn đến một thế giới giống như Ma trận mà người dùng không còn biết nữa. hãy thực tế.
Tổng hợp
Link nguồn: https://cafef.vn/sora-ai-tao-video-tu-van-ban-do-cha-de-chatgpt-phat-trien-co-kha-nang-tuy-bien-boi-canh-ao-den-muc-nao-188240221131427207.chn