Bản dịch rút gọn từ một bài viết của biên tập viên kỳ cựu của MIT Technology Review, ông Will Douglas Heaven.
Mười ba năm trước, khi đang làm bài tập báo chí, tôi đã viết một truyện ngắn ngớ ngẩn về một người đàn ông yêu thích đồ ăn sang trọng cho mèo. Sáng nay, tôi ngồi đây xem một nền tảng AI tổng hợp có tên là Lore Machine thổi sức sống vào tác phẩm cũ của tôi.
Tôi nhập câu chuyện của mình vào hộp nhập văn bản và nhận được tin nhắn: “Chúng tôi đang xác định bối cảnh, địa điểm, nhân vật và cảm xúc. Quá trình này có thể mất tới 2 phút”. Lore Machine phân tích văn bản, trích xuất mô tả nhân vật và các cảnh được đề cập, sau đó cung cấp thông tin vào mô hình AI tạo hình ảnh.
Một bảng phân cảnh hiển thị trên màn hình. Tôi đọc hết trang này đến trang khác những cuốn truyện tranh miêu tả những nhân vật mà tôi tưởng như đã quên từ lâu, tim tôi mỗi lúc một đập thình thịch.
Sau hơn một năm phát triển, Lore Machine lần đầu tiên đã ra mắt công chúng. Với 10 đô la mỗi tháng, bạn có thể sử dụng dịch vụ để xử lý 100.000 từ (tối đa 30.000 từ một lần) và tạo 80 hình ảnh cho truyện ngắn, kịch bản, bản ghi podcast, v.v.
Ngoài ra còn có các mức giá dành cho người dùng có nhu cầu cao, bao gồm gói doanh nghiệp có giá 160 USD/tháng, có thể xử lý tới 2,24 triệu từ và tạo ra 1.792 hình ảnh. Hình minh họa có nhiều phong cách cài sẵn khác nhau, từ manga, màu nước cho đến các chương trình truyền hình thập niên 80.
Zac Ryder, người sáng lập công ty sáng tạo Modern Arts, là khách hàng trung thành của Lore Machine kể từ những ngày thử nghiệm đầu tiên. Ryder vô cùng ấn tượng khi Thobey Campion, người sáng lập dự án, lần đầu tiên trình diễn khả năng vượt trội của Máy Lore.
Ryder đã thử gửi kịch bản của một bộ phim ngắn vào hệ thống và chỉ sau một đêm, Lore Machine đã biến nó thành một cuốn tiểu thuyết truyện tranh dài 16 trang.
“Tôi nhớ Thobey đã cho mọi người xem màn hình của anh ấy và tất cả chúng tôi đều ngạc nhiên“, Ryder nói.”Không chỉ về mặt sáng tạo hình ảnh mà còn ở khả năng kể chuyện: từ mạch truyện đến cảm xúc của nhân vật, mọi thứ đều đúng ngay từ đầu.”.
Modern Arts hiện đang sử dụng Lore Machine để phát triển vũ trụ hư cấu cho manga, một tác phẩm dựa trên kịch bản do tác giả bộ truyện viết. Tình yêu, cái chết và robot nổi tiếng trên Netflix.
Engine của Lore Machine được tạo thành từ các thành phần quen thuộc: mô hình ngôn ngữ lớn (LLM) quét văn bản, xác định các mô tả về nhân vật, địa điểm và cảm xúc mà chúng truyền tải, cùng với LLM là phiên bản Stable Diffusion có khả năng tạo ra hình ảnh. Nhưng điều làm nên sự khác biệt của Lore Machine là tính dễ sử dụng của nó. Tải lên câu chuyện và tải xuống bảng phân cảnh chỉ mất vài cú click chuột.
Lore Machine là một ví dụ điển hình về làn sóng công cụ mới thân thiện với người dùng và ẩn chứa sức mạnh đáng kinh ngạc của các mô hình sáng tạo đằng sau một giao diện web đơn giản.
“Việc cập nhật các công cụ AI mới tốn rất nhiều công sức, đồng thời giao diện và quy trình làm việc của từng công cụ cũng khác nhau.“, Ben Palmer, Giám đốc điều hành của công ty sáng tạo nội dung New Computer Corporation cho biết.”Khả năng sử dụng một công cụ lớn với giao diện người dùng nhất quán là cực kỳ hấp dẫn. Tôi cảm thấy đây là nơi kết thúc của ngành [trí tuệ nhân tạo]“.
Không còn dấu hiệu nhắc nhở nữa
Lore Machine không phải là dự án đầu tiên của Campion. Vị CEO trẻ từng theo đuổi giấc mơ thành lập phiên bản Wikipedia dựa trên blockchain, nhưng ông đã thay đổi quyết định khi thấy công chúng hào hứng chào đón làn sóng trí tuệ nhân tạo. Ban đầu, Campion thử sử dụng Midjourney để biến một bài thơ kinh điển trong văn học Anh thành truyện tranh.
Mặc dù sản phẩm cuối cùng đã được lan truyền rộng rãi nhưng quá trình thực hiện nó lại không để lại ấn tượng tốt với Campion.
“Vợ tôi ghét dự án đó“, Campion nói.”Tôi đã thức đến bốn giờ sáng chỉ để cố gắng có được những bức ảnh ưng ý“. Với Midjourney, người dùng phải tạo từng hình một nên khi tạo nhiều hình đơn lẻ với nhiều gợi ý khác nhau, nét vẽ sẽ không nhất quán xuyên suốt các cảnh.
Trải nghiệm làm truyện tranh với Midjourney khiến Campion cảm thấy rằng công nghệ này cần phải thân thiện với người dùng hơn. Campion không tiết lộ bí quyết để giữ cho truyện tranh do Lore Machine tạo ra nhất quán.
Kết quả tôi nhận được khá tốt, nhưng không hoàn hảo: có cảnh một nhân vật tóc ngắn để tóc mái một cách tự nhiên, và có cảnh nhân vật này xuất hiện hai lần.
Các hình vẽ dần dần trở nên tổng quát hơn. Tôi thất vọng khi thấy một nhân vật được mô tả là “có hàm răng như hạt cúc“, một nhân vật có”Bàn tay trắng như bánh mỳ ngâm thuốc tẩy” không được thể hiện rõ ràng. Tuy nhiên, so với việc phải làm thủ công từng khung truyện thì Lore Machine thực sự là một bước tiến lớn.
“Đó là sự nhất quán đáng chú ý”, Zac Ryder nhận xét. Công ty Modern Arts của Ryder đã sử dụng Lore Machine để bán cho khách hàng. Phải công nhận rằng Ryder cũng rất đáng ngưỡng mộ khi đặt niềm tin lớn vào một hệ thống mới như Lore Machine.
“Nếu phải tự mình chỉnh sửa để hình ảnh thành phẩm được nhất quán thì chắc chắn chúng tôi sẽ không thể giao bài cho khách hàng đúng hẹn.”, Ryder nói.
Giống như tất cả các mô hình AI tổng quát khác, công nghệ đằng sau Lore Machine có thể tạo ra nội dung có hại theo yêu cầu. Campion đã ngăn chặn việc tạo ra nội dung bạo lực hoặc thù hận. Ngoài ra, anh cũng không muốn hạn chế khả năng sáng tạo của người dùng. Ví dụ: nó cho phép người dùng Lore Machine tạo các hình minh họa giống với những người nổi tiếng để đưa vào truyện tranh của họ.
Trong giai đoạn đầu, Lore Machine đã thu hút được sự chú ý của các công ty tiếp thị. Nhưng Campion hy vọng rằng việc phát hành rộng rãi nó sẽ khuyến khích cơ sở người dùng rộng rãi hơn thử nghiệm nó.
Anh cho biết, sáu tháng trước, anh nhận được cuộc gọi từ hiệu trưởng một trường học dành cho trẻ em khuyết tật học tập ở Manhattan. Hiệu trưởng muốn Lore Machine đọc sách giáo khoa và tạo ra những hình ảnh dễ học cho trẻ.
“Tôi thậm chí chưa bao giờ nghĩ đến khả năng đó. Tôi quá mắc kẹt trong suy nghĩ của Hollywood“, Campion nói.
Link nguồn: https://cafef.vn/cach-toi-dung-ai-tao-sinh-de-bien-truyen-ngan-cua-minh-thanh-truyen-tranh-188240328151240315.chn