Nhà văn trước cơn lốc “sách AI”

9

Bằng cách nào mà những quyển sách hoàn toàn “vô tri”, trông còn tệ hơn máy và phần mềm dịch tự động viết ra, lại có lúc lọt vào danh sách bán chạy nhất trên Amazon?

Những tựa sách do AI viết, với tên tác giả rất Việt Nam, trong danh sách "đọc nhiều" trên Kindle Unlimited. Ảnh chụp màn hình trước khi sách bị Amazon gỡ.
Những tựa sách do AI viết, với tên tác giả rất Việt Nam, trong danh sách “đọc nhiều” trên Kindle Unlimited. Ảnh chụp màn hình trước khi sách bị Amazon gỡ.

Cuối tháng 6, diễn đàn r/VietNam trên Reddit bỗng xuất hiện một đề tài thảo luận nghe hết sức phấn khởi “Tác giả người Việt thống trị bảng xếp hạng sách bán chạy trên Amazon”. 

Niềm vui ngắn chẳng tày gang đã bị dập tắt bởi những comment nhìn sâu hơn vào vấn đề như “Tôi phải Google tựa sách Department of Vinh Du Stands in Front of His Parents’ Tombstone (tạm dịch: Bộ Vinh Du đứng trước mộ cha mẹ mình) vì nghe hết sức vớ vẩn” hay “Toàn là sách tạo ra bằng AI để lừa người”.

Quả vậy, toàn bộ chỗ sách đó là do AI viết, và chúng đã thật sự “thống trị bảng xếp hạng sách bán chạy” trên Kindle Unlimited – dịch vụ đọc sách không giới hạn của Amazon. Rốt cuộc thì ai đứng sau những tựa sách kỳ khôi này, và liệu chúng có nguy hiểm hay không?

AI xâm chiếm Amazon

“Lũ bot AI đã xâm chiếm Amazon. Nhìn vào bảng xếp hạng top 100 sách bán chạy trong mảng Sách truyện tình cảm tuổi teen đương đại mà xem. Tôi chỉ thấy được 19 cuốn sách là thật, số còn lại rõ ràng là hổ lốn do AI viết ra để cày view ảo” – cây viết tiểu thuyết độc lập Caitlyn Lynch chia sẻ trên Twitter hôm 26-6.

Đi kèm post của Lynch là ảnh chụp màn hình của một cuốn sách mang tên Wait you love me (Tạm dịch: “Đợi đã, anh yêu em”, nhưng thiếu dẩu phẩy) nằm trong top 100 sách bán chạy tại thời điểm cô tweet. 

Sách có bìa là ảnh đen trắng của một chú chim hải âu, với phần tựa đề được căn lề bất hợp lý trong một ô chữ nhật màu vàng. Trên Amazon, sách nhận được 3 review, trong đó có 2 đánh giá một sao cùng gọi tác phẩm là “sách giả [viết bởi] AI”. Tại thời điểm viết bài này, sách đã được gỡ khỏi Kindle Unlimited.

Nhà văn trước cơn lốc "sách AI" - Ảnh 2.

Sau khi hiện tượng được báo chí đưa tin, Amazon có vẻ đã vào cuộc khi các đầu sách được nhắc tới đồng loạt biến mất khỏi top 100, tuy nhiên, chúng lại được thay thế bởi hàng loạt đầu sách tệ đến mức đáng nghi ngờ khác – tất cả đều được xuất bản dưới những cái tên rất Việt Nam như Ha Phuong Nga, Linh Anh hay Nhung L. Tác giả Wait You Love Me là Quynh Thi, còn Department of Vinh Du Stands in Front of His Parents’ Tombstone là Hoang Nga, theo ảnh bìa sách còn lưu trên Google.

Dưới tweet của Caitlyn Lynch, các cây viết cũng thi nhau đưa ra các giả thuyết xem những cuốn sách này đến từ đâu. “Chắc chúng được viết bằng AI tiếng Trung, rồi mới được dịch sang tiếng Anh?”, một người dùng hỏi. 

“Khó để nói, nhưng rất có thể. Các đầu sách này có gì đó không ổn. Chúng vừa tệ hơn sách viết bằng AI, và cũng tệ hơn cả sách được dịch tự động” – một ý kiến khác trả lời.

Thành tác giả sách? Chuyện nhỏ

Sự vụ này một lần nữa phản ánh sự hiện diện ngày càng mạnh mẽ của AI trong ngành công nghiệp xuất bản, dần thay thế sức lao động sáng tạo của con người ở nhiều khâu – từ thiết kế bìa cho đến cả viết nội dung sách. 

Chỉ trong chưa đầy 1 năm, ChatGPT đã được liệt kê là tác giả hoặc đồng tác giả của trên 200 đầu sách trên Amazon, chủ yếu là các tựa sách hướng dẫn sử dụng AI và sách thiếu nhi.

Đầu năm nay, Ammar Reshi, một chuyên gia tài chính công nghệ làm việc tại San Francisco, đã thu hút sự quan tâm của báo giới khi cho ra mắt cuốn sách thiếu nhi đầu tay, thực hiện bằng ChatGPT và MidJourney chỉ trong 72 giờ mà không cần bất cứ kinh nghiệm viết sách hay hội họa nào. 

Quyển Alice and Sparkle của anh ngay lập tức lan truyền trên Twitter, nhưng đồng thời hứng chịu nhiều chỉ trích từ các họa sĩ cho rằng tác phẩm của họ đã bị AI sử dụng mà không xin phép, hay công chúng cho rằng chất lượng bài viết quá tệ.

Một trang trong quyển Alice and Sparkle
Một trang trong quyển Alice and Sparkle

Mới đây, tác gia Tim Boucher cũng tuyến bố rằng anh đã hoàn thành 97 cuốn sách trong 9 tháng với sự hỗ trợ của AI. Trả lời phỏng vấn tờ Newsweek, Boucher cho biết anh sử dụng Midjourney để tạo ra tranh minh họa, đồng thời dùng ChatGPT và Claude (AI của Công ty Anthropic) để lấy ý tưởng và viết thay mình một số đoạn. 

Anh cũng cho biết dự kiến sẽ xuất bản 1.000 cuốn sách, hoặc thậm chí nhiều hơn. Mỗi cuốn sách dài 2.000-5.000 chữ, đi kèm 40-140 hình ảnh AI tiêu tốn của Boucher trung bình 6-8 giờ. Với mức giá dao động từ 1,99-3,99 đô la/cuốn bán trên nền tảng Gumroad, Tim đã thu về khoảng 2.000 đô la từ thương vụ này.

Với sự trợ giúp của AI, công việc xuất bản cuốn sách đầu tay trở nên dễ dàng hơn bao giờ hết – ngay cả với người chưa từng có kinh nghiệm viết lách chuyên nghiệp như Tony Zhu, tác giả quyển This Book Is Completely AI Generated xuất bản trên Amazon hồi tháng 2 năm nay. Đúng như tên gọi, cuốn sách 66 trang được viết hoàn toàn bởi AI. 

Tony Zhu chỉ giữ chức danh “người biên tập”: Anh để AI vạch ra các đầu mục cần viết trong sách, rồi để AI viết từng chương một. Zhu thậm chí còn tham vấn AI về cỡ chữ, font chữ trong sách, rồi bắt AI mô tả bìa sách dựa trên nội dung trước khi đưa mô tả thành ảnh minh họa nhờ MidJourney.

“Từ mục lục đến từng chương, thậm chí cả phần mô tả tác giả đều được viết bởi ChatGPT – Zhu viết trong lời đề tựa, phần duy nhất trong sách anh tự viết – Tôi chọn vấn đề đạo đức, tác động và tương lai của AI làm chủ đề sách, bởi xét cho cùng tôi mong muốn hướng sự chú ý và gợi ra các thảo luận về khả năng và các vấn đề đạo đức xung quanh AI”.

Ảnh: Amazon
Ảnh: Amazon

Tác giả đứng lên

Không khó để nhận ra sự xuất hiện của AI trong văn học, cũng giống như nhiều ngành sáng tạo khác như hội họa hay âm nhạc, đang gây ra những tranh cãi căng thẳng. Nhiều nhà văn đã công khai bày tỏ quan điểm về đạo đức của việc sử dụng AI trong văn chương.

Họ cho rằng “sách AI” đang hạ thấp công sức bỏ ra để tư duy, viết và xuất bản một đầu sách theo con đường truyền thống. Cụ thể hơn, AI thường thu nhặt hàng loạt nội dung hình ảnh và văn bản từ Internet, dù phần lớn đều chưa được sự đồng thuận của chủ sở hữu tác phẩm.

Việc sản xuất hàng loạt sách AI cũng đang gây lo ngại sẽ nhấn chìm các tác phẩm do tác giả con người viết, khiến thị trường tràn ngập sách chưa qua kiểm định chất lượng và bản quyền. Thay vì chờ các tập đoàn khổng lồ để mắt đến mình, nhiều nhà văn đã tự đứng lên bảo vệ quyền lợi của mình.

Hai tác giả người Mỹ Mona Awad và Paul Tremblay vừa đệ đơn lên Tòa án liên bang ở San Francisco, cáo buộc ChatGPT sử dụng tác phẩm của mình để huấn luyện AI mà không xin phép. 

Theo Awad và Tremblay, các tác phẩm có bản quyền của họ đã được “tiêu thụ” và “sử dụng để huấn luyện” ChatGPT bởi chatbot này có khả năng tạo ra “tóm tắt hết sức chuẩn xác” về các cuốn tiểu thuyết này.

Đây là vụ kiện chống lại ChatGPT đầu tiên có liên quan đến bản quyền, theo Andres Guadamuz, một chuyên gia về luật sở hữu trí tuệ tại Đại học Sussex, Anh. Vụ kiện này cho khám phá “giới hạn luật pháp” dành cho các hành vi của AI tạo sinh, Guadamuz cho biết thêm.

Tác giả Paul Tremblay và quyển Cabin at the end of the world
Tác giả Paul Tremblay và quyển Cabin at the end of the world

Đơn khiếu nại của hai nhà văn cho rằng OpenAI – công ty chủ quản ChatGPT – đang hưởng lợi “không công bằng” từ “các đoạn viết và ý tưởng” của Awad và Tremblay, đồng thời yêu cầu OpenAI bồi thường thiệt hại cho hai nhà văn này.

Tuy vậy, các tác giả này sẽ gặp tương đối nhiều khó khăn trong việc chứng minh rằng họ đã gặp phải thiệt hại kinh tế vì hành vi sử dụng tác phẩm có bản quyền để huấn luyện AI của ChatGPT, ngay cả khi việc này là có thật. 

ChatGPT có thể hoạt động “y chang” ngay cả khi chưa từng được “nạp” nội dung các cuốn sách này, do lẽ nó có thể sẽ sử dụng tài nguyên Internet, trong đó có các thảo luận xoay quanh cuốn sách do người đọc viết trên các diễn đàn, Guadamuz chỉ ra.

OpenAI đã trở nên “cực kỳ thận trọng” trong việc tiết lộ các thông tin về khối dữ liệu được dùng để huấn luyện ChatGPT, theo Joseph Saveri và Matthew Butterick, luật sư của hai nhà văn vừa đâm đơn kiện. Theo các tài liệu được công bố đi kèm với các phiên bản đời đầu của ChatGPT, OpenAI sử dụng “nguồn sách từ Internet” với tên gọi “Book2” để làm dữ liệu cho quá trình học máy.

Hai vị luật sư ước tính rằng khối sách này lên tới 294.000 cuốn, đồng thời đặt giả thuyết rằng lượng sách này chỉ có thể được “đào” từ các thư viện như Library Genesis (LibGen) and Z-Library, vốn đã khét tiếng trong giới xuất bản vì phân phối sách ở vùng xám bản quyền từ lâu.■

Các tựa sách của tác giả có tên Việt trên Kindle Unlimited trước khi bị gỡ.

Kindle Unlimited giống như Netflix của sách – độc giả thuê bao với giá 12 USD/tháng và được tiếp cận với kho sách hàng trăm ngàn ebook. Amazon cũng trả “nhuận bút” cho tác giả sách dựa trên số trang được đọc, thông qua chương trình KENP. Chẳng hạn, cứ 1.000 trang được đọc (nói dễ hiểu thì có quyển sách 100 trang, được 10 người dùng Kindle Unlimited mượn và đọc hết từ đầu đến cuối), tác giả sẽ được 4-5 USD.

Dù chưa rõ nguyên nhân tại sao sách AI lại đang áp đảo trên bảng xếp hạng Kindle Unlimited, nhiều người, trong đó có Caitlyn Lynch, cho rằng đây là sản phẩm của các trại cày view ảo tại châu Á, nơi các đầu ebook kém chất lượng được tạo và xuất bản hàng loạt để trục lợi thông qua KENP. Vì quỹ trả KENP thay đổi theo từng tháng tùy số thuê bao tổng cộng, nên khi một quyển sách AI được chia phần nhiều hơn, các tác giả chân chính sẽ mất phần vì “miếng bánh” chỉ có thế.

“Đây sẽ là án tử cho Kindle Unlimited nếu Amazon không có cách diệt trừ tận gốc. Lợi nhuận từ KENP sẽ bị giảm một nửa, và các tác giả sẽ rút tác phẩm của họ hàng loạt khỏi hệ thống. Tôi cứ tưởng rằng Amazon có cách đối phó với các trại cày view này. RÕ RÀNG LÀ KHÔNG!”, Lynch khẳng định trên Twitter.

Trả lời VICE, một người phát ngôn của Amazon khẳng định rằng công ty có quy định rõ ràng và nghiêm ngặt cho sách được phép xuất bản, đồng thời cam kết sẽ bảo vệ khách hàng và tiểu thuyết gia khỏi bị lạm dụng.

Theo Xuân Tùng/ Tuổi trẻ cuối tuấn