Vào tháng 12 năm ngoái, khi nhiều người đang chuẩn bị bước vào kỳ nghỉ đông, các tác giả phim “South Park” đã công bố nhận được một khoản đầu tư mới trị giá 20 triệu USD cho studio deepfake của họ, Deep Voodoo. Thông cáo báo chí của công ty cho biết nguồn vốn đầu tư này sẽ giúp họ mang lại cho các nghệ sỹ, nhà sản xuất, và những người làm trong lĩnh vực sáng tạo nội dung trên toàn thế giới “công nghệ kỹ xảo tráo mặt vô đối”.
Mối liên hệ giữa Deep Voodoo với Hollywood khiến studio này trở nên đặc biệt đáng chú ý, nhưng họ không phải studio duy nhất chuyên về deepfake. Hàng chục startup khác cũng đang cung cấp các dịch vụ dựa trên công nghệ nguy hiểm này. Lớn nhất trong số đó, Synthesia (trụ sở ở London), từng gọi vốn được 50 triệu USD vào năm 2021 và có hơn 100 nhân viên. Nhưng đó chỉ là khởi đầu của một xu hướng mà thôi.
“Tôi nghĩ công bằng mà nói thì khi công nghệ ngày càng tốt hơn và phổ biến rộng rãi hơn, sẽ có nhiều người bắt đầu nhận thấy tiềm năng của deepfake… Điều duy nhất có thể kìm hãm sự tăng trưởng của nó là việc thiếu vắng các quy định quản lý và định hướng rõ ràng trong cách deepfake được sử dụng” - theo Dmitry Shironosov, CEO của Everypixel Labs.
Kendrick Lamar mang khuôn mặt Kanye West
Mối quan hệ giữa các studio deepfake với các khách hàng có thể là trực tiếp. Deep Voodoo từng mang công nghệ deepfake vào video ca nhạc “The Heart Part 5” của Kendrick Lamar. Khuôn mặt của rapper này từ từ biến đổi trong chớp mắt: giây trước anh là Kanye West, giây sau đã thành Will Smith. Việc dùng kỹ xảo để thay đổi khuôn mặt của một diễn viên (hay trong ví dụ trên, là một nhạc sỹ) không phải quá mới mẻ. Nhưng deepfake linh hoạt hơn, và ít tốn thời gian hơn, so với các kỹ thuật tương tự, và điều này góp phần vào sự thành công của nó trên mạng xã hội. Việc đoàn làm phim Star Trek dùng kỹ thuật đồ họa để tái sinh nhân vật Spock, dù độ chân thực cao hơn hẳn so với kết quả tạo ra bởi Deep Voodoo, đòi hỏi nhiều giờ chuẩn bị, trang điểm, và gắn đạo cụ trước khi áp dụng các hiệu ứng số hóa phức tạp.
Deepfake còn len lỏi vào những lĩnh vực thực dụng hơn, ít hào nhoáng hơn. “Tôi tin rằng ngành công nghiệp giải trí và quảng cáo sẽ bị tác động lớn bởi công nghệ deepfake. Nó có tiềm năng cách mạng hóa cách chúng ta tạo và trình bày nội dung, khiến quy trình trở nên nhanh hơn, rẻ hơn, và mở ra những cơ hội mới để sáng tạo ra những kỹ xảo đặc biệt chân thực hơn, dễ tạo sự chú ý hơn” - theo Shironosov. “Thành thật mà nói, thu hút được sự chú ý của mọi người là mấu chốt đối với bất kỳ ai trong ngành kinh doanh, truyền thông, hay thậm chí là trong chính trị, và deepfake chắc chắn giúp được điều đó”
Synthesia (trụ sở ở London), thành lập vào năm 2017, là minh chứng cho điều này trong thực tiễn. Công ty cung cấp hơn 85 “avatar”, có thể được dùng để tạo video thể hiện ở hơn 120 ngôn ngữ. Người dùng chọn một avatar, cho AI xem kịch bản mà bạn muốn nó bám vào, và để nó làm phần còn lại. Video thành phẩm có thể chưa đủ trình độ để chiếu rạp hay khiến các YouTuber thất nghiệp, nhưng nếu bạn chuyên làm video về dạy học, trình bày thông tin, hướng dẫn…thì không có gì chê được.
Các startup khác, như Maverick, chọn hướng đi khác: dùng deepfake để làm video cá nhân hóa trên quy mô lớn. Deepfake có thể cho phép các nhà tiếp thị quay video một lần duy nhất, sau đó tùy biến nó để truyền tải thông tin trực tiếp đến một khách hàng cụ thể theo tên, hoặc giới thiệu các sản phẩm theo phong cách phù hợp với người xem. Nếu bạn quên thanh toán một món hàng đã cho vào giỏ trên một website bán lẻ thường ghé thăm, nó có thể nhắc bạn thông qua một video do máy tính tự động tạo ra, với nội dung đề cập đến món hàng trong giỏ.
Đã đến lúc ngừng lo lắng và chuyển sang đón nhận deepfake?
Deepfake đã xuất hiện và tồn tại từ nhiều năm qua, kéo theo đó là những quan ngại về việc chúng có thể tạo ra một “đại dịch” thông tin giả. Bản chất gây sốt của những clip deepfake đời đầu, vốn sử dụng những hình tượng chính trị như Barack Obama và Donald Trump làm ví dụ, dường như càng khiến nỗi ám ảnh đó trở nên sâu sắc hơn. Nhưng các startup trong lĩnh vực này không hề xem đó là rào cản, và số lượng các công ty đang sử dụng những công nghệ có thể được gọi là “deepfake” dưới nhiều hình thức khác nhau cũng ngày một nhiều hơn, đến mức không thể đếm hết được.
Tuy vậy, ngoài Trung Quốc, nước gần đây vừa ban hành luật yêu cầu phải gắn watermark cho các video deepfake, thì chính phủ các quốc gia khác trên thế giới vẫn chưa có động thái nào nhằm quản lý công nghệ này.
Các quy định quản lý, nếu xuất hiện, có lẽ cũng đã quá muộn, khi mà ngành công nghiệp deepfake đang tiến hóa ở tốc độ cực nhanh và rẽ sang nhiều nhánh khác nhau. Kỹ thuật deepfake được sử dụng bởi Deep Voodoo trong video ca nhạc của Lamar có một vai trò rất khác so với deepfake của Synthesia, vốn cho phép người dùng tạo video mà chỉ cần một đoạn kịch bản. Và cả hai lại rất khác biệt so với deepfake của các công ty như Maverick, vốn cho phép người dùng tùy biến nhiều phần trong một video sẵn có.
Shironosov cho rằng có lẽ đã đến lúc loại bỏ hoàn toàn khái niệm “deepfake”, bởi sức mạnh của các công cụ AI hiện đại đã vượt quá xa so với những gì mà khái niệm gốc miêu tả. “Thành thực mà nói chúng tôi thậm chí đang muốn tìm kiếm một thứ gì đó để thay thế cho khái niệm ‘deepfake’ trong công việc của mình, nhằm đánh dấu bước chuyển dịch sang một cấp độ mới” - ông nói.
Tương lai của deepfake vẫn đang được viết nên, nhưng tương lai đó dường như bao gồm một số lượng rất đa dạng các công cụ chỉnh sửa video với chức năng cải thiện, tùy biến, và cá nhân hóa mọi khía cạnh của một video. Và đó chẳng phải đơn thuần chỉ là biên tập video hay sao?
Mối liên hệ giữa Deep Voodoo với Hollywood khiến studio này trở nên đặc biệt đáng chú ý, nhưng họ không phải studio duy nhất chuyên về deepfake. Hàng chục startup khác cũng đang cung cấp các dịch vụ dựa trên công nghệ nguy hiểm này. Lớn nhất trong số đó, Synthesia (trụ sở ở London), từng gọi vốn được 50 triệu USD vào năm 2021 và có hơn 100 nhân viên. Nhưng đó chỉ là khởi đầu của một xu hướng mà thôi.
“Tôi nghĩ công bằng mà nói thì khi công nghệ ngày càng tốt hơn và phổ biến rộng rãi hơn, sẽ có nhiều người bắt đầu nhận thấy tiềm năng của deepfake… Điều duy nhất có thể kìm hãm sự tăng trưởng của nó là việc thiếu vắng các quy định quản lý và định hướng rõ ràng trong cách deepfake được sử dụng” - theo Dmitry Shironosov, CEO của Everypixel Labs.
Các công ty deepfake làm gì?
Deepfake phổ biến trong văn hóa đại chúng chủ yếu nhờ các video gây sốt trên internet. Unreal Keanue Reeves, một người chuyên làm video ngắn trên YouTube (Shorts), nhận được đến hàng chục triệu lượt xem chỉ trong vài tháng. Một tài khoản TikTok tương tự, deeptomcruise (được sản xuất bởi một công ty AI tên Metaphysic.ai), có hơn 5 triệu người theo dõi. Deepfake là một công nghệ thú vị - nhưng video ghép mặt Keanu Reeves nhảy nhót trong bếp thì có gì đặc sắc mà giúp các startup thu về khoản lợi nhuận hàng triệu USD?Kendrick Lamar mang khuôn mặt Kanye West
Mối quan hệ giữa các studio deepfake với các khách hàng có thể là trực tiếp. Deep Voodoo từng mang công nghệ deepfake vào video ca nhạc “The Heart Part 5” của Kendrick Lamar. Khuôn mặt của rapper này từ từ biến đổi trong chớp mắt: giây trước anh là Kanye West, giây sau đã thành Will Smith. Việc dùng kỹ xảo để thay đổi khuôn mặt của một diễn viên (hay trong ví dụ trên, là một nhạc sỹ) không phải quá mới mẻ. Nhưng deepfake linh hoạt hơn, và ít tốn thời gian hơn, so với các kỹ thuật tương tự, và điều này góp phần vào sự thành công của nó trên mạng xã hội. Việc đoàn làm phim Star Trek dùng kỹ thuật đồ họa để tái sinh nhân vật Spock, dù độ chân thực cao hơn hẳn so với kết quả tạo ra bởi Deep Voodoo, đòi hỏi nhiều giờ chuẩn bị, trang điểm, và gắn đạo cụ trước khi áp dụng các hiệu ứng số hóa phức tạp.
Deepfake còn len lỏi vào những lĩnh vực thực dụng hơn, ít hào nhoáng hơn. “Tôi tin rằng ngành công nghiệp giải trí và quảng cáo sẽ bị tác động lớn bởi công nghệ deepfake. Nó có tiềm năng cách mạng hóa cách chúng ta tạo và trình bày nội dung, khiến quy trình trở nên nhanh hơn, rẻ hơn, và mở ra những cơ hội mới để sáng tạo ra những kỹ xảo đặc biệt chân thực hơn, dễ tạo sự chú ý hơn” - theo Shironosov. “Thành thật mà nói, thu hút được sự chú ý của mọi người là mấu chốt đối với bất kỳ ai trong ngành kinh doanh, truyền thông, hay thậm chí là trong chính trị, và deepfake chắc chắn giúp được điều đó”
Synthesia (trụ sở ở London), thành lập vào năm 2017, là minh chứng cho điều này trong thực tiễn. Công ty cung cấp hơn 85 “avatar”, có thể được dùng để tạo video thể hiện ở hơn 120 ngôn ngữ. Người dùng chọn một avatar, cho AI xem kịch bản mà bạn muốn nó bám vào, và để nó làm phần còn lại. Video thành phẩm có thể chưa đủ trình độ để chiếu rạp hay khiến các YouTuber thất nghiệp, nhưng nếu bạn chuyên làm video về dạy học, trình bày thông tin, hướng dẫn…thì không có gì chê được.
Các startup khác, như Maverick, chọn hướng đi khác: dùng deepfake để làm video cá nhân hóa trên quy mô lớn. Deepfake có thể cho phép các nhà tiếp thị quay video một lần duy nhất, sau đó tùy biến nó để truyền tải thông tin trực tiếp đến một khách hàng cụ thể theo tên, hoặc giới thiệu các sản phẩm theo phong cách phù hợp với người xem. Nếu bạn quên thanh toán một món hàng đã cho vào giỏ trên một website bán lẻ thường ghé thăm, nó có thể nhắc bạn thông qua một video do máy tính tự động tạo ra, với nội dung đề cập đến món hàng trong giỏ.
Đã đến lúc ngừng lo lắng và chuyển sang đón nhận deepfake?
Deepfake đã xuất hiện và tồn tại từ nhiều năm qua, kéo theo đó là những quan ngại về việc chúng có thể tạo ra một “đại dịch” thông tin giả. Bản chất gây sốt của những clip deepfake đời đầu, vốn sử dụng những hình tượng chính trị như Barack Obama và Donald Trump làm ví dụ, dường như càng khiến nỗi ám ảnh đó trở nên sâu sắc hơn. Nhưng các startup trong lĩnh vực này không hề xem đó là rào cản, và số lượng các công ty đang sử dụng những công nghệ có thể được gọi là “deepfake” dưới nhiều hình thức khác nhau cũng ngày một nhiều hơn, đến mức không thể đếm hết được.
“Tôi nghĩ nhận thức của mọi người về công nghệ này đã thực sự thay đổi theo thời gian. Ban đầu, người ta còn e dè hay thậm chí là lo ngại về nó, đặc biệt liên quan các vấn đề an ninh và quyền riêng tư” - Shironosov nói.Tuy vậy, ngoài Trung Quốc, nước gần đây vừa ban hành luật yêu cầu phải gắn watermark cho các video deepfake, thì chính phủ các quốc gia khác trên thế giới vẫn chưa có động thái nào nhằm quản lý công nghệ này.
Các quy định quản lý, nếu xuất hiện, có lẽ cũng đã quá muộn, khi mà ngành công nghiệp deepfake đang tiến hóa ở tốc độ cực nhanh và rẽ sang nhiều nhánh khác nhau. Kỹ thuật deepfake được sử dụng bởi Deep Voodoo trong video ca nhạc của Lamar có một vai trò rất khác so với deepfake của Synthesia, vốn cho phép người dùng tạo video mà chỉ cần một đoạn kịch bản. Và cả hai lại rất khác biệt so với deepfake của các công ty như Maverick, vốn cho phép người dùng tùy biến nhiều phần trong một video sẵn có.
Shironosov cho rằng có lẽ đã đến lúc loại bỏ hoàn toàn khái niệm “deepfake”, bởi sức mạnh của các công cụ AI hiện đại đã vượt quá xa so với những gì mà khái niệm gốc miêu tả. “Thành thực mà nói chúng tôi thậm chí đang muốn tìm kiếm một thứ gì đó để thay thế cho khái niệm ‘deepfake’ trong công việc của mình, nhằm đánh dấu bước chuyển dịch sang một cấp độ mới” - ông nói.
Tương lai của deepfake vẫn đang được viết nên, nhưng tương lai đó dường như bao gồm một số lượng rất đa dạng các công cụ chỉnh sửa video với chức năng cải thiện, tùy biến, và cá nhân hóa mọi khía cạnh của một video. Và đó chẳng phải đơn thuần chỉ là biên tập video hay sao?
Theo VN review