Với công cụ mới của Nvidia, gánh nặng trong công việc thiết kế đồ họa 3D được giảm nhẹ đi đáng kể.
Nổi lên từ trước cả các chatbot AI, các mô hình AI hình ảnh như Midjourney, Stable Diffusion đang được xem là mối đe dọa nghiêm trọng cho những người làm công việc thiết kế, đồ họa hình ảnh khi người dùng chỉ cần nhập vào từ khóa mong muốn là có thể có được các hình ảnh nghệ thuật hoặc bức hình thiết kế vừa ý.
Tuy vậy những người làm nghề thiết kế đồ vật 3D vẫn có thể thở phào nhẹ nhõm khi các công cụ AI này mới chỉ sản sinh ra được các hình ảnh 2D mà thôi. Thậm chí giờ đây, gánh nặng công việc của họ còn nhẹ gánh hơn khi vài ngày trước, nhà sản xuất chip đồ họa nổi tiếng Nvidia vừa phát hành một mô hình AI mới cho phép tạo ra các cấu trúc 3D chi tiết từ một đoạn video bình thường, ngay cả khi nó được quay bằng smartphone.
Là nhà sản xuất chip được hưởng lợi nhiều nhất từ làn sóng bùng nổ các công cụ AI tạo sinh mới, Nvidia đang tận dụng cơn sốt này không chỉ từ các phần cứng đồ họa mà còn từ các công cụ phần mềm của mình. Mô hình AI Neuralangelo mới được giới thiệu là một công cụ như vậy.
Theo thông báo của Nvidia, mô hình AI mới này có thể tạo nên các bản sao của vật thể dưới dạng 3D từ những đoạn video 2D, cho dù đó là các tác phẩm điêu khắc cổ điển, xe tải bình thường hay các tòa nhà.
Neralangelo hoạt động bằng cách chọn ra một số khung hình của vật thể từ các góc độ khác nhau trong đoạn video, để có được các thông tin về độ sâu, kích thước và hình dạng của đối tượng. Từ đó nó sẽ dựng nên một bản mô tả 3D thô của đối tượng trước khi được tối ưu để bắt chước các chi tiết của vật thể trong thực tế.
Theo công ty, mô hình mới này đã áp dụng công nghệ từ một mô hình cũ của họ có tên Instant NeRF, có thể ghi lại chính xác các chi tiết của bất kỳ điều gì người dùng muốn khi tái tạo lại vật thể dưới dạng 3D. Các chi tiết này bao gồm kết cấu, hoa văn và các biến thể màu sắc của nó.
Nvidia cho biết, Neuralangelo có thể ghi lại được các kết cấu rất phức tạp, ví dụ độ nhám của tấm lợp mái, hay độ nhẵn của đá cẩm thạch với mức độ "vượt trội đáng kể so với các phương pháp trước đây." Thậm chí công cụ này còn mạnh đến mức tạo ra được các vật thể 3D với chất lượng khá từ các đoạn video do smartphone quay lại, giúp các nhà sáng tạo có thể dễ dàng tái tạo lại các vật thể 3D cho dự án của mình. Nvidia cho biết, công cụ của họ có thể tái tạo lại các hình ảnh 3D chỉ trong vòng 2 giờ.
Ming-Yu Liu, đồng tác giả trong tài liệu Neuralangelo cho biết, cuối cùng công cụ này sẽ "cho phép các nhà phát triển nhập các vật thể chi tiết – cho dù là các bức tượng nhỏ hay các tòa nhà khổng lồ - vào trong môi trường ảo của những trò chơi điện tử hoặc các bản sao kỹ thuật số với chất lượng đáng tin cậy."
Trong đoạn video trình diễn công cụ mới của mình, Nvidia cho biết, từ một đoạn phim do drone quay lại, mô hình AI Neuralangelo có thể tái tạo lại các khung cảnh quy mô lớn, giúp các nhà phát triển game dễ dàng tái tạo lại những địa điểm thực trong trò chơi của họ. Nó cũng có nhiều tiềm năng ứng dụng trong các lĩnh vực khác bao gồm robot, các trải nghiệm thực tế ảo, kiến trúc hoặc nghệ thuật.
Nổi lên từ trước cả các chatbot AI, các mô hình AI hình ảnh như Midjourney, Stable Diffusion đang được xem là mối đe dọa nghiêm trọng cho những người làm công việc thiết kế, đồ họa hình ảnh khi người dùng chỉ cần nhập vào từ khóa mong muốn là có thể có được các hình ảnh nghệ thuật hoặc bức hình thiết kế vừa ý.
Tuy vậy những người làm nghề thiết kế đồ vật 3D vẫn có thể thở phào nhẹ nhõm khi các công cụ AI này mới chỉ sản sinh ra được các hình ảnh 2D mà thôi. Thậm chí giờ đây, gánh nặng công việc của họ còn nhẹ gánh hơn khi vài ngày trước, nhà sản xuất chip đồ họa nổi tiếng Nvidia vừa phát hành một mô hình AI mới cho phép tạo ra các cấu trúc 3D chi tiết từ một đoạn video bình thường, ngay cả khi nó được quay bằng smartphone.
Là nhà sản xuất chip được hưởng lợi nhiều nhất từ làn sóng bùng nổ các công cụ AI tạo sinh mới, Nvidia đang tận dụng cơn sốt này không chỉ từ các phần cứng đồ họa mà còn từ các công cụ phần mềm của mình. Mô hình AI Neuralangelo mới được giới thiệu là một công cụ như vậy.
Theo thông báo của Nvidia, mô hình AI mới này có thể tạo nên các bản sao của vật thể dưới dạng 3D từ những đoạn video 2D, cho dù đó là các tác phẩm điêu khắc cổ điển, xe tải bình thường hay các tòa nhà.
Neralangelo hoạt động bằng cách chọn ra một số khung hình của vật thể từ các góc độ khác nhau trong đoạn video, để có được các thông tin về độ sâu, kích thước và hình dạng của đối tượng. Từ đó nó sẽ dựng nên một bản mô tả 3D thô của đối tượng trước khi được tối ưu để bắt chước các chi tiết của vật thể trong thực tế.
Theo công ty, mô hình mới này đã áp dụng công nghệ từ một mô hình cũ của họ có tên Instant NeRF, có thể ghi lại chính xác các chi tiết của bất kỳ điều gì người dùng muốn khi tái tạo lại vật thể dưới dạng 3D. Các chi tiết này bao gồm kết cấu, hoa văn và các biến thể màu sắc của nó.
Nvidia cho biết, Neuralangelo có thể ghi lại được các kết cấu rất phức tạp, ví dụ độ nhám của tấm lợp mái, hay độ nhẵn của đá cẩm thạch với mức độ "vượt trội đáng kể so với các phương pháp trước đây." Thậm chí công cụ này còn mạnh đến mức tạo ra được các vật thể 3D với chất lượng khá từ các đoạn video do smartphone quay lại, giúp các nhà sáng tạo có thể dễ dàng tái tạo lại các vật thể 3D cho dự án của mình. Nvidia cho biết, công cụ của họ có thể tái tạo lại các hình ảnh 3D chỉ trong vòng 2 giờ.
Ming-Yu Liu, đồng tác giả trong tài liệu Neuralangelo cho biết, cuối cùng công cụ này sẽ "cho phép các nhà phát triển nhập các vật thể chi tiết – cho dù là các bức tượng nhỏ hay các tòa nhà khổng lồ - vào trong môi trường ảo của những trò chơi điện tử hoặc các bản sao kỹ thuật số với chất lượng đáng tin cậy."
Trong đoạn video trình diễn công cụ mới của mình, Nvidia cho biết, từ một đoạn phim do drone quay lại, mô hình AI Neuralangelo có thể tái tạo lại các khung cảnh quy mô lớn, giúp các nhà phát triển game dễ dàng tái tạo lại những địa điểm thực trong trò chơi của họ. Nó cũng có nhiều tiềm năng ứng dụng trong các lĩnh vực khác bao gồm robot, các trải nghiệm thực tế ảo, kiến trúc hoặc nghệ thuật.
Theo Genk