Facebook đã lần đầu tiên hé lộ dự án có tên Learning from Videos sử dụng trí thông minh nhân tạo (AI) để hiểu và học các biểu diễn âm thanh, văn bản và hình ảnh trong video của người dùng công khai trên mạng xã hội.
Theo Engadget, dự án Learning from Videos có một số mục đích như cải thiện hệ thống AI của Facebook liên quan đến các đề xuất nội dung và thực thi chính sách. Dự án đang trong giai đoạn đầu nhưng nó đã mang lại kết quả. Facebook cho biết họ đã khai thác công nghệ này để nâng cao các đề xuất của Instagram, chẳng hạn như hiển thị video về những người đang nhảy cùng một điệu nhạc. Hệ thống cũng đang cho thấy kết quả cải thiện trong các lỗi nhận dạng giọng nói, điều này có thể hỗ trợ các tính năng tự động tạo phụ đề và phát hiện lời nói mang tính căm thù trong video dễ dàng hơn.
Facebook cho biết dự án này sẽ giúp các nhà nghiên cứu AI tránh phải dựa vào dữ liệu được dán nhãn và đây là một phần trong nỗ lực xây dựng các hệ thống học theo cách tương tự như con người. Facebook cho biết Learning from Videos sẽ "cho phép những trải nghiệm hoàn toàn mới".
Công ty đã không đi sâu vào chi tiết kỹ thuật ngoại trừ một tính năng khả thi cho phép AI tìm thấy những ký ức kỹ thuật số, bao gồm cả những ký ức được chụp bằng kính thực tế tăng cường.
Công ty cho biết dự án đang xem xét các video bằng hàng trăm ngôn ngữ và từ hầu hết các quốc gia. Khía cạnh này của dự án sẽ làm cho các hệ thống AI chính xác hơn, cho phép chúng thích ứng với thế giới đang chuyển động nhanh, đồng thời nhận ra các sắc thái và dấu hiệu hình ảnh qua các nền văn hóa và khu vực khác nhau.
Facebook nói họ luôn lưu ý đến quyền riêng tư khi nói đến Learning from Videos. Công ty cho biết trong một bài đăng trên blog rằng "chúng tôi đang xây dựng và duy trì một nền tảng bảo mật mạnh mẽ sử dụng các giải pháp tự động để thực thi quyền riêng tư trên quy mô lớn. Bằng cách nhúng công việc này ở cấp cơ sở hạ tầng, chúng tôi có thể áp dụng nhất quán các yêu cầu về quyền riêng tư trên các hệ thống của mình và hỗ trợ các nỗ lực như AI. Điều này bao gồm việc triển khai các biện pháp bảo vệ kỹ thuật trong suốt vòng đời dữ liệu".
Hiểu những gì đang xảy ra trong video có thể là một nhiệm vụ khó khăn đối với các hệ thống AI. Chúng có thể bao gồm các rào cản như tiếng ồn xung quanh gây khó khăn cho việc chuyển đổi giọng nói và ngôn ngữ. Tuy nhiên, chưa đầy một năm sau khi bắt đầu dự án Learning from Videos, Facebook đang tiếp thu những gì hệ thống đã học được và đưa nó vào sử dụng thực tế trong các lĩnh vực khác.
Theo Engadget, dự án Learning from Videos có một số mục đích như cải thiện hệ thống AI của Facebook liên quan đến các đề xuất nội dung và thực thi chính sách. Dự án đang trong giai đoạn đầu nhưng nó đã mang lại kết quả. Facebook cho biết họ đã khai thác công nghệ này để nâng cao các đề xuất của Instagram, chẳng hạn như hiển thị video về những người đang nhảy cùng một điệu nhạc. Hệ thống cũng đang cho thấy kết quả cải thiện trong các lỗi nhận dạng giọng nói, điều này có thể hỗ trợ các tính năng tự động tạo phụ đề và phát hiện lời nói mang tính căm thù trong video dễ dàng hơn.
Facebook cho biết dự án này sẽ giúp các nhà nghiên cứu AI tránh phải dựa vào dữ liệu được dán nhãn và đây là một phần trong nỗ lực xây dựng các hệ thống học theo cách tương tự như con người. Facebook cho biết Learning from Videos sẽ "cho phép những trải nghiệm hoàn toàn mới".
Công ty đã không đi sâu vào chi tiết kỹ thuật ngoại trừ một tính năng khả thi cho phép AI tìm thấy những ký ức kỹ thuật số, bao gồm cả những ký ức được chụp bằng kính thực tế tăng cường.
Công ty cho biết dự án đang xem xét các video bằng hàng trăm ngôn ngữ và từ hầu hết các quốc gia. Khía cạnh này của dự án sẽ làm cho các hệ thống AI chính xác hơn, cho phép chúng thích ứng với thế giới đang chuyển động nhanh, đồng thời nhận ra các sắc thái và dấu hiệu hình ảnh qua các nền văn hóa và khu vực khác nhau.
Facebook nói họ luôn lưu ý đến quyền riêng tư khi nói đến Learning from Videos. Công ty cho biết trong một bài đăng trên blog rằng "chúng tôi đang xây dựng và duy trì một nền tảng bảo mật mạnh mẽ sử dụng các giải pháp tự động để thực thi quyền riêng tư trên quy mô lớn. Bằng cách nhúng công việc này ở cấp cơ sở hạ tầng, chúng tôi có thể áp dụng nhất quán các yêu cầu về quyền riêng tư trên các hệ thống của mình và hỗ trợ các nỗ lực như AI. Điều này bao gồm việc triển khai các biện pháp bảo vệ kỹ thuật trong suốt vòng đời dữ liệu".
Hiểu những gì đang xảy ra trong video có thể là một nhiệm vụ khó khăn đối với các hệ thống AI. Chúng có thể bao gồm các rào cản như tiếng ồn xung quanh gây khó khăn cho việc chuyển đổi giọng nói và ngôn ngữ. Tuy nhiên, chưa đầy một năm sau khi bắt đầu dự án Learning from Videos, Facebook đang tiếp thu những gì hệ thống đã học được và đưa nó vào sử dụng thực tế trong các lĩnh vực khác.
Theo Thanh Niên