OPPO mang về 12 giải thưởng tại sự kiện CVPR 2021 cùng loạt bước tiến trong lĩnh vực AI

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Gần đây, OPPO đã tham gia Hội nghị Nhận dạng Hình ảnh và Thị giác Máy tính (CVPR) 2021 - một sự kiện thị giác máy tính hàng đầu tổ chức định kỳ hằng năm. Trong suốt hội nghị, những thành tựu của OPPO trong lĩnh vực trí tuệ nhân tạo đã được công nhận với thành tích trong 12 cuộc thi khác nhau ở 7 lĩnh vực chính. Các giải thưởng bao gồm một giải nhất, bảy giải nhì và bốn giải ba, thể hiện năng lực công nghệ hàng đầu của công ty và những đột phá sáng tạo trong lĩnh vực trí tuệ nhân tạo.

Đại diện của OPPO tham gia cuộc thi CVPR 2021 đến từ Bộ phận Tương tác và Nhận thức Thông minh (Intelligent Perception and Interaction) và Trung tâm Nghiên cứu OPPO Hoa Kỳ của Viện Nghiên cứu OPPO. Thông qua việc tối ưu hóa và đào tạo về các thuật toán trí tuệ nhân tạo, thành quả của nhóm góp phần củng cố năng lực của OPPO trong lĩnh vực trí tuệ nhân tạo, từ đó mang lại chất lượng sống tốt hơn cho con người.

Eric Guo, trưởng bộ phận Nhận thức Thông minh tại OPPO, cho biết: “Chúng tôi rất vui mừng khi một lần nữa đạt được những kết quả ấn tượng như vậy trong các thử thách CVPR năm nay, tiếp nối những thành quả đạt được trong lần đầu tiên tham gia ở CVPR 2020. Năm ngoái, chúng tôi đã giành được vị trí cao nhất trong thử thách Perceptual Extreme Super-Resolution (tạm dịch: Siêu phân giải cực đại theo cảm quan) bằng cách xử lý một hình ảnh mờ nhoè trở nên sắc nét tối đa; và thử thách Visual Localization for Handheld Devices (tạm dịch: Bản địa hóa trực quan cho thiết bị cầm tay) giúp định vị hợp nhất chính xác hơn. Những thử thách mà OPPO đã thắng cuộc trong năm nay là Multi-Agent Behavior (tạm dịch: Hành vi đa tác nhân), AVA-Kinetics, và Tái tạo khuôn mặt 3D từ nhiều hình ảnh 2D, các thử thách này bao quát các lĩnh vực phức tạp và nâng cao hơn trong thị giác máy tính, chẳng hạn như phát hiện hành vi, định vị các hành động của con người trong không gian và thời gian, và nhận diện khuôn mặt.

Guo cho biết thêm: “Những công nghệ này có thể được ứng dụng trong các tình huống khác nhau như trong gia đình, văn phòng, sản xuất, nhiếp ảnh, sức khỏe và lưu động. Tại OPPO, chúng tôi cam kết phát triển trí tuệ nhân tạo phục vụ con người tốt hơn, mang đến cho người dùng những trải nghiệm thông minh và tiện lợi hơn.”

Trong số mười hai danh hiệu của mình, OPPO đã nhận được ba giải thưởng trong thử thách Hành vi đa tác nhân - thử thách đánh giá khả năng của một mô hình AI trong việc hiểu, xác định và dự đoán các tương tác phức tạp giữa các tác nhân thông minh như động vật và con người. Ngoài ra, OPPO đã giành được giải nhất trong hạng mục Learning New Behavior (tạm dịch: Học hành vi mới), hạng hai trong Classical Classification (tạm dịch: Phân loại truyền thống) và hạng ba trong Annotation Style Transfer (tạm dịch: Chuyển kiểu chú thích), vượt trội hơn so với 240 đơn vị tham gia khác nhờ năng lực AI hàng đầu của mình. Những công nghệ này hiện đang đóng vai trò thiết yếu tại các nhà máy của OPPO, nơi các thuật toán hỗ trợ công nhân giảm thiểu các lỗi vận hành, đặc biệt là trong các bước sản xuất quan trọng, không những đảm bảo an toàn cho chính họ mà còn cho chất lượng sản phẩm hoàn thiện.

image.jpg

Thử thánh Hành vi Đa tác nhân

Từ trí tuệ điện toán đến đến trí tuệ lấy con người làm trung tâm, OPPO đang nỗ lực phát triển năng lực AI để hiểu rõ con người hơn.

Với sứ mệnh “Technology for Mankind, Kindness for the World” (tạm dịch: Công nghệ vì con người, Tử tế vì thế giới), OPPO đã và đang xây dựng năng lực của mình lấy con người làm trọng tâm. Ở thử thách tái tạo khuôn mặt 3D từ nhiều hình ảnh 2D, thuật toán AI do OPPO tự phát triển đã có thể tái tạo lại hình dạng khuôn mặt 3D với sai số khoảng 1mm, và điều này giúp OPPO bước lên vị trí thứ hai trong bảng xếp hạng. Công nghệ của OPPO khắc phục các vấn đề liên quan đến các đặc điểm khuôn mặt không rõ ràng, biểu cảm phóng đại hay thậm chí là dữ liệu hình ảnh bị hỏng do chuyển động trong đời thực, đặc biệt là trong video động, để tạo ra các mô hình khuôn mặt 3D chính xác hơn.

Thuật toán nhận diện khuôn mặt do OPPO tự phát triển có thể xác định 635 điểm đặc trưng chính với tốc độ 30 lần mỗi giây. Cấu trúc thuật toán này được sử dụng để xây dựng và phát triển tính năng làm đẹp trên video có trên chiếc smartphone Reno6 sắp được ra mắt. Tính năng này cho phép người dùng dễ dàng tạo hiệu ứng làm đẹp động tự nhiên trong video của họ. Công nghệ này sẽ thúc đẩy sự phát triển của công nghệ video chân dung, với tính năng nhận dạng 3D làm cho các hiệu ứng làm đẹp và bộ lọc tự nhiên và được cá nhân hóa hơn. Nó cũng sẽ cho phép các bộ lọc AR phong phú và chân thật hơn trên các nền tảng xã hội, cho phép người dùng được trải nghiệm công nghệ tiên tiến trong mỗi khoảnh khắc hàng ngày.

rSxU-asSEDtzAsPzCqd4TRol2jtXkclO44Jd-CCDbc2GyHNoqjVOXf28sSgj400CWiTrqPIpaRc1RiDs_TN-s8Gyq74xWAu50h-STnxXJMd-DhybsfDK3g9lQEb4WQ

Tái tạo khuôn mặt 3D từ nhiều hình ảnh 2D​

Trí tuệ nhân tạo trong không gian và thời gian

Năng lực trí tuệ nhân tạo của OPPO đã phát triển đến mức có thể nhận ra hành động của con người trong cả không gian và thời gian. Trong thử thách SoccerNet, OPPO đã giành vị trí thứ hai trong cả hai nhiệm vụ Action Spotting (tạm dịch: Phát hiện hành động) và Replay Grounding (tạm dịch: Thiếp lập phát lại). Mục đích của thử thách là đánh giá khả năng của các thuật toán trong việc xác định nhiều hành động quan trọng trong video một trận đấu bóng đá, bao gồm cả lỗi việt vị và thẻ đỏ mà người bình thường khó nhận ra do các quy tắc phức tạp cũng như có nhiều cách giải thích khác nhau về chúng. Để phát huy hiệu quả, thuật toán AI cũng cần tính đến các biến số khác như góc máy ảnh, cũng như truy xuất chính xác mốc thời gian để phát lại cảnh quay trong trận đấu. Các ứng dụng trong tương lai của công nghệ này sẽ được tiếp cận rộng rãi và giúp cải thiện trải nghiệm cho những người yêu thể thao thông qua các tính năng như tự động phát những pha đáng chú ý của trận đấu. Theo cách làm tương tự, công nghệ này cũng có thể tự động tạo ra những khoảnh khắc nổi bật trong cuộc sống của người dùng - ví dụ như clip nổi bật hàng tuần - bằng cách phân tích video trên smartphone của họ.

GcSh-k-H0n2U51MHJAsOnIkI5iKQiHA9X7lr2tqZ6rz3oDJrLoTrq0Hrcuf2hyJXmNQMy8EpRVk9rY4mj_p_WsR0pXZ1k3SO1jqzDjQI5tnZDRYzms2t1pZrFyoP1w

Thử thách SoccerNet

Trong Thử thách MMact, OPPO đã giành vị trí thứ hai trong cả hai nhiệm vụ Cross-Model Action Recognition (tạm dịch: Nhận dạng hành động đa phương thức) và Cross-Model Action Temporal Localization (tạm dịch: Bản địa hóa tạm thời hành động đa phương thức). Thuật toán AI tiên tiến của OPPO có thể nhận dạng chính xác hơn mười loại hành động trong video, chẳng hạn như nói chuyện, cúi người và đi bộ, chỉ bằng các dữ liệu hình ảnh. Công nghệ này dự kiến sẽ được áp dụng rộng rãi trong các ngôi nhà thông minh trong tương lai, với những lợi ích bao gồm khả năng chăm sóc trẻ em, vật nuôi, người già hoặc các đối tượng dễ bị tổn thương khác tại nhà tốt hơn. Ví dụ, AI có thể cảnh báo các bậc cha mẹ khi họ không ở bên cạnh trẻ lúc bé có những hành động có thể gây nguy hiểm.

OPPO cũng giành được vị trí thứ ba trong thử thách AVA-Kinetics - tận dụng tập dữ liệu đầu tiên của ngành để bao quát cả thông tin về không gian và thời gian. Cuộc thi Challenge's Positioning (tạm dịch: Định vị thử thách) từ lâu đã trở thành một trong những cuộc thi phổ biến nhất trong lĩnh vực trí tuệ nhân tạo, với các đối thủ đến từ các trường đại học và công ty công nghệ quốc tế hàng đầu. Thuật toán AVA-Kinetics không chỉ có thể xác định chính xác các hành vi khác nhau của mọi người trong video mà còn ghi nhận thời gian và vị trí của họ. Nhờ đó, công nghệ AI của OPPO không chỉ hiểu bạn đang làm gì mà còn hiểu bạn đang làm ở đâu và khi nào.

OPPO tiếp tục khám phá những giới hạn của công nghệ trí tuệ nhân tạo

Tại CVPR năm nay, OPPO cũng đã tạo ra một cột mốc mới trong những thử thách học thuật tiên tiến hơn, bao gồm cả việc giành hai vị trí thứ ba trong thử thách LOVEU - Long-form Vdeo Understading (tạm dịch: Hiểu video dạng dài). Thử thách LOVEU yêu cầu công nghệ AI phải hiểu nội dung của video và phân đoạn video đó thành nhiều phần mà không được cung cấp các danh mục phân loại trước. Với lượng nội dung đa dạng, thử thách đặt ra một bài kiểm tra kỹ lưỡng về khả năng áp dụng các thuật toán AI vào những tình huống tổng quát hơn: AI cần suy nghĩ như con người, hiểu màu sắc, vật thể, hành động của con người và thậm chí cả ánh sáng trong video và đưa ra đánh giá mọi thứ thay đổi như thế nào theo thời gian.

Trung tâm nghiên cứu OPPO Hoa Kỳ đã tham gia thử thách Dense Depth for Autonomous Driving (tạm dịch: Độ sâu cực độ cho lái xe tự động) và thể hiện trình độ công nghệ của mình bằng cách có thể trích xuất thông tin độ sâu 3D dựa trên hình ảnh 2D. OPPO đã giành vị trí thứ hai trong thử thách Self-supervised (tạm dịch: Tự giám sát) và mang về "Giải thưởng Độc đáo". Công nghệ này sử dụng mô hình học tập để trích xuất trực tiếp thông tin độ sâu từ hình ảnh thông thường và nó có thể thay thế các cảm biến độ sâu như ToF trong tương lai để mang lại trải nghiệm điều hướng trong nhà và ngoài trời tốt hơn.

OPPO gia nhập tổ chức LF AI & Data để thúc đẩy Mã nguồn mở (Open-source) nhằm xây dựng một hệ sinh thái công nghệ bền vững

Một bước đi khác OPPO trên chặng đường phát triển công nghệ trí tuệ nhân tạo là chính thức gia nhập ban quản trị của tổ chức LF AI & Data với tư cách là thành viên cấp cao. OPPO cùng các thành viên cấp cao của tổ chức đang từng bước nỗ lực để mang công nghệ AI và Dữ liệu tiếp cận được với nhiều người hơn, đồng thời xây dựng một hệ sinh thái AI lành mạnh, công bằng và bền vững.

zhwinbylKjqCjaCzvcSxsS0XThPSnzscgCrpgIB-4LSNDb6wJb01hRtpfMqe2y_u4k4DCQiV2B_AAs336dS06nqJtfcM3Hs36S7A_oYwuNBGJMRGMT3AVlAYQh0IRQ

OPPO tham gia tổ chức LF AI & Data với tư cách là thành viên cấp cao

Được thành lập bởi tổ chức Linux Foundation vào tháng 3 năm 2018, tổ chức LF AI & Data bao gồm 49 thành viên trong nhiều lĩnh vực khác nhau. Sứ mệnh của tổ chức là xây dựng và hỗ trợ một cộng đồng công nghệ Dữ liệu và Trí tuệ nhân tạo cởi mở, đồng thời thúc đẩy sự đổi mới mã nguồn mở trong các lĩnh vực bao gồm AI, ML và Dữ liệu, bằng cách khuyến khích sự hợp tác và tạo nên nhiều cơ hội mới cho tất cả các thành viên của cộng đồng. Cùng lúc đó, OPPO cũng luôn cố gắng tạo lập một hệ sinh thái mở nơi các lập trình viên, các đối tác hỗ trợ lẫn nhau và cùng nhau tiến bộ. Những bước đi này của OPPO đã thu hút các đối tác có cùng chí hướng, trong đó có tổ chức LF AI & Data.

Trong nhiều năm qua, OPPO đã không ngừng đầu tư vào công nghệ AI và công nghệ Dữ liệu. Hệ thống kỹ thuật AI và Dữ liệu của OPPO cung cấp nhiều dịch vụ tốt hơn cho người dùng cũng như cho các lập trình viên, thông qua việc khám phá và phát triển các công nghệ cốt lõi như AI hội thoại (conversational AI), học máy (machine learning), thuật toán đề xuất cá nhân hóa, dịch vụ dữ liệu đám mây cũng như bảo mật và quyền riêng tư. Trong quá trình tham gia tổ chức LF AI & Data, các kỹ sư công nghệ giàu kinh nghiệm của OPPO là Liam Zheng và Tiến sĩ Jia Jimin sẽ lần lượt là đại diện của ban quản trị và đại diện của ban cố vấn kỹ thuật, phối hợp chặt chẽ với các thành viên khác của LF AI & Data để tìm ra các ứng dụng tốt nhất của các công cụ nguồn mở trong lĩnh vực sản xuất.

OPPO luôn xem trọng sự cởi mở, hợp tác cũng như luôn hướng đến những đổi mới, để nhờ đó mang lại nhiều công nghệ tiên tiến hơn nữa cho con người. Vào tháng 6 năm 2020, OPPO trở thành thành viên bạch kim đầu tiên của OpenChain - một dự án bảo trợ của tổ chức Linux Foundation - nhằm xây dựng một hệ sinh thái nguồn mở toàn cầu bằng cách trở thành một trong những công ty đầu tiên phát triển các tiêu chuẩn ISO về nguồn mở. Trong sự kiện OPPO ODC 2020 vào tháng 10, hệ điều hành ColorOS đã mở mã nguồn bảy công cụ cấp hệ thống cho các lập trình viên và đối tác, với hy vọng tạo ra một hệ sinh thái cởi mở và hợp tác, qua đó cải thiện hơn nữa trải nghiệm người dùng.

Với mục tiêu xây dựng hệ sinh thái riêng, OPPO đang nỗ lực tìm kiếm một hệ sinh thái mở và tích hợp để không chỉ mang lại lợi ích cho mỗi cá nhân mà còn nâng cao chất lượng sống của tất cả mọi người, đem đến trải nghiệm thông minh hoàn toàn mới. Trong tương lai, OPPO sẽ tiếp tục gắn kết sâu hơn với cộng đồng nguồn mở toàn cầu để phát triển bền vững và áp dụng hàng loạt các công nghệ tiên tiến.
 
Bên trên