DeepMind muốn dạy AI chơi trò còn khó hơn cả cờ vây

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Hanabi là trò chơi bài dựa trên lý thuyết trí tuệ với mức độ lý luận cao hơn cờ vây và cờ vua. Đây là trò mà các nhà nghiên cứu thuộc hãng trí tuệ nhân tạo (AI) DeepMind muốn dạy cho máy móc.
playinghanabi_ahoe.jpg


Theo MIT Technology Review, nếu bạn từng chơi bài Hanabi, bạn sẽ hiểu rằng nó không giống như bất cứ trò nào khác. Đây là dạng trò chơi hợp tác, nơi người chơi có cái nhìn đầy đủ về lá bài mà người khác giữ chứ không phải lá bài mà mình nắm.

Để thắng, mỗi người chơi phải đưa ra gợi ý về các lá bài mà mình đang cầm cho người khác theo số vòng giới hạn, nhằm sắp xếp tất cả lá bài theo thứ tự cụ thể. Đây là bài tập cường độ cao về chiến lược, suy luận và sự hợp tác. Đó cũng là lý do vì sao các nhà nghiên cứu thuộc Google Brain và DeepMind cho rằng Hanabi là trò chơi hoàn hảo kế tiếp để AI thử sức.
Trong nghiên cứu mới, họ lập luận rằng không giống các trò chơi khác mà AI từng thành thạo (chẳng hạn như cờ vua, cờ vây và poker), Hanabi đòi hỏi lý thuyết về tâm trí và trình độ lý luận cao. Lý thuyết về tâm trí là việc hiểu trạng thái tinh thần của người khác, hiểu rằng tâm trí, tinh thần họ có thể không giống như của bạn. Đây là kỹ năng nền tảng mà loài người dùng để sống, cũng là kỹ năng mà con người thường lãnh hội được từ lúc còn rất trẻ.
gettyimages-515037426_wide-393a81712ea66a3641b18931774667a7f1d12902-s800-c85_tslc.jpg


Thông tin trong Hanabi được giới hạn bởi số lượng gợi ý dành cho người chơi trong mỗi trò chơi và những gì có thể được truyền đạt trong mỗi gợi ý. Vì thế, nhân tố AI phải thu thập thông tin ngầm từ những người chơi khác để thắng trò này. Đây là thách thức mà nó chưa từng đối mặt.

Ngoài ra, thuật toán AI cũng phải học cách cung cấp thông tin sẵn có tối đa trong các gợi ý và hành động của mình để giúp những người chơi khác thành công. Giới nghiên cứu tin rằng nếu một tác nhân AI thành công được trong môi trường thông tin thiếu hoàn hảo như thế, nó sẽ tiến thêm một bước đến việc hợp tác hiệu quả với con người.

Những chi tiết kể trên là thách thức rất mới mẻ với cộng đồng nghiên cứu, đòi hỏi nhiều tiến bộ thuật toán mới để liên kết nhiều mảng nhỏ trong lĩnh vực AI, trong đó có lý thuyết trò chơi, học tập củng cố và giao tiếp rõ ràng. Để xác nhận giả thuyết, nhóm nhà nghiên cứu Google thử nghiệm tất cả các thuật toán học tăng cường hiện đại nhất và nhận ra rằng chúng còn hoạt động kém. Để cải thiện, họ tung môi trường Hanabi nguồn mở để thúc đẩy tác vụ cho cộng đồng nghiên cứu.

“Với tư cách nhà nghiên cứu, tôi bị mê hoặc bởi hướng các yếu tố AI học cách giao tiếp và hợp tác với nhau và cuối cùng là với con người. Hanabi thể hiện cơ hội độc nhất cho thử thách lớn trong mảng này”, Jakob Foerster, đồng tác giả nghiên cứu cho hay.

Theo Thanh Niên​
 
Bên trên