ChatGPT và những vấn đề về quyền riêng tư dữ liệu

SkylerNew

Chuyên viên tin tức
Thành viên BQT
ChatGPT đang “gây bão” trên toàn thế giới. Trong vòng hai tháng kể từ khi phát hành, ứng dụng dựa trên Trí tuệ nhân tạo (AI) này đã ghi nhận 100 triệu người dùng hoạt động tích cực, đưa ChatGPT trở thành ứng dụng có tốc độ phát triển nhanh nhất từng được tung ra.

Người dùng bị thu hút bởi các khả năng nâng cao của ChatGPT - đồng thời cũng lo ngại về khả năng gây ra gián đoạn trong các lĩnh vực khác nhau của công cụ này.

Song giới quan sát lưu ý rằng có một vấn đề chưa được thảo luận nhiều: những rủi ro về quyền riêng tư mà ChatGPT gây ra cho mỗi người dùng Internet - được thúc đẩy bởi chính dữ liệu cá nhân của họ.

photo1676534099321-16765340994111568224660-1676537067364-1676537067596978095068.jpg

Biểu tượng công cụ ChatGPT do công ty OpenAI phát triển. Ảnh: AFP/TTXVN
300 tỷ từ: Của ai và cho ai?

ChatGPT dựa trên một mô hình ngôn ngữ lớn đòi hỏi lượng dữ liệu khổng lồ để vận hành và tự cải thiện. Mô hình được huấn luyện trên càng nhiều dữ liệu thì càng có khả năng phát hiện các mẫu tốt hơn, dự đoán điều gì sẽ xảy ra tiếp theo và tạo ra văn bản hợp lý.

OpenAI, công ty đứng sau ChatGPT, đã cung cấp cho công cụ này khoảng 300 tỷ từ được thu thập một cách có hệ thống từ Internet: sách, bài báo, trang web và bài đăng - bao gồm cả thông tin cá nhân thu được mà không có sự đồng ý của người dùng.

Nếu bạn từng viết một bài đăng trên blog, đánh giá sản phẩm hay nhận xét về một bài báo trực tuyến, rất có thể thông tin này đã được ChatGPT sử dụng.

Vì sao đó là một vấn đề?

Đầu tiên, không ai trong số người dùng Internet được OpenAI xin phép sử dụng dữ liệu của họ. Đây rõ ràng là hành vi vi phạm quyền riêng tư, đặc biệt khi những dữ liệu nhạy cảm có thể được sử dụng để nhận dạng người dùng, thành viên gia đình hoặc vị trí của họ.

Ngay cả đối với những dữ liệu được công khai, việc OpenAI sử dụng chúng vẫn có thể vi phạm cái được gọi là tính toàn vẹn của văn bản. Đây là một nguyên tắc cơ bản trong các cuộc thảo luận pháp lý về quyền riêng tư, theo đó thông tin của các cá nhân không được tiết lộ bên ngoài bối cảnh gốc của chúng.

Ngoài ra, OpenAI không cung cấp bất cứ quy trình nào cho phép các cá nhân kiểm tra xem công ty có lưu trữ thông tin riêng tư của họ không, hay yêu cầu xóa những dữ liệu đó. “Quyền được lãng quên” này đặc biệt quan trọng trong trường hợp thông tin không chính xác hoặc gây hiểu lầm, và nó được đảm bảo theo Quy định bảo vệ dữ liệu chung của châu Âu (GDPR). Thậm chí, đang có những tranh luận về việc liệu ChatGPT có tuân thủ các yêu cầu của GDPR hay không.

Ngoài ra, những dữ liệu được OpenAI khai thác để đào tạo ChatGPT có thể là tài sản độc quyền hoặc có bản quyền như các cuốn tiểu thuyết, kịch bản phim, thơ văn, tài liệu nghiên cứu... ChatGPT không xem xét việc bảo vệ bản quyền khi tạo nội dung đầu ra, khiến bất kỳ ai sử dụng kết quả do ứng dụng này cung cấp đều có thể vô tình đạo văn.

Cuối cùng, OpenAI không trả tiền cho những dữ liệu họ thu thập được từ Internet. Các cá nhân, chủ sở hữu trang web và công ty sản xuất những nội dung, dữ liệu này không được chi trả xứng đáng. Điều này đặc biệt đáng chú ý khi OpenAI gần đây vừa công bố ChatGPT Plus, gói đăng ký trả phí sẽ cung cấp cho khách hàng quyền truy cập liên tục vào công cụ, với thời gian phản hồi nhanh hơn và ưu tiên tiếp cận các tính năng mới. Kế hoạch này dự kiến sẽ đóng góp doanh thu 1 tỷ USD cho OpenAI vào năm 2024.

Chính sách bảo mật mong manh

Một rủi ro khác về quyền riêng tư liên quan đến dữ liệu được cung cấp cho ChatGPT là dưới dạng yêu cầu của người dùng. Khi một người yêu cầu công cụ này trả lời các câu hỏi hoặc thực hiện các tác vụ nhất định, họ có thể vô tình chuyển giao các thông tin nhạy cảm và đưa chúng vào phạm vi tiếp cận công cộng.

Chẳng hạn, một luật sư có thể yêu cầu ChatGPT xem lại bản thảo thỏa thuận ly hôn, hoặc một lập trình viên có thể yêu cầu công cụ kiểm tra một đoạn mã. Thỏa thuận và đoạn mã - cùng với kết quả được xuất ra - sẽ thành một phần trong cơ sở dữ liệu của ChatGPT. Điều này đồng nghĩa chúng có thể được sử dụng để đào tạo thêm công cụ và được đưa vào phản hồi yêu cầu của người khác.

Ngoài điều này, OpenAI còn thu thập nhiều loại thông tin người dùng khác. Theo chính sách quyền riêng tư của công ty, ChatGPT cũng thu thập địa chỉ IP của người dùng, loại trình duyệt và cài đặt, cũng như dữ liệu về tương tác của người dùng với trang web - bao gồm loại nội dung mà người dùng tương tác, tính năng họ sử dụng và hành động họ thực hiện.

ChatGPT cũng thu thập thông tin về các hoạt động duyệt web của người dùng theo thời gian và trên các trang web khác nhau. Đáng báo động hơn, OpenAI có thể chia sẻ thông tin cá nhân của người dùng với các bên thứ ba không xác định mà không cần thông báo để đáp ứng các mục tiêu kinh doanh của họ.

Một số chuyên gia tin rằng ChatGPT là điểm bước ngoặt của AI - sự hiện thực hóa những thành tựu công nghệ để cách mạng hóa phương thức làm việc, học tập, viết và thậm chí là suy nghĩ của con người. Bất chấp những lợi ích tiềm năng của ChatGPT, cần nhớ rằng OpenAI là một công ty tư nhân hoạt động vì lợi nhuận. Lợi ích và mục tiêu thương mại của họ không nhất thiết phù hợp với nhu cầu chung của xã hội.

Các rủi ro về quyền riêng tư đi kèm với ChatGPT sẽ là một cảnh báo cho thế giới. Và với tư cách là những người tiêu dùng ngày càng nhiều công nghệ AI, chúng ta nên cực kỳ cẩn thận về những thông tin mình chia sẻ với những công cụ như vậy.

Theo Genk​
 
Bên trên