Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo

SkylerNew

Chuyên viên tin tức
Thành viên BQT
Vào tháng 3 năm 2021, trong năm thứ ba học tại một trường dạy nghề ở tỉnh Sơn Đông, Lucy làm thực tập sinh tại một trung tâm gán nhãn dữ liệu. Trong bốn tháng, cô dành tám tiếng một ngày ngồi trong văn phòng, phân loại các tệp âm thanh, gắn thẻ hình ảnh của trẻ em trên hình ảnh camera giám sát, và phân biệt cây cối với người đi bộ trong các video được sử dụng để phát triển hệ thống lái xe tự động. Cô ở trong một ký túc xá bốn người do công ty cung cấp, và kiếm được hơn 1.000 nhân dân tệ (137 đô la) một tháng - khoảng 80% của mức lương tối thiểu địa phương - chỉ đủ để chi trả cho các chi phí sinh hoạt hàng ngày.

Khi Lucy nhập học chương trình khoa học máy tính của trường, cô nghĩ rằng cô sẽ học lập trình và trở thành một lập trình viên. Nhưng thực tế, công việc của cô không khác gì một công việc trên dây chuyền sản xuất. “Nó rất nhàm chán. Chúng tôi không học được gì cả,” Lucy nói với Rest of World, nói dưới một bí danh để tránh bị nhận diện. Nhưng trường yêu cầu cả lớp hoàn thành thực tập, nếu không họ sẽ không được phép tốt nghiệp.

655360_141218525113284_2117281437974528

Lucy là một phần của tầng lớp kỹ thuật số mới của Trung Quốc - một trong hàng trăm nghìn người gán nhãn dữ liệu đang thúc đẩy ngành công nghiệp trí tuệ nhân tạo đang bùng nổ của quốc gia. Những người gán nhãn dữ liệu này gắn nhãn cho khối lượng lớn dữ liệu thô - gắn thẻ hình ảnh của xe hơi, lọc video có nội dung bạo lực, và lọc âm thanh theo từ khóa - để huấn luyện các mô hình học máy. Lao động của họ, thường bị trả lương thấp và bị bỏ qua, là rất quan trọng cho sự phát triển của các ứng dụng trí tuệ nhân tạo mới - từ chatbot thông minh đến xe tự lái.

Trong những năm gần đây, các công ty gán nhãn dữ liệu của Trung Quốc đã hợp tác với các trường dạy nghề, tuyển dụng sinh viên thực tập để làm công việc này - thường với mức lương thấp hơn mức lương tối thiểu và trong điều kiện kém - để hoàn thành yêu cầu tốt nghiệp, một cuộc điều tra của Rest of World đã phát hiện ra. Các quy định mới được Bộ Giáo dục ban hành vào tháng 1 năm 2022 yêu cầu các nhà tuyển dụng phải trả lương tối thiểu cho thực tập sinh, và cấm các trường học nhận hoa hồng. Họ cũng cấm các cơ sở giáo dục cho sinh viên làm “công việc đơn giản, lặp đi lặp lại”. Theo những nguyên tắc này, một số thực tập gán nhãn dữ liệu có thể bị coi là vi phạm.

Tại Trung Quốc, sinh viên trường dạy nghề bắt buộc phải thực tập, đây là nguồn lao động rẻ tiền đã phục vụ lâu nay cho các nhà máy, trung tâm cuộc gọi, công ty kiểm duyệt nội dung và công viên giải trí. Sinh viên theo học các chương trình trường dạy nghề có tên là “Khoa học máy tính”, “Dữ liệu lớn” “Trí tuệ nhân tạo” bây giờ đảm nhận những công việc ít lương nhất trong ngành công nghiệp trí tuệ nhân tạo đầy tiềm năng của Trung Quốc, theo các báo cáo công khai và phỏng vấn với sinh viên, nhà cung cấp dữ liệu, nhân viên trường dạy nghề, một công ty tuyển dụng và các nhà nghiên cứu lao động.

Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo
Mặc dù các trường dạy nghề quảng cáo thực tập gán nhãn dữ liệu là một cách để sinh viên cải thiện triển vọng nghề nghiệp và học được kỹ năng liên quan đến trí tuệ nhân tạo, nhưng nhiều sinh viên cho biết công việc này có vẻ giống hơn một hình thức lao động chân tay, Xia Bingqing, một nhà nghiên cứu tại Đại học Sư phạm Đông Trung Quốc, cho biết với Rest of World. Xia đã phỏng vấn các sinh viên thực tập trong ngành này từ năm 2018 đến 2019. Một số trong số họ không được trả lương, trong khi những người khác được trả theo số lượng dữ liệu họ xử lý - ví dụ, 0,2 nhân dân tệ (ba xu) cho mỗi “khung giới hạn” họ sử dụng để gắn nhãn một hình ảnh.

Một sinh viên tốt nghiệp trường dạy nghề ở miền nam Trung Quốc, nói với Rest of World dưới điều kiện giấu tên, cho biết cô đã đăng ký vào một chương trình lái xe tự động cho thời gian thực tập của mình. Cô nói cô đã dành học kỳ cuối của mình để vẽ các khung giới hạn trên những đoạn phim đường phố cho một nhà sản xuất ô tô, làm việc 60 giờ một tuần với khoảng 500 đô la một tháng. Các bạn cùng lớp của cô đã thực tập ở một dịch vụ sửa chữa ô tô có trải nghiệm tốt hơn cô, cô nói, và cô hối tiếc khi nộp đơn xin thực tập. “Bạn học được nhiều hơn bằng cách sửa chữa xe hơn là vẽ hộp,” cô nói.

Trên toàn thế giới, các công ty công nghệ đã thuê ngoài công việc gán nhãn dữ liệu cho các nước đang phát triển ở Châu Phi và Đông Nam Á. Tại Trung Quốc, các công ty đã xây dựng các trung tâm gán nhãn ở các vùng nội địa nghèo hơn, thường được sự hậu thuẫn của chính quyền địa phương mong muốn thu hút đầu tư và tăng tỷ lệ việc làm.

Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo
Nhiều tập đoàn công nghệ lớn của Trung Quốc đã hợp tác với các trường dạy nghề ở những vùng kém phát triển hơn để tạo ra các chương trình thực tập gán nhãn dữ liệu. Vào tháng Ba năm ngoái, ông lớn tìm kiếm Baidu đã thành lập một trung tâm gán nhãn với một trường dạy nghề ở Jiuquan, Gansu, một trong những tỉnh nghèo nhất của Trung Quốc. Công ty nhận được 30 triệu nhân dân tệ (4,1 triệu đô la) từ chính quyền thành phố địa phương. Theo một bài đăng của một sinh viên thực tập trên bảng tin trực tuyến của thị trưởng Jiuquan vào năm 2022, trường đã bắt buộc hơn 160 sinh viên gán nhãn dữ liệu cho Baidu, nếu không họ sẽ không nhận được bằng.

Trong một email trả lời Rest of World, Baidu cho biết họ không biết về tình hình này. Công ty cho biết họ ưu tiên quyền lao động và “nhân phẩm của nhân viên”, và kêu gọi các nhà cung cấp dịch vụ của họ cũng làm như vậy.

Công ty gán nhãn dữ liệu có trụ sở ở Guizhou là Mengdong đã làm việc với các ông lớn công nghệ như Baidu, Alibaba và JD.com. Người sáng lập công ty cũng điều hành một trường dạy nghề có tên là Forerunner College. Năm 2021, Mengdong đã thuê 1.461 sinh viên, tạo ra doanh thu hơn 19 triệu nhân dân tệ (2,6 triệu đô la), theo một báo cáo của truyền thông nhà nước. “Đi học có nghĩa là đi làm. Giáo viên của họ là người quản lý của họ,” Hu Dingxiang, một giáo viên cũng làm việc cho Mengdong, nói. Công ty cho biết sinh viên được trả lương, và sinh viên nông thôn có thể giảm bớt học phí bằng cách làm việc.

Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo
Các quản lý tại các công ty gán nhãn dữ liệu ở ba vùng khác nhau cho biết với Rest of World rằng các công ty sử dụng sinh viên thực tập vì họ có thể trả ít hơn, và không cần phải trả tiền bảo hiểm xã hội cho họ. Hai trong số họ nói rằng các trường thường nhận hoa hồng. Một nhà tuyển dụng tại một công ty cung ứng nhân lực ở Giang Tô nói rằng khoản cắt giảm có thể lên đến 50% lương của sinh viên. Một chủ sở hữu công ty gán nhãn nói rằng ông thuê sinh viên qua các cổng việc làm trực tuyến, và không trả hoa hồng cho các trường.

Một quản lý công ty dữ liệu, yêu cầu giấu tên vì sợ bị nhận diện bởi những người khác trong ngành, cho biết với Rest of World rằng 60% người gán nhãn của công ty ông là sinh viên trường dạy nghề. Họ làm việc tám tiếng một ngày, sáu ngày một tuần, trong hơn sáu tháng - và được trả 3000 đến 4000 nhân dân tệ (409-545 đô la) một tháng, trong đó các trường cắt giảm 600 đến 1000 nhân dân tệ (82-136 đô la), ông nói. Một chủ doanh nghiệp khác, cũng yêu cầu giấu tên, ước tính sinh viên thực tập chiếm 20% đến 30% lực lượng lao động gán nhãn dữ liệu của Trung Quốc.

Một quan chức của một trường dạy nghề ở tỉnh Chiết Giang cho biết với Rest of World rằng sinh viên của họ làm thực tập cho một công ty gán nhãn dữ liệu có trụ sở ở Thâm Quyến, gán nhãn các bài toán toán học viết tay để huấn luyện một chương trình trí tuệ nhân tạo giúp học sinh làm bài tập về nhà. Quan chức này, yêu cầu giấu tên vì sợ hậu quả, cho biết sinh viên được trả 0,32 đến 0,38 nhân dân tệ (4 đến 5 xu) cho mỗi lần gán nhãn. Mỗi ngày, sinh viên được xếp hạng theo số lượng dữ liệu họ xử lý. Trường đã ngừng chương trình này vào năm 2021 vì sinh viên phàn nàn về mức lương thấp và làm việc quá sức, quan chức này nói.

Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo

Sinh viên trường dạy nghề ở Trung Quốc, nhiều người trong số đó đến từ các giai cấp thấp và vùng nông thôn, đặc biệt dễ bị lạm dụng lao động. Các trường hợp lạm dụng như vậy và tự tử của sinh viên trong các chương trình thực tập của trường dạy nghề đã gây ra sự phẫn nộ của công chúng trong nước. Sinh viên đã bị ép buộc làm việc cao su, làm những công việc không liên quan đến việc học của họ, và chia sẻ lương của họ với các trường. Xia, nhà nghiên cứu, trích dẫn trường hợp của một sinh viên nữ sống trong ký túc xá cho thời gian thực tập gán nhãn dữ liệu của mình và bị cấm về nhà trong sáu tháng.

Những người gán nhãn dữ liệu làm việc trong lĩnh vực kiểm duyệt nội dung cũng thường phải tiếp xúc với nội dung gây sốc. Theo Ryan, một cựu quản lý tại một công ty gán nhãn dữ liệu ở Chiết Giang, đội ngũ gán nhãn của họ - chủ yếu là sinh viên nữ trường dạy nghề - đã xem lại các bộ dữ liệu từ tháng Tư đến tháng Sáu năm 2020 để huấn luyện hệ thống kiểm duyệt nội dung trí tuệ nhân tạo của ông lớn công nghệ Trung Quốc NetEase. Công việc này liên quan đến việc loại bỏ nội dung bạo lực và khiêu dâm, như ngôn ngữ căm ghét, hình ảnh đẫm máu và ảnh khỏa thân. “Sau một ngày làm việc, bạn chỉ muốn rửa mắt ra,” Ryan nói, yêu cầu sử dụng một bí danh vì sợ hậu quả.

Không có hợp đồng chính thức và kênh để bày tỏ sự bất bình, sinh viên dễ bị khai thác và lạm dụng, chẳng hạn như làm việc nhiều giờ và nguy cơ an toàn, theo Jenny Chan, một nhà xã hội học tại Đại học Bách Khoa Hồng Kông, người đã nghiên cứu về sinh viên thực tập trong ngành sản xuất. “Họ là lao động không tự do,” Chan nói với Rest of World. “Họ có thể nói chuyện với giáo viên của mình về những vấn đề về công việc, nếu giáo viên là người đã gửi họ vào?”

Mặt tối đằng sau những câu trả lời “bá đạo” của AI: lực lượng lao động bị bóc lột dưới đáy ngành công nghiệp trí tuệ nhân tạo

Trong một thị trường việc làm khó khăn với tỷ lệ thất nghiệp thanh niên cao kỷ lục, một số sinh viên trường dạy nghề và đại học tự nguyện nhận làm công việc gán nhãn dữ liệu để tăng cường sơ yếu lý lịch của họ hoặc kiếm thêm tiền để xoay sở.

Xu, một sinh viên chuyên ngành truyền thông từ tỉnh Hà Nam, cho biết với Rest of World rằng cô đã nộp đơn xin thực tập tại công ty trí tuệ nhân tạo iFlytek vào mùa hè này. Cô đã muốn có kinh nghiệm làm việc và thêm một công ty uy tín vào sơ yếu lý lịch của mình, nhưng kết quả lại là gán nhãn dữ liệu để huấn luyện các thiết bị học tập. “Não của tôi cảm thấy cứng và mắt của tôi đau từ việc nhìn vào cùng một thứ trên máy tính cả ngày,” Xu nói, cô ưa thích chỉ sử dụng họ của mình vì sợ bị nhận diện. “Chúng tôi là những người lao động ở đáy của ngành công nghiệp trí tuệ nhân tạo.”

Sau thời gian thực tập, Lucy từ Sơn Đông tiếp tục làm nhân viên cho công ty dữ liệu trong một năm nữa. Cô cuối cùng đã rời khỏi ngành vào năm 2022 vì mức lương quá thấp, và chuyển sang làm việc về tiếp thị tại một công ty internet. Cô nói rằng trong khi công việc gán nhãn đã giúp cô hiểu được ngành công nghiệp trí tuệ nhân tạo, nó không đưa cô gần hơn với công việc mơ ước của mình là một kỹ sư phần mềm. “Nó thậm chí không phải là một bước đệm,” cô nói.

Theo VN review​
 
Bên trên