Mối lo người đào tạo AI lại nhờ AI 'làm hộ'
Phía sau các mô hình AI tạo sinh là đội ngũ lọc và dán nhãn dữ liệu. Ảnh: Business Insider
Đằng sau sự thành công của các mô hình AI tạo sinh như ChatGPT của OpenAI và Bard của Google có sự góp sức của "đội quân dán nhãn". Họ là những người chuyên phân loại, sắp xếp và gắn nhãn cho lượng dữ liệu khổng lồ, từ hình ảnh hộp sữa, tờ giấy cho đến con mèo hay xe hơi, để AI "học". Công việc này thô sơ nhưng đặc biệt quan trọng đối với bất cứ hệ thống AI nào. Họ thường đến từ các nước đang phát triển, làm việc theo ca với mức lương vài USD mỗi giờ.
OpenAI hay Google thường thuê đối tác bên thứ ba để đào tạo AI. Với lượng dữ liệu lớn, đội quân dán nhãn này cần thao tác nhanh, liên tục và chính xác. Tuy nhiên, một khảo sát gần đây cho thấy đội ngũ này đã âm thầm dùng các mô hình AI để đào tạo chính chúng.
Cụ thể, một nhóm chuyên gia từ Viện Công nghệ Liên bang Thụy Sĩ (EPFL) đã thuê 44 người trên nền tảng công việc tự do Mechanical Turk của Amazon tóm tắt 16 đoạn trích từ các tài liệu y học và dán nhãn phân loại chúng. EPFL sau đó thực hiện công việc tương tự qua công cụ AI như ChatGPT để so sánh hiệu quả của cả hai. Bên cạnh đó, nhóm cũng trích xuất số lần gõ phím của nhân công được thuê nhằm phân tích họ có sao chép các câu trả lời hay không.
EPFL sau đó kết luận 33-46% số nhân công đã sử dụng AI như ChatGPT để hoàn thành công việc. Theo EPFL, nghiên cứu cho thấy xu hướng sử dụng mô hình AI để đào tạo chính chúng. "Điều đó không khiến các nền tảng và dịch vụ đào tạo AI sẽ kết thúc. Nhưng nó đang thay đổi cách làm", phó giáo sư Robert West, đại diện nhóm nghiên cứu của EPFL, nhận xét.
Tuy nhiên, giới chuyên gia lo ngại việc sử dụng AI để đào tạo AI có thể khiến các mô hình lỗi càng thêm lỗi vì chúng vốn đang gặp các vấn đề nghiêm trọng, chẳng hạn các câu trả lời sai hoặc bịa đặt nội dung. Ilia Shumailov, nhà nghiên cứu trí tuệ nhân tạo và máy tính tại Đại học Oxford, cho rằng nếu người huấn luyện AI tạo đầu ra không chính xác, sau đó dùng dữ liệu này để đào tạo các mô hình khác sẽ kéo theo toàn bộ chuỗi bị sai.
"Theo thời gian, việc xác định dữ liệu sai sẽ vô cùng khó khăn, thậm chí không có cách nào làm điều đó. Mọi thứ không còn đơn giản và khó có thể khắc phục được", Shumailov cho biết.
Các công cụ như ChatGPT hiện được ứng dụng rộng khắp, trong đó có những lĩnh vực cần đòi hỏi tính chính xác cao như y tế, giáo dục. Theo Technology Review, nếu áp dụng kết quả sai từ AI, hậu quả có thể rất khó lường.
"Tôi không nghĩ mọi thứ sẽ sụp đổ", ông West nói. "Tuy nhiên, tôi nghĩ cộng đồng AI cần xem lại một cách chặt chẽ nhiệm vụ nào có khả năng tự động hóa trong huấn luyện AI và những thứ nào nên ngăn chặn".
Theo vnexpress.net
Tin cùng chuyên mục
- Nokia chuẩn bị triển khai 5G tại Việt Nam 24.09.2024 | 13:58 PM
- Sinh động các chương trình trực tiếp tại Fanpage Báo Tuyên Quang online 03.01.2023 | 08:16 AM
- Thực hiện quy định về chuẩn hóa thông tin thuê bao di động 31.03.2023 | 16:13 PM
- Hưởng ứng ngày Chuyển đổi số quốc gia 10/10Chuyển đổi số vì một cuộc sống tốt đẹp hơn 09.10.2022 | 21:42 PM
- Sở Thông tin và Truyền thông: Diễn tập ứng phó sự cố an toàn thông tin mạng năm 2022 04.10.2022 | 17:30 PM
- Hướng dẫn trẻ em sử dụng mạng internet an toàn và hiệu quả 05.08.2022 | 08:27 AM
- Người dùng nên cập nhật Chrome 92 ngay để vá 9 lỗ hổng nghiêm trọng 21.08.2021 | 15:47 PM
- UBND tỉnh nghe báo cáo dự thảo đề án chuyển đổi số tỉnh Thái Bình giai đoạn 2021 - 2025, định hướng đến năm 2030 21.07.2021 | 19:16 PM
- Thiết bị đầu tiên chuyển suy nghĩ thành câu nói 19.07.2021 | 09:47 AM
- Tại sao không gộp các ứng dụng chống dịch thành một 'super app' 19.07.2021 | 09:48 AM
Xem tin theo ngày
-
Hội thảo khoa học: Đồng chí Nguyễn Văn Linh – Nhà lãnh đạo kiên định, sáng tạo của Đảng và cách mạng Việt Nam
- 26 tập thể, cá nhân tiêu biểu học tập và làm theo tư tưởng, đạo đức, phong cách Hồ Chí Minh giai đoạn 2016 - 2025 được trao thưởng
- Hội nghị Ban Chấp hành Đảng bộ tỉnh Hưng Yên
- Hoàn thành xuất sắc sứ mệnh lịch sử góp phần quan trọng thực hiện thắng lợi các nhiệm vụ chính trị của tỉnh
- Phấn đấu hoàn thành ở mức cao nhất các chỉ tiêu kinh tế - xã hội tạo nền tảng thuận lợi cho tỉnh Thái Bình hợp nhất với tỉnh Hưng Yên cùng đất nước vươn mình
- Bứt phá, vươn lên mạnh mẽ hơn, hướng tới mục tiêu phát triển nhanh, giàu mạnh bền vững và thịnh vượng
- Kỳ họp thứ mười HĐND tỉnh khóa XVII, nhiệm kỳ 2021 – 2026 thông qua nhiều nghị quyết quan trọng và thành công tốt đẹp
- Tăng cường chuyển đổi số để nâng cao hiệu quả công tác kiểm tra, giám sát của Đảng
- Nêu cao tinh thần trách nhiệm, phát huy trí tuệ, đoàn kết, dân chủ, quyết định đúng đắn các vấn đề, góp phần vào thành công của kỳ họp
- Khai mạc trọng thể kỳ họp thứ mười, HĐND tỉnh khóa XVII, nhiệm kỳ 2021 - 2026