Facebook dạy AI bằng hàng tỷ ảnh Instagram
Dữ liệu hình ảnh gắn hashtag mà người dùng chia sẻ lên Instagram được Facebook sử dụng cho việc đào tạo khả năng nhận dạng của trí tuệ nhân tạo.
Hashtag là tính năng không xa lạ với người dùng mạng xã hội. Đây là từ hay chuỗi các ký tự viết liền nhau và được đặt sau dấu thăng (#), giúp nội dung chia sẻ dễ dàng tiếp cận với những người quan tâm thông qua công cụ tìm kiếm. Tuy nhiên, hashtag còn có chức năng khác liên quan đến trí tuệ nhân tạo mà Facebook đang ứng dụng thông qua kho ảnh khổng lồ trên Instagram.
Facebook dùng ảnh Instagram được chia sẻ công khai cho AI. |
Tại Hội nghị F8, đại diện Facebook cho biết những hình ảnh gắn hashtag được người dùng chia sẻ công khai (public) sẽ được mạng xã hội sử dụng để đào tạo AI nhận dạng thông qua hệ thống gồm hàng trăm GPU chạy liên tục để phân tích.
"Bằng cách sử dụng ảnh Instagram có hashtag, Facebook có thể thu thập dữ liệu có liên quan và sử dụng nó để luyện cho AI nhận biết nhanh nội dung, chủ thể trong ảnh", Mike Schroepfer, Giám đốc công nghệ của Facebook, cho biết.
Facebook đã thử nghiệm trên 3,5 tỷ ảnh và 17.000 hashtag của Instagram cho hệ thống nhận dạng máy học và Deep Learning. Kết quả, khả năng nhận dạng của hệ thống đạt độ chính xác lên tới 85,4% trên bài kiểm tra ImageNet.
Trước lo ngại dữ liệu người dùng bị khai thác sai mục đích, Schroepfer cho biết họ chỉ sử dụng các hình ảnh công khai, không dùng để quảng cáo hay phục vụ các mục đích khác.
Theo ông, thuật toán sau khi hoàn thiện sẽ giúp phát hiện nhanh những hình ảnh vi phạm điều khoản bạo lực, khỏa thân hay lừa đảo… cũng như giảm nhân lực kiểm duyệt. Đây cũng là một trong những nỗ lực bảo vệ dữ liệu người dùng sau bê bối rò rỉ dữ liệu hồi đầu năm khiến CEO Mark Zuckerberg phải ra điều trần trước Quốc hội Mỹ giữa tháng 4 vừa qua.
Bảo Lâm