
Theo Reuters:
“Google đã bị kiện vào thứ Ba, ngày 2 tháng 6, trong một vụ kiện tập thể cáo buộc công ty tìm kiếm trên Internet này xâm phạm quyền riêng tư của hàng triệu người dùng bằng cách theo dõi hoạt động duyệt web của họ thông qua các trình duyệt được thiết lập ở chế độ ‘riêng tư’ (Incognito).”
Vụ kiện này yêu cầu Alphabet Inc (công ty mẹ của Google) bồi thường ít nhất 5 tỷ đô la Mỹ, cáo buộc Google bí mật thu thập thông tin về những gì người dùng xem trực tuyến và họ truy cập trang nào, ngay cả khi họ sử dụng chế độ mà Google gọi là “Incognito mode”.
Theo đơn kiện được đệ trình lên tòa án liên bang tại San Jose, California, Google thu thập dữ liệu thông qua Google Analytics, Google Ad Manager và các ứng dụng và plug-in trang web khác, bao gồm cả các ứng dụng di động, bất kể người dùng có nhấp vào các quảng cáo do Google hỗ trợ hay không. Điều này giúp Google tìm hiểu về bạn bè, sở thích, thực phẩm yêu thích, thói quen mua sắm, và thậm chí cả những điều “thân mật và có thể gây xấu hổ nhất” mà người dùng tìm kiếm trực tuyến, theo đơn kiện.
Chúng tôi – những người làm tiếp thị – từ lâu đã nghi ngờ rằng Google sử dụng các đoạn mã (script) của Google Analytics và các ứng dụng khác để hiểu rõ hành vi của người dùng và tối ưu hóa các thuật toán. Tuy nhiên, cáo buộc này nhắm đến một vấn đề đã tồn tại từ lâu: sự hiểu lầm về cách hoạt động của chế độ trình duyệt ẩn danh (Incognito mode).
Từ đơn kiện tập thể:
“Như được đề cập chi tiết bên dưới, Google theo dõi và thu thập lịch sử duyệt web và các dữ liệu hoạt động web khác của người tiêu dùng cho dù họ có thực hiện các biện pháp bảo vệ quyền riêng tư dữ liệu đến đâu. Thậm chí, ngay cả khi người dùng khởi chạy trình duyệt web với chế độ ‘duyệt web riêng tư’ được kích hoạt (như Google đề xuất cho những người muốn duyệt web một cách riêng tư), Google vẫn theo dõi dữ liệu duyệt web và các thông tin nhận dạng khác của họ.”
Điều này không có gì mới. Chế độ duyệt web ẩn danh chưa bao giờ làm những gì mà người dùng nghĩ rằng nó sẽ làm. 40% người dùng nghĩ rằng chế độ ẩn danh ngăn các trang web và các bên thứ ba theo dõi họ. Nhưng sự thật không phải vậy. Bạn không hề ẩn danh. Chế độ ẩn danh chỉ đơn giản là không lưu lại cookie khi kết thúc phiên làm việc. Nó xóa dữ liệu phiên duyệt web trong trình duyệt của bạn khi bạn đóng cửa sổ, nhưng bạn vẫn hoàn toàn có thể bị theo dõi. Theo ZDNet, Google đã hứa sẽ khắc phục vấn đề này vào năm 2019 nhưng vẫn chưa làm được. Một số trang web thậm chí còn chặn người dùng truy cập từ chế độ ẩn danh.
Đối với Google, có rất nhiều cách để theo dõi người dùng:
- Đoạn mã theo dõi của Google Analytics được cài trên các trang web
- Nút đăng nhập Google Sign-in
- Google Ad Manager
- Nhiều ứng dụng và plug-in khác
Theo đơn kiện:
“Google thực hiện việc theo dõi bí mật này thông qua các phương tiện như Google Analytics, Google Ad Manager và các ứng dụng và plug-in trang web khác, chẳng hạn như các ứng dụng của Google trên thiết bị di động và nút ‘Google Sign-In’ cho các trang web. Khi một người dùng truy cập vào một trang web hoặc mở một ứng dụng có sử dụng những dịch vụ này (hơn 70% tất cả các nhà xuất bản trực tuyến đều sử dụng một trong số đó), Google sẽ nhận được các thông tin chi tiết, cá nhân như địa chỉ IP của người dùng (có thể cung cấp thông tin về vị trí địa lý), những gì người dùng đang xem, những gì họ đã xem trước đó và thông tin chi tiết về phần cứng của người dùng.”
Vấn đề ở đây – và cũng là lý do Google bị kiện – là mọi người không hiểu rõ cách chế độ ẩn danh hoạt động (cuộc khảo sát tôi đã trích dẫn ở trên là minh chứng) và Google tạo ra một hình ảnh sai lệch về thực tế.
Google tuyên bố trong tài liệu của mình:
“Các lượt tìm kiếm hoặc truy cập sẽ không được lưu trên thiết bị của người dùng, nhưng không đề cập rằng người dùng vẫn có thể bị theo dõi.”
Rõ ràng, sẽ rất thú vị để xem vụ kiện tập thể này sẽ diễn ra như thế nào. Tuy nhiên, điều này lại gợi nhắc chúng ta về câu hỏi cũ rằng: Google biết nhiều đến mức nào về bạn? Và câu trả lời là: rất nhiều.
Cách tốt nhất để tự mình kiểm chứng điều này là truy cập vào hồ sơ “Google My Activity” để xem các thông tin mà Google lưu trữ.
Ngoài ra, còn có một phần mang tên “more activity” (hoạt động khác). Nó được ẩn khá kỹ (có lý do cả), nhưng tại trang này, bạn có thể thấy tất cả các nguồn dữ liệu khác mà Google đang theo dõi, chẳng hạn như Youtube, Play Store, Maps, v.v.
Điều này liên quan khá chặt chẽ đến một bằng sáng chế về User-sensitive PageRank mà tôi đã đề cập trong bài viết về việc Prabhakar Raghavan được bổ nhiệm làm người đứng đầu mảng Tìm kiếm.
Ý tưởng của Authority Value (Giá trị Thẩm quyền) là kết hợp dữ liệu hành vi người dùng với các mô hình PageRank cổ điển.
Nếu Google có thể theo dõi chính xác các tìm kiếm và dữ liệu khác của chúng ta, tôi cho rằng họ có thể tạo ra một hồ sơ người dùng cho phép họ hiểu được mức độ chuyên môn của người đó trong một lĩnh vực. Kết quả là, có lẽ một số lượt truy cập nhất định sẽ được coi là quan trọng hơn những lượt truy cập khác?
Dù sao đi nữa, tôi kỳ vọng rằng việc Google theo dõi trên nhiều nền tảng khác nhau sẽ gia tăng và tác động đến kết quả tìm kiếm tự nhiên (organic search) theo thời gian. Tôi sẽ đăng một bài viết đầy đủ về chủ đề này, mà tôi gọi là “platform confluence” (sự hợp nhất nền tảng), vào thứ Hai tới.