Khi bạn online, nhiều người có thể biết bạn là ai, bạn ở đâu, bạn đang làm gì... Làm sao để biết các thành phần theo dõi và cơ chế hoạt động của chúng? Hiểu biết các yếu tố sau đây có thể giúp bạn hạn chế rủi ro khi trực tuyến.
* Địa chỉ IP
Cách cơ bản nhất để xác định bạn là địa chỉ IP của bạn. Địa chỉ IP xác nhận bạn đang trên Internet. Từ địa chỉ IP, một trang web có thể xác định vị trí địa lý của bạn. Và qua vài công cụ khác họ có thể biết ngay thành phố, nơi bạn đang sống, khu vực, con đường, thậm chí ngôi nhà của bạn.
Địa chỉ IP có thể thay đổi và thường được nhiều người sử dụng. Do đó, đây chỉ là cách tốt nhất để theo dõi một người trong một khoảng thời gian ngắn.
* Cookie và Script
Cookie là những tập tin nhỏ của các trang thông tin có thể lưu trữ trong máy thông qua trình duyệt web. Chúng có nhiều cách để thâm nhập hợp pháp - ví dụ, khi bạn đăng nhập vào trang web của ngân hàng trực tuyến, một cookie sẽ nhớ thông tin đăng nhập của bạn. Khi bạn thay đổi một thiết lập trên web, cookie cũng sẽ lưu lại sự thay đổi đó, để nó có thể tồn tại và phù hợp với các phiên duyệt web của bạn.
Cookie có thể xác định và theo dõi hoạt động duyệt web của bạn. Một trang web có thể muốn biết những gì người dùng truy cập, thói quen truy cập, lịch sử duyệt web... để tinh chỉnh cho đúng nhu cầu người dùng. Điều nguy hại là các cookie của bên thứ 3, chúng thường sử dụng các trang quảng cáo để theo dõi thông qua nhiều trang web. Nếu có hai trang web khác nhau có cùng một quảng cáo và cùng kịch bản theo dõi, thì lịch sử duyệt web trên cả hai trang có thể được liên kết lại với nhau.
Ngoài ra, các Script từ các trang mạng xã hội cũng có thể hoạt động như một kịch bản theo dõi. Ví dụ, nếu bạn đăng nhập vào Facebook và bạn ghé thăm một trang web (cũng trên Facebook) có nút “Like”, Facebook sẽ biết bạn truy cập vào trang web đó, nó sẽ lưu trữ một cookie để lưu trạng thái đăng nhập của bạn. Vì vậy, các nút Like trên trang web khác trong Facebook (thực sự là một phần của Script), dựa vào thông tin cá nhân của bạn ở Facebook sẽ biết bạn là ai.
* Siêu cookie
Bạn có thể xóa cookie của trình duyệt, nhưng đó chưa phải là giải pháp tốt để không bị theo dõi, trong khi các siêu cookie ngày càng phổ biến. Các siêu cookie là gì? Đó là các evercookie (một javascript API). Chúng làm việc bằng cách lưu trữ dữ liệu cookie dựa trên cơ chế lưu trữ của trình duyệt. Mục tiêu của evercookie là xác định người dùng sau khi gỡ bỏ các cookie, flash cookie... có thể phục hồi và tái sử dụng.
Làm sao để ngăn chặn các trang web làm điều này vẫn là một câu hỏi lớn. Cho đến nay, chưa có cách khắc phục, ngoại trừ sử dụng chức năng bảo mật trong trình duyệt Safari để dừng các evercookie sau khi khởi động lại trình duyệt.
* HTTP “giới thiệu”
Khi bạn nhấp vào một liên kết, trình duyệt sẽ tải trang bạn nhấp và “nói” với website bạn đến từ đâu. Ví dụ, nếu bạn nhấp vào liên kết từ Yahoo.com, trang web bên ngoài đó sẽ “thấy” bạn đến từ Yahoo.com. Thông tin này được chứa trong tiêu đề do HTTP chuyển đến.
HTTP cũng gởi nội dung khi tải một trang web. Ví dụ, nếu một trang web có quảng cáo hay một Script theo dõi, trình duyệt của bạn sẽ cho các nhà quảng cáo hoặc các mạng theo dõi biết nội dung trang web bạn đang xem.
* User Agent
Một User Agent là một chuỗi (string - một dòng văn bản) xác định tên trình duyệt, hệ điều hành của người sử dụng với máy chủ của web. Ví dụ, khi bạn kết nối một trang web, User Agent sẽ nói với máy chủ của trang web đó rằng “Xin chào! tôi là Mozilla Firefox trên Windows” hoặc “Chào, tôi là Safari trên Ubuntu”...
Điều này nghe có vẻ đơn giản, nhưng các thông tin về User Agent trở thành một mớ hỗn độn theo thời gian. Các chủ web sẽ thu thập, sắp xếp thông tin này lại và có thể sử dụng phục vụ cho các mục đích không lành mạnh. Ví dụ, yêu cầu người dùng xem trang web bằng một trình duyệt khác, là Internet Explorer chẳng hạn. Ngoài ra, họ cũng có thể thống kê các thông tin đó để bán lại cho các nhà sản xuất phần mềm hoặc nhà cung cấp dịch vụ.
* Browser Fingerprinting
Nếu bạn nghĩ rằng, vô hiệu hóa các cookie, các script, ẩn danh khi online... sẽ không bị theo dõi là hoàn toàn sai lầm. Các plug-in (tiện ích bổ sung) trên trình duyệt, phông chữ hệ thống, độ phân giải màn hình, múi giờ cài đặt trong hệ thống của bạn... cũng có thể tạo thành “dấu vân tay” cho trình duyệt, và chủ web có thể dùng nó để nhận diện bạn.
Trình duyệt web rõ ràng là “mảnh đất” màu mỡ để khai thác thông tin. Vì vậy, bạn cần đề cao cảnh giác khi trực tuyến, cũng như hạn chế cung cấp thông tin khi không cần thiết.
HOÀNG THY