Trình duyệt đang làm rò rỉ thông tin cá nhân: Đây là cách ngăn chặn

Có lẽ bạn đã nghe câu nói “nếu bạn không phải là người trả tiền, thì bạn chính là sản phẩm.” Điều này đặc biệt đúng với các dịch vụ web miễn phí. Các nhà quảng cáo và bên môi giới dữ liệu thu thập dữ liệu về nơi bạn truy cập và những gì bạn xem trực tuyến. Họ sử dụng dữ liệu mà trình duyệt của bạn cung cấp miễn phí để tạo ra một dấu vân tay xác định duy nhất bạn. Kết quả là, họ biết bạn đi đâu, bạn nhấp vào gì và bạn mua gì.
Không giống như các kỹ thuật theo dõi khác, việc lấy dấu vân tay trình duyệt không để lại dấu vết và xảy ra mà bạn không hề hay biết trực tiếp. Vậy làm thế nào để bạn bảo vệ quyền riêng tư của mình và tránh bị lấy dấu vân tay?
Dấu vân tay trình duyệt so với Cookies
Khi bạn nhấp vào một liên kết, trình duyệt của bạn sẽ gửi một yêu cầu thông tin đến một máy chủ trên internet. Máy chủ phản hồi bằng thông tin được yêu cầu, và cuộc trò chuyện kết thúc. Máy chủ không nhớ bạn hay yêu cầu của bạn—điều đó sẽ đòi hỏi một cơ sở dữ liệu khổng lồ về mọi khách truy cập.
Tuy nhiên, khi bạn tương tác với một trang web, bạn thực sự muốn có một số tính liên tục. Sớm trong quá trình phát triển của trình duyệt web, cookies đã được phát minh để cung cấp tính liên tục đó.
Mỗi cookie là một tệp văn bản đơn giản nằm trên máy tính của bạn, chứ không phải trên trang web. Trang web có thể đặt thông tin vào cookie, chẳng hạn như địa chỉ đường phố ưu tiên của bạn, những thứ bạn đã mua hoặc trang bạn đang đọc trong một cuốn tiểu thuyết trực tuyến. Khi bạn truy cập lại trang đó, nó có thể truy xuất dữ liệu từ cookie của chính nó (nhưng không phải từ bất kỳ cookie nào khác) và đọc lại thông tin đó.
Tuy nhiên, các trang web hiện đại không chỉ là những thực thể đơn khối. Chúng chứa các liên kết và nội dung từ các nhà quảng cáo và các trang web bên thứ ba khác. Các bên thứ ba này có thể lưu cookies của riêng họ vào PC của bạn, chứa bất kỳ dữ liệu nào họ có, bao gồm cả tên của trang web đang lưu trữ quảng cáo đó.
Nếu một nhà quảng cáo có mặt trên nhiều trang web, dữ liệu từ nhiều cookie giờ đây cho phép họ liên kết sự hiện diện của bạn trên mỗi trang web bạn truy cập đó. Đột nhiên, cookies không còn có vẻ ngon lành nữa.
Năm 2009, các chuyên gia về quyền riêng tư đề xuất kiềm chế sự lạm dụng này bằng cách cho phép các trình duyệt thêm tiêu đề “Do Not Track” (Không Theo Dõi) vào các yêu cầu trang. Nỗ lực này đã thất bại vì các trang web có quyền bỏ qua tiêu đề đó, và từ đó nó đã bị lỗi thời (với một số trình duyệt đã loại bỏ hoàn toàn tùy chọn này). Các công ty bảo mật đã phản ứng bằng cách đưa ra công nghệ Chống Theo Dõi chủ động ngăn chặn việc theo dõi. Các trình theo dõi đã phản ứng lại bằng các công nghệ mới, bao gồm supercookies, evercookies, Flash cookies, và nhiều hơn nữa.
Tất cả các công nghệ theo dõi này đều liên quan đến việc đặt một thứ gì đó (một tệp văn bản, một tập lệnh, hoặc một tệp khác) lên máy tính của nạn nhân, và tất cả chúng đều đã bị ngăn chặn bằng nhiều cách khác nhau.
Dấu vân tay trình duyệt thì khác. Nó không thay đổi bất cứ điều gì trên máy tính cục bộ; nó chỉ đơn giản là tận dụng các chức năng trình duyệt tiêu chuẩn.
Những yếu tố hình thành dấu vân tay trình duyệt
Khi bạn lướt web, bạn thực sự có cảm giác như mình có một kết nối trực tiếp, liên tục với trang web bạn đang xem. Trên thực tế, trải nghiệm của bạn được tạo thành từ nhiều tương tác nhỏ giữa trình duyệt và máy chủ của trang web. Trình duyệt gửi yêu cầu, và máy chủ phản hồi. Yêu cầu đó nhất thiết phải bao gồm địa chỉ IP của bạn — nếu không có nó, máy chủ sẽ không biết gửi phản hồi đến đâu. Nhưng theo thời gian, các trình duyệt đã bắt đầu gửi một lượng thông tin ngày càng tăng.
Khả năng tương thích không còn là vấn đề lớn ngày nay, nhưng nếu nhìn lại quá khứ, bạn sẽ thấy một thời kỳ mà các trang web phải điều chỉnh phản hồi của mình cho phù hợp với trình duyệt đang yêu cầu, có lẽ gửi một trang khác cho Netscape Navigator so với Internet Explorer. Các yêu cầu gửi đến máy chủ xác định trình duyệt đang tạo yêu cầu, chi tiết đến cả phiên bản và số bản dựng chính xác. Đó là một tương tác đủ đơn giản, nhưng nó là khởi đầu của một con dốc trơn trượt.
Để hiển thị một trang web có thiết kế phong phú, trình duyệt của bạn cần truy cập vào các phông chữ phù hợp. Các phông chữ có sẵn phụ thuộc vào hệ điều hành của bạn. Trình duyệt truy vấn hệ điều hành để lấy danh sách các phông chữ và chuyển danh sách đó cho trang web. Nếu thiếu phông chữ cần thiết, trang web có thể chọn hiển thị một trang đơn giản hóa.
Đúng là tất cả chúng ta đều có cùng một bộ phông chữ cơ bản đi kèm với Windows, nhưng việc cài đặt các chương trình khác thường thêm các phông chữ mới, và việc gỡ cài đặt không phải lúc nào cũng loại bỏ chúng. Sau một thời gian, bộ sưu tập phông chữ của chúng ta bắt đầu phân kỳ.
Để xem nhanh nhiều thành phần bí ẩn tạo nên dấu vân tay trình duyệt của bạn, hãy truy cập trang Cover Your Tracks của Electronic Frontier Foundation (ra mắt năm 2010 dưới tên Panopticlick). Với sự cho phép của bạn, trang này thu thập thông tin được sử dụng để tạo ra dấu vân tay, cùng với một số thống kê hữu ích. Ví dụ, tôi biết được rằng dấu vân tay của tôi là duy nhất trong số hơn dấu vân tay được trang web này kiểm tra trong ngày qua.
Nhìn về dài hạn, các nhà nghiên cứu về bảo mật và quyền riêng tư tại Đại học Friedrich-Alexander Erlangen-Nürnberg, Đức, đã thực hiện một nghiên cứu về dấu vân tay trình duyệt từ năm . Tôi đã tham gia từ những ngày đầu.
Việc tham gia rất đơn giản; mỗi tuần một lần, bạn nhận được một email kèm theo một liên kết để kiểm tra dấu vân tay của mình. Bạn có thể xem lại số liệu thống kê về sự tham gia của chính mình bất cứ lúc nào. Ví dụ, tôi biết rằng tôi đã có cùng một dấu vân tay duy nhất và có thể theo dõi được trong ngày vào năm . Bạn không cần phải đăng ký nếu chỉ muốn xem các số liệu thống kê tổng hợp.
Có vô số trang web khác có thể hiển thị các thành phần tạo nên dấu vân tay trình duyệt của bạn, với mức độ chi tiết khác nhau. Báo cáo từ trang nguồn mở AmIUnique rất hữu ích khi mã hóa màu các thành phần xa rời mức bình thường nhất, làm nổi bật những yếu tố đóng góp nhiều nhất khiến dấu vân tay của bạn khác biệt so với phần còn lại. Trang Device Info liệt kê một loạt thông tin khổng lồ được tiết lộ cho bất kỳ trang web nào thông qua trình duyệt của bạn.
Thông tin trình duyệt của bạn đang chia sẻ là gì?
Các trình duyệt hiện đại tiết lộ một lượng lớn thông tin không chỉ về bản thân chúng mà còn về hệ điều hành mà chúng đang chạy. Các trang web có thể chạy các tập lệnh đơn giản để biết thêm nhiều điều, chẳng hạn như độ phân giải màn hình đang sử dụng và những plug-in nào được cài đặt.
Một chuỗi văn bản phức tạp gọi là User Agent tiết lộ rất nhiều điều về trình duyệt của bạn. Ví dụ, đây là một chuỗi User Agent từ Chrome: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36”. Và đây là một chuỗi từ Edge: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/140.0.0.0 Safari/537.36 Edg/140.0.0.0”.
Các trang web có thể truy vấn và nhận được vô số thông tin về cài đặt và cấu hình hệ thống của bạn. Lượng thông tin khổng lồ có sẵn này có thể được cô đọng thành một giá trị đơn giản duy nhất được gọi là dấu vân tay.
Khả năng hai PC bất kỳ có cùng dấu vân tay là thấp, và hậu quả đối với một trình theo dõi nếu gặp phải sự trùng lặp như vậy cũng thấp tương đương. Đúng, dấu vân tay của bạn có thể thay đổi do các bản cập nhật hệ thống, nhưng điều đó không xảy ra thường xuyên. Khi nó xảy ra, nó cũng không quá quan trọng đối với trình theo dõi. Các trình theo dõi không quan tâm đến việc tạm thời mất dấu bạn. Miễn là họ có thể theo dõi rất nhiều người khác, thì không có vấn đề gì! Và với dấu vân tay trình duyệt, họ không cần phải lo lắng về cookies.