Gần đây tin đồn về việc Facebook có khả năng nghe lén mọi cuộc trò chuyện thông qua micro trên smartphone đang lan truyền mạnh mẽ trên mạng. Với những người giàu tưởng tượng, họ có nhiều cách để chứng minh điều này. Vậy chúng có đáng tin không?

Hãy cùng xem một trong những video được cho là bằng chứng cho ý tưởng trên.

Nói ngắn gọn thì: tất cả đều nhảm nhí.

Để nghe lén, Facebook phải ghi lại toàn bộ những gì điện thoại của bạn nghe được khi nó hoạt động. Chức năng này tương đương với một cuộc gọi liên tục tới Facebook. Trung bình cuộc gọi một chiều như vậy trên internet tốn 24kbps, tức là khoảng 3kB dung lượng. Cứ cho là bạn dùng điện thoại trong nửa ngày, nghĩa là có khoảng 130 MB dung lượng mỗi người mỗi ngày được truyền đến Facebook. Hiện tại mạng xã hội này có khoảng 150 triệu người dùng tích cực ở Mỹ, nên chúng ta có tổng dung lượng rơi vào khoảng 20 petabyte mỗi ngày, và nên nhớ đó mới chỉ ở Mỹ.

Để dễ ước lượng, các bạn cần hiểu là toàn bộ hệ thống lưu trữ dữ liệu của Facebook chỉ chứa được chừng 300 petabyte, trong khi mỗi ngày phải ngốn thêm cỡ 600 terabyte. Nói một cách khác, nếu Facebook thật sự nghe lén bạn thì mỗi ngày họ phải tiếp nhận một lượng dữ liệu lớn gấp 33 lần so với hiện tại.

Hơn nữa, làm như vậy có thể dễ dàng bị phát hiện khi dữ liệu mạng của người dùng bị tiêu hao đáng kể vì Facebook liên tục gửi thông tin cuộc gọi về mình. Điều này sẽ khiến điện thoại của bạn ỳ ạch ngay lập tức hoặc thậm chí bị treo vì phần cứng hạn chế của nó. Viễn cảnh đó là chắc chắn.

Tất nhiên, có một cách thông minh hơn để thực hiện ý tưởng này, đó là trợ lý cá nhân điều khiển bằng giọng nói của Amazon: Echo (hoặc Google Home của Google). Phần cứng của Echo được thiết kế để có thể phát hiện ngay cả các từ khóa kích hoạt rất hạn chế trong một tập hợp và sau đó sẵn sàng lắng nghe. Một khi nó nhận biết lệnh của người dùng thông qua từ khóa thì nó đủ thông minh để ghi lại các yêu cầu sau đó và gửi tới Amazon, nơi diễn ra việc chuyển ngữ văn bản cũng như xử lý ngôn ngữ tự nhiên. Kết quả của các yêu cầu chi tiết sau đó được gửi lại và cứ thế cuộc trò chuyện của bạn với ‘Alexa’ sẽ diễn ra suôn sẻ. Echo hoạt động đơn thuần như một chiếc micro + loa và cũng là một chiếc máy tính đơn giản có thể thực hiện tốt nhiệm vụ nhận dạng giọng nói.

Phải chăng Facebook cũng có thể làm được điều tương tự, chỉ lắng nghe những từ khóa cụ thể là có thể kích hoạt quảng cáo?

Không và không. Hệ thống nhận diện mục tiêu quảng cáo của Facebook chứa tới 1 triệu từ khóa để nhận biết vấn đề người dùng đang quan tâm và số lượng này thường ổn định hoặc tăng nhẹ theo thời gian. Nhưng khác với Amazon Echo chỉ nghe 1 trong 4 từ khóa kích hoạt, hàng triệu hoặc hàng tỷ từ và cụm từ của Facebook có thể đưa bạn vào hẳn một phân khúc tiềm năng trên Facebook.

Ví dụ: nói “Golf”, “Tiger Woods”, “The Masters” hoặc “Sân Gôn Quốc gia Augusta”, nghĩa là bạn đang định hướng vào chủ đề “Golf”. Khi đó, điện thoại của bạn cần phải nghe được từng từ một. Nhưng do không có từ khóa kích hoạt cụ thể cho Facebook nên điện thoại cần phải nghe hết mọi từ khóa định hướng, có nghĩa là mã biên dịch từ dạng âm thanh sang dạng chữ viết chỉ có thể chạy trên điện thoại của bạn – một yêu cầu đầy khó khăn ngay cả đối với các máy chủ đám mây khổng lồ chứ đừng nói tới “dế yêu” bé bé xinh xinh.

Nhiều người sẽ bắt bẻ tiếp vấn đề khi có thể xử lý bằng cách hạn chế danh sách từ khóa, hoặc hạn chế không gian tìm kiếm thông qua việc tinh giản từ ngữ với từ khoá bám sát mục đích nhất (ví dụ như chỉ nói ‘golf’ thay vì ‘Tiger Woods’). Tuy vậy, đó vẫn là một gánh nặng đối với tất cả các smartphone hiện nay, từ các dòng chậm như rùa cho đến dòng mới, tốc độ đỉnh của đỉnh như iPhone X. Còn nếu Facebook chỉ nhắm tới một loại điện thoại cụ thể,  gánh nặng có thể giảm xuống ít nhiều nhưng dù thế nào đi nữa thì một quy mô khủng khiếp như vậy vẫn là một thách thức rất lớn.

Chưa hết, chỉ với một cách tiếp cận “ngây thơ” như trên thì điện thoại cũng sẽ bị giảm hiệu năng vì tiến trình nghe lén chạy nền sẽ chiếm hết CPU và pin điện thoại. Bạn có thể dễ dàng kiểm tra điều này thông qua các công cụ theo dõi thiết bị. Với smarptphone cấu hình cao hơn và các nhà phát triển di động xử lý được vấn đề tốt hơn thì sự thay đổi vẫn là rất vô ích. Chưa kể khi bị phát hiện, Facebook sẽ không thể có cơ hội thứ hai trên điện thoại của bạn nữa.

Nói tóm lại, có vô vàn những thách thức kỹ thuật khiến ngay cả “ông kẹ” Zuckenberg cũng “bó phép” và khó lòng mà đạt được một tiến bộ vượt bậc ngay được. Về quy mô, điều này đã là không khả thi.

Nhưng nếu giả sử những vấn đề kỹ thuật này bỗng dưng biến mất?

Việc nghe lén sẽ trở nên phổ biến?

Giả sử Facebook có thể tạo ra bản ghi âm hoàn hảo của mọi cuộc nói chuyện, bỏ qua vấn đề băng thông, bỏ qua năng lực yếu ớt của CPU, chỉ đơn giản là một bản thu ghi lại từng lời bạn nói.

Vậy phần nào của bản ghi âm sẽ chứa thông tin mà các nhà quảng cáo quan tâm?

Thật ra thì chẳng có mấy.

Một số chuyên gia tại Facebook đã làm thử nghiệm về vấn đề này. Dự án tên là ‘Chorizo’, liên quan đến việc đẩy tất cả các dữ liệu người dùng Facebook trên máy tính (các bài đăng, link chia sẻ, các địa điểm check-in…) vào một hệ thống máy tính định hướng mục tiêu để xem có thể cải thiện hiệu quả quảng cáo hay không.

Điều bất ngờ là không cần chờ tới kết quả, người ta cũng nhận thấy chỉ một phần nhỏ của dữ liệu là hữu ích trong việc định hướng quảng cáo. Nó giống như việc ép một đám gia súc vào máy nghiền rồi chỉ nhận đươc mỗi một cây xúc xích. Trong khi người dùng Facebook là một “đàn gia súc” vô cùng lớn.

Vấn đề ở đây là định kiến hiểu lầm của người dùng Facebook mà các chuyên gia thường gọi đùa là “Ảo tưởng sức mạnh” (Narcissistic Fallacy). Tất cả chúng ta đều muốn là trung tâm của thế giới và người ngoài thấy cuộc sống của chúng ta rất quan trọng hoặc thú vị. Kết quả là, chúng ta đưa ra điều chúng ta ghét nhất để tiết lộ cho các nhà quảng cáo (hoặc Facebook). Nhưng đó là một sự quy đổi sai lầm; các nhà quảng cáo thực ra không quan tâm đến phần lớn các dữ liệu cá nhân của bạn.

Nói cách khác: bạn có một tấm ảnh khỏa thân trên Internet không có nghĩa là ai cũng muốn trả tiền để xem nó.

Điều này tương tự với hầu hết các dữ liệu cá nhân trên Facebook, kể cả các cuộc trò chuyện của bạn. Mặc dù một số cuộc gọi có thể tiết lộ điều gì đó có ích về mặt thương mại nhưng dữ liệu định hướng mà các nhà quảng cáo thực sự muốn lại không phải từ Facebook. Chúng nằm trong trong giỏ hàng bạn mua từ Amazon, từ đại lý bán xe hơi cho bạn hoặc bất cứ nơi nào khác mà bạn chi tiền.

Vậy thuyết âm mưu này có thực sự như người ta nói?

Đừng quan tâm đến tính khả thi hoặc sự hiện hữu ở khắp nơi của “gián điệp Facebook”. Hãy tưởng tượng mạng xã hội nghe lén thành công tất cả những cuộc gọi nhạy cảm của bạn. Họ sẽ làm gì với chúng?

Ngôn ngữ của con người, chỉ có một ít ý nghĩa thông tin chính thống. Trên thực tế chúng còn chứa đựng vô số lời mỉa mai, lăng mạ, ám chỉ bóng gió, những lời nói nước đôi và cả những ám muội. Chẳng có gì ngoài sự kỳ vọng quá đáng của bạn vào khả năng “thần diệu” của công nghệ có thể hiểu được và trục lợi được từ ngôn ngữ hàng ngày của bạn.

Lại nói về ‘Dự án Chorizo’: sau khi nghiền đám xúc xích kia, tỷ lệ thu được lợi nhuận từ số click chuột dựa trên các thông tin trên bài post của người dùng là rất thấp. Không phải không tăng mà là mức tăng không được như các nhà quảng cáo muốn chấp nhận bỏ tiền ra.

Vậy những video lan tràn trên Youtube về việc Facebook nghe lén người dùng là sao?

Ở đây là trạng thái “thiên kiến xác nhận” như việc tự hỏi tại sao trời luôn mưa khi chúng ta quên mang áo mưa. Người ta dễ dàng tin video của một người dùng Facebook trải qua một số tình huống có vẻ ngẫu nhiên, trong khi lại bỏ qua hàng triệu người dùng khác không gặp phải sự cố như vậy.

Dĩ nhiên chưa chắc mọi sự trùng hợp đều sai. Một số chỉ đơn thuần là mối tương quan nguyên nhân-kết quả hàm chứa nhầm lẫn: cái này không gây ra cái kia, cả hai được gây ra bởi những lý do bên ngoài không được nhắc đến.

Sự thật là Facebook không cần phải thực hiện phép màu gì để định hướng quảng cáo vào bạn cả. Họ có nhiều cách tốt hơn để làm việc đó. Không phải là các quảng cáo tại sao lại chính xác một cách kỳ lạ như vậy, chỉ đơn giản là do những thành kiến trong nhận thức của bạn đã tưởng tượng ra.

Hãy nhớ rằng, Facebook có thể tìm thấy bạn trên bất kỳ thiết bị nào bạn đã từng dùng để vào mạng xã hội. Họ còn có thể khai thác mọi thứ mà các nhà bán lẻ biết về bạn và thậm chí theo dõi việc bạn mua hàng dù là mua bằng tiền mặt. Chắc các bạn không nghĩ thẻ giảm giá cho khách hàng thân thiết gắn liền với số điện thoại hoặc email là có lý do gì đó.

Trước khi quá bức xúc với Facebook, bạn nên biết rằng Twitter và LinkedIn cũng làm như vậy, và Facebook cũng chỉ là kẻ sao chép khái niệm ‘dữ liệu trên hành trình” từ các công ty quảng cáo lão làng. Thật ra là rất khó nếu bạn muốn thoát khỏi các quảng cáo thời nay.

Nói tóm lại, Facebook không nghe lén bạn nhưng họ vẫn theo dõi bạn bằng nhiều cách khác mà bạn không biết. Như một người lính đã nói: phát súng mà bạn không nghe thấy tiếng mới là phát súng giết chết bạn!

Theo Wired

BÌNH LUẬN

Please enter your comment!
Please enter your name here