Wednesday, August 09, 2006

AOL Releases Massive Amount of Search Data

From TechCrunch:

AOL has released very private data about its users without their permission. While the AOL username has been changed to a random ID number, the ability to analyze all searches by a single user will often lead people to easily determine who the user is, and what they are up to. The data includes personal names, addresses, social security numbers and everything else someone might type into a search box.

AOL はユーザーに就いてのプライベートなデータをユーザーの許可なしにリリースした。ユーザー名はランダムIDナンバーに変えられているが、シングル・ユーザによる全てのサーチを分析する能力は、しばしば、ユーザーが誰で何をしようとしているのかが簡単に分かる事になるだろう。そのデータは個人の名前、住所、ソーシャル・セキュリティ・ナンバー、その他の全てのサーチ・ボックスに入力されるデータが含まれている。

This is search data for roughly 658,000 anonymized users over a three month period from March to May -- about 1/3 of 1 per cent of their total data for that period.

このサーチデータは大体 658,000 人の匿名のユーザーの3月から5月までの3ヶ月間のデータでその期間の全てのデータの1%の3分の1に当たる。

Now AOL says it was all a mistake. They pulled the data, but it's still still out there -- and probably will be forever. And there's some pretty scary stuff in it.

現在、AOL は全てミスだった、と言ってデータを削除しているがあちこちに残っていて、多分、永久に残るだろう。

You can read more on SlashDot and elsewhere.

SlashDot やその他でこれに就いて読む事が出来る。

Anyone who wants to play NSA can start datamining for terrorists. Let us know if you find anything.

NSA の真似事をしたい人は誰でもテロリストを捜してデータ・マインニングを始められる。もし、何か分かったら知らせて欲しい。

EDITED TO ADD (8/9): The New York Times:

And search by search, click by click, the identity of AOL user No. 4417749 became easier to discern. There are queries for “landscapers in Lilburn, Ga,” several people with the last name Arnold and “homes sold in shadow lake subdivision gwinnett county georgia.”

It did not take much investigating to follow that data trail to Thelma Arnold, a 62-year-old widow who lives in Lilburn, Ga., frequently researches her friends’ medical ailments and loves her three dogs. “Those are my searches,” she said, after a reporter read part of the list to her.

ニューヨーク・タイムズによるとユーザNo. 4417749 はサーチデータから簡単に分かった。
62歳の Lilburn, Ga に住み、頻繁に友人の病気について調べ、3匹の犬を飼っている。本人に確認すると、それらのサーチは自分のサーチだと彼女は言った。


Via Schneier on Security: AOL Releases Massive Amount of Search Data


他のサイトでも ニューヨーク・タイムズの様にNSA の真似事をして調査している所があります。

検索ワードにはセンシティブな情報が含まれている場合があり、それらを繋ぎ合わせると本人が特定できると前々から言われていますが、検索エンジンの会社のデータの取り扱い方も重要ですが、ユーザ自身がそれを認識して使う事が大切だと思います。

No comments: