インテリジェンスこぼれ話(第35回)
XKeyscore(エックスキースコア)
前回は、NSAによるシギント収集態勢の全体像を俯瞰しました。それでは、NSAは世界中で収集した膨大なデータをどのように保管し分析しているのでしょうか。
今回は、NSAによる取得データの保管分析で、最も重要なXKeyscoreについて説明します。一言で言うと、XKeyscoreとは、収集したシギント・データの一次記憶装置であり、また記録したデータの検索分析システムです。収集した膨大なデータを一時保管し、あたかも「グーグル」を使うように、分析官が必要とするデータを検索できるシステムです。ゆえに、「NSAのグーグル」とも呼ばれています。
なお、NSAの情報を漏洩したエドワード・スノーデンが、2013年6月のインタビューで「メールアドレスが分かれば、その個人のメールを読むことができる。」と語っていますが、それはXKeyscoreを念頭に置いたものです。
NSAの従来データベースとXKeyscoreの必要性
NSAは、世界中に配置したシギント・プラットフォームから、日々膨大なデータを収集しています。そして、NSAは必要に応じて、様々なデータベースを構築してきました。
2013年頃まで遡ると、NSAの基本的なデータベースとしては、次の4つがありました。
これらは、それぞれのデータベースの目的に応じて、NSAが収集する膨大なデータの中から、有用だと考えられるデータを保管し利用するものでした。つまり、メールアドレスやIPアドレス、あるいは電話番号などの指標から有用性を判断して保管されていたものです。一方、データ入手時点で有用と判定されない膨大なデータは、そのまま廃棄されて保管されていなかったのです。
NSAは、膨大なデータにアクセスしていますから、保管されないデータの中にも、有用情報を含むデータは多量にありました。有用情報を含む可能性のあるデータの中で、実際に保管されていたものは5%にも満たなかったそうです。そこで、従来なら廃棄されていた膨大なデータを一時保管して、この中から有用なデータを抽出し利用する目的で、XKeyscoreが開発されました。つまり、インターネット空間上のデータに対する抽出分析能力の飛躍的向上を狙ったのです。