2017年9月24日日曜日

google検索でビットコインバブルを予想する?

ちょっとおもしろいニュースを発見しました.
googleトレンドを使うことで,ビットコインバブルを検出する
というタイトルの記事です.
(英語の記事をgoogle翻訳で和訳しています)

Using Google Trends to Detect Bitcoin Price Bubbles 

簡単に言えば、Googleトレンドは、アクティブなビットコインユーザーの増加をトラッキングする優れた方法です。検索ワード 'BTC USD'は、アクティブビットコインユーザーが日々の価格をチェックする際に関与するプロキシとして機能します。エンゲージメントレベルが高くなると、ビットコインユーザーはパーティモードになり、貴重なコインの価格が毎日確認されます。エンゲージメントレベルが高すぎる場合、それは価格バブルであり、売るのがよい時期です。
随分前の論文になりますが,
2009年にgoogleのエンジニア達がNatureに投稿した論文もご紹介
"Detecting influenza epidemics using search engine query data"
googleが検索データからインフルエンザの流行を同定

従来は,疾病予防管理センター(CDC)は,医療機関に新型インフルエンザの報告を要請すると,すでに広がりを見せていたパンデミックの情報が1〜2週間遅れて集まっていた.

そこでgoogleは,米国人が検索で使用した言葉のうち上位5000万件を抽出し,2003〜2008年までの季節性インフルエンザ流行に関するCDCデータとの相関性を調べた.

最も相関の強かった45 wordsに重み付けを加えた予測モデルにおいて,CDCデータとの相関係数は,驚異的な0.97というものであった.
スライドの黒線は,googleが検索ワードから予想したインフルエンザの発生.
赤線は実際にCDCから報告されたデータです.googleが検索ワードから予想した値と実際の流行状況は,ほぼ一致していますね.

少し要約してみると.
以前は,インフルエンザの患者さんが,病院を受診する.その数を各医療期間がまとめてCDCに報告する.CDCはそれらのデータをまとめて報告していた.
そうすると,実際にパンデミックが起こってから,そのデータが報告されるまでの期間にギャップが生じる(1〜2週間).そこで,googleは,「理由はわからないけど,過去にインフルエンザの発生と相関の強かったWordを45個見つけて,重み付けを加えた予想モデル作れば,実際にアメリカ国内でどれくらい流行しているか,ライブでわかるんじゃね?」と思い,やってみた.2008に実験してみたら,相関係数0.97だったよ.
というもの.

因果関係に注目するか,相関関係に注目するか?
というのは,ここ数年注目されている領域です.
結構面白い視点だったと思うので,紹介してみました.