シグナル&ノイズ 天才データアナリストの「予測学」
the signal and the noise  –  why so many predictions fail – but some don’t

この本は、ブルックリンの統計家 Nate Silver がまとめた、予測と予想についての本です。原題の副題である「why so many predictions fail – but some don’t」 ~ なぜこんなにも多くの予測は外れるのに、いくつかの予測は当たるのか? というメッセージが、先の読めない世界で経営判断を迫られる経営者の不安につけ込んできますね。シカゴ大学で統計学を修めた彼は、定量的な推定を得意としつつも、そのパラメータとして多くの定性的な要素を組み込むことで、MLB で活躍する選手を見出したり、アメリカ大統領指名選挙の結果を高い精度で予測することに成功しました。

なんといっても、1978年生まれの彼は、私と同い年。これが一番の驚きでした。

本書で紹介されているベイズ推定は、現在のビッグデータ解析に必ずと言って良いほど使われる基本的な統計手法ですが、本書では、このベイズ推定を予測手法の軸として使っています。この著者がうまいのは、定量的なパラメータから定量的な確率を推定するベイズ推定を、定性的にしか評価できない経済学や疫学・安全保障といった分野に応用し、彼なりの手法で成功しているところです。

統計的手法を得意とする人は、様々な相関係数から、指標と予測値を関連づけようとしますが、現在は意味のある物からあまり意味のないものまで無数の指標が氾濫し、情報の総量は増大しているが、その S/N 比は著しく低下していると述べています。1万個の指標があれば、偶然では99.9%起こりえないほどの強い相関も、偶然で10個は生じてしまいます。その中でいかに有用なシグナルを見つけ出し、推定に役立てていくのか。実験物理学をやってきた私には経験的に体感してきたことも多くあり、それらを体系的に理解することが出来ました。また、経済や災害・テロや疫病の脅威についても、物理学の熱分布やべき乗則、レビ―統計的なロングテイルが存在し、物理学の知識の応用範囲は幅広いな、と、改めて感じました。

また、経済学において興味深いのは、1950年から1990年代のおおよそ半世紀にわたって、多くの分野で様々な統計が取られるようになってきましたが、幾度かの石油危機があったとはいえ、(アメリカを中心とする)世界的な好景気が長く続いた特異な半世紀であったであろう事を忘れて、その傾向を2010年代に適用できるのかどうか、深く考える必要があるとも述べています。

ビッグデータ解析の有用さと、宿命的な欠陥を、多くの具体的事例から紹介しているこの本は、これからビッグデータ解析に乗り出そうとしている方には、一読の価値があります。抽象的な事柄を、具体的に書きくだしてくれているので、ビッグデータの扱い方の方向性を決める初期の段階でかなり役に立つとおもいます。極基本的な数学の知識が必要です。

 

英語に自信のある方は原著でどうぞ。経済用語や疫学用語など、馴染みの無い単語が多いので、章が変わるごとに少し難儀するかもしれません。


PHPライブラリ&サンプル実践活用[厳選100]

この書籍は、WINGSプロジェクトが技術評論社を通じて出版した、php の技術書です。

まず、php というスクリプト言語を知っていることが前提で書かれているので、php の入門書としては不向きかもしれませんが、初心者から中級者にレベルアップする段階で非常に役立つ一冊であるのではないかと思います。使い方としては、困ったときのリファレンスというよりは、予め読んでおきたい種類の本ですね。

この本では、php でできる様々なこと 100項目が、簡単なサンプルと共に紹介されています。php といえば、「お手軽に色々な事ができる Web 用スクリプト」というふうに認識されていると思いますが、まさに、その「色々なこと」をシンプルなサンプルコードで100種類紹介されています。
外部ライブラリのインストールなど、一般的な知識は冒頭部分で説明されており、各ライブラリの説明ではインストールよりも使い方にページが割かれています。インストール部分は同じようなことの繰り返しになるため、無駄を削って要点がまとめられていて、ライブラリのカタログ、リファレンスのリファレンスのような使い方ができます。また、紙面では省略されているフルサイズのサンプルコードは、Webサイトからダウンロードできるので、すぐに動かしてみたい場合も、ファイルをダウンロードしてサーバに設置するだけで動かしてみることが出来ます。

紹介されているライブラリは定番の物が中心です。「php でこんなことができる」「こんな外部サービスがある」という発見もあるので、php を使って色々遊んでみたい人、また、初心者の域を超えて実用的なサービスを始めたい人には最初に一読しておくと、今後の php の活用の幅が広がると思います。php 本来の「手軽に色々出来る」が実感できると思います。

Part 2 の Webサービス編では、php の機能というよりは、様々な Web API の紹介がなされていて、また、それを php で簡潔に使うためのサンプルが用意してあります。それぞれの API については、基本的な API の紹介と利用に留まりますが、別途 API やライブラリのリファレンスを読めば、その他の機能も同じように使えるので、この本で興味を持って、その API を勉強し始めるといったパターンもあると思います。また、php には用途のよく似たライブラリが多数存在する場合もあるので、どれを使ったら良いか分からない場合も、本書で紹介されている定番のライブラリを選ぶ、と言う使い方も出来ます。

Part 4 のユーティリティ編では、中級者でもちょっと困ってしまうような問題を簡単に解決できるライブラリが多数紹介されています。これらの存在を知っていれば、少し本格的なサービスを書く際に使える定番の小技を身につけられます。

最後の Part 6 では、もっと本格的なプログラムを書くための、現代的なプログラミングモデルを導入するためのフレームワークが幾つか紹介されています。php の「簡単に動く物が書ける」という利点は、使い手によっては構造的で分かりやすいプログラミングモデルの導入機会を逃してしまうことにもなりかねない罠ですが、ここで紹介されているフレームワークを用いれば、php でも現代的なプログラミングモデルを、共通の形で導入できます。できるはずです。
これらのフレームワークについては、それぞれが一冊の本になるぐらいの内容であるため、本書で紹介されているのはほんの導入部分だけですが、これをきっかけに、業務にも使える php の書き方を勉強してみてはいかがでしょう。
私も、これを機会に FuelPHP の使い方を勉強してみようと思います。

この本は、php を使い始めた人にお薦めの一冊です。