Google が、統計モデルとAIを組み合わせて、今後4週間の感染確認者数・入院病床数・死亡者数の予測を公開し始めて、一ヶ月が経とうとしています。

こういうモデル計算は、単に統計が分かるだけでは機能するモデルは作りにくく、疫学や人間行動学など、感染の増減を左右する全ての要素に精通した複数の専門家が協力してモデル作りをする必要があります。

Googleの計算の詳細は分かりませんが、おおよそ私の思いつくことは全部考慮されていると思っています。

ただ、少し気になるのが、どうも誤差を過小評価しているように見えます。実際、数日に一度、前日とは大きく異なる予測を示した後、また元に戻るような振る舞いが見られ、系統誤差をもっと大きく見積もるべきだと思いますし、部分的には統計誤差も過小評価されているようにも見えます。さすがにこれは私の勘違いである可能性が高いと思っていますが、そう見えてしまうので、後で恥をかく覚悟で書いてしまいます。


この手の計算は、計算自体はそれほど大変ではないので、弊社でも計算ができるのではないか、という問い合わせを頂いています。確かに計算そのものは可能ですが、先にも述べているように、私はこういった「計算モデルの構築」においては「専門家の長年の経験と、そこからくる直感」をとても重要だと思っております。私のような素人が上辺の数字だけ計算だけできても混乱を招くだけです。特に人の生き死にに係わる数字は、野球の勝敗とは社会に与える影響の大きさが全く違います。

国は、もっともっと早い時期に、専門家集団を5チームほど編成して、スーパーコンピュータを用いて5つのモデルでの予測を毎日行い、最悪の事態の想定と、最善のシナリオへの誘導を検討すべきだと思っています。気象予報では既にそうした計算体制が確立されており、台風の進路や大雨の予報が数日前から高い精度で発表されています。新型ウイルスの長期予報でそこまでの精度は当然出せませんが、こういうモデル計算による予測を元に、ある意味機械的に政策を決めていかないと、政治家の決断の遅れのせいで、あっという間に感染者数が爆発することもあり得ます。そうした政策がとられないまま登場したGoogleの予測計算は、民間指標の1つになり得ると思われましたが、まだその水準に達していないように見受けられます。その扱いにはメディアも少し慎重になって欲しいと思います。


ただ、こうした数値の公開を始めたGoogleには、多くのノウハウが蓄積されて行くので、今後予測精度は上がっていくと思います。もし3月に政府や有識者会議がこういったモデル作りを始めていたら、今頃、200日分のノウハウが蓄積されていたはずです。何事も後手後手の政府には本当にがっかりです。