About 槌本 裕二

えっとワークのシステムを作っています。

このサイトは、確率を淡々と計算しているだけなので、100%になるまでは何があるか分からないのですが、100%になってしまうと優勝やCSが決まってしまうので、もはや数字の意味がなくなってしまうと言うジレンマを抱えています。

ですから、95% を一つの区切りとして、95%を超えると「濃厚」として一区切りつけています。もちろん、この先どうなるかは分かりませんが、一つの目安として捉えて貰えると盛り上がるかなと思います。


セ・パ交流戦も終わり、多くのチームで今日からリーグ戦が始まりますね。6月は絶不調だったカープ、5月のカープに戻れるのか、4月のカープに戻ってしまうのか、それとも新しい7月のカープを見せてくれるのか、不安と楽しみでいっぱいです!

皆さんのひいきのチームの状態はどうですか?


アメリカ2年目の冬が始まった頃の話。ビッグバンを再現する加速器実験に参加していた私は、加速器で加速された重イオンが衝突したタイミングや位置を計測する検出器を1人で担当していた。2年目にしてはかなりハードな役割であった。

巨大な加速器が2週間前から動き始め、加速器グループの人たちから「今晩にも最初の衝突が起こる」と、シフトクルーに連絡が入った。実験は24時間体制で、8時間×3シフトが組まれていた。半年近くの実験期間がいよいよ始まろうとしているときだった。前日からいよいよイオンの衝突が始まろうとしており、私は徹夜の2日目だった。なんせ、私の検出器が重イオンの衝突のタイミングを決定しなければ、他の全ての検出器のタイミング調整ができないので、真っ先にチューニングを終えないといけない。一人でこれを行うのは初めてだったが、それなりに予習もしたし、なんとかこなせると思っていた。

加速器制御室から、私たちの居る実験計測室に入電。次の加速後に衝突を試みるとのこと。シフトリーダーが私に測定器のチューニングをするように指示を出した。しばらくして加速器は順調に2方向にイオンを加速し始め、僅かな時間ではあったが衝突が起こった。私の作ったオンラインモニターが、衝突が起こったことを知らせた。早速タイミングあわせのためのデータを解析しはじめたが、グラフを見て頭が真っ白になった。これまでに見たことがない、全く理解できないパターンを示していた。「Yuji, タイミングはどうだ?」とシフトリーダーに聞かれたが、「わからない」としか答えられなかった。

まだまだ実験も序盤で、色々な問題も並行して発生していたため、それぞれがまた忙しく動き回った。私はひとりで頭を抱えていた。そんな中、ひとり、暇そうなおじいちゃんが居た。どこかの大御所先生なのだろうが、彼のシフトは2時間に1回、100個ほどのガス圧や流量計をチェックするだけの役目で、その時間以外は比較的暇だったのだ。彼は私に「何か問題でも?」と聞いてくれた。私の見ていたグラフは少し専門的なので、かみ砕いておじいちゃんに説明して、こんなグラフが出るわけが無いんだという事を説明した。おじいちゃん先生は、ふむふむと聞きながら、時折「なぜ、そうなるの?」と聞いてきた。当時の私は「仕方ないな、おじいちゃんにも分かる様に説明するとね…」とは言わなかったけども、そのぐらいの生意気な態度でかみ砕いて説明していた様に思う。

しばらく、その「なぜ?」が続いたあと、私は、とても不確定か仮定の下に一人相撲をしていることにやっと気付いた。データを取った数分間の間にも、加速器側のパラメータが大きく変動していて、様々な状態が連続して発生していた。それらが重なったまま1つのグラフに表示させたため、見たことのない構造が見えていたのだ。

何の事はない。まだ加速器の方が安定運転に入ってないのだ。原子核の衝突タイミングが安定してからでなければ、検出器のタイミングを合わせられる訳がない。

多分、私の話の細部までは、先生には伝わってなかっただろう。私の理解もまだ不十分だったし、見せていたグラフも、全く説明不足のものだったからだ。しかし、こうした実験の始まりには、加速器も不安定だというのは、その先生の長い経験からは明らかだっただろう。それを、私の拙い英語を延々と聞いてくれた上で、そこに誘導してくれたのだ。「馬鹿、お前の主張は理解できんが、ともあれ、そんなの加速器が安定してからやれば良いんだ」と言う方が簡単だっただろう。しかし、先生は私の話を辛抱強く笑顔で聞いてくれ、的確な「なぜ?」で、結論に誘導してくれたのだった。

私は先生にお礼を言い、シフトリーダーに「加速器が安定したら呼んでくれ」と言って、宿舎に戻った。

それから15年、勉強会のブレインストーミングをやったとき、まず「どんな意見も否定しない」というルールを聞いたとき、あのおじいちゃん先生の顔が浮かんだ。趣旨は少し違うけれども、相手の話をうまく聞くだけで、相手の意見を熟成させたり、時に間違いに気付かせることができる。もしかしたら、その上で、私の話を楽しんでくれていたのかもしれない。そんな気がした。


WordPressの記事には、カテゴリーとタグがつけられます。

この2つの分類法、色々なサイトで解説がありますが、なかなかしっくりくる使い分けに出会えません。そもそも、WordPressにおけるカテゴリーとタグは、ほとんど同じトポロジーなんですよね。唯一の違いは、カテゴリーは入れ子構造を持つことができるところです。「スマホ」カテゴリに「Android」「iOS」といった子要素を入れることができます。しかし、この違いを本質的に納得させてくれる分類には出会ったことがありません。

今のところ、一番腑に落ちている使い分けは、

タグ → 記事の内容
カテゴリ → 記事の性質

という使い分けなのかなあ、という感じです。つまりは、弊社サイトのカテゴリとタグ付けは完全に間違えたなあ、という事です。

具体的にどう言うことかと言えば、内容に関することは、全部タグで分類すべきでした。関連する記事も拾いやすくなりますし、タグはあとからいくらでも増やせるので、途中から出てくるトピックにも対応しやすいです。内容でグルーピングするなら、タグのほうが使いやすいでしょう。「Android」と「iOS」の記事が両方読みたい人は、両方でタグ検索すればいいのです。「スマホ」という親要素が絶対に必要なケースは想像できません。

カテゴリは、内容とは直交した性質、例えば「プレスリリース」「スタッフブログ」「グループ会社の皆様へ(内部通達)」といった、内容云々以前に、読ませるターゲットが異なるような場合に使い分けるのでは無いでしょうか。

タグが「これが読みたい」ならば、カテゴリは「これ以外は読みたくない」ときにのみ使うものではないのか、と思うに至りました。「これ以外は読みたくない」の時は、親要素・子要素の必要性も少しは高まりますし。

いずれにせよ、まだ自分の中で納得のいく答えは出ていません。以前、一度だけどこかで「なるほど」と思わせる分類を見かけた気がするのですが、英語記事だった事もあり、二度と見つかりません…気のせいだったのかも。


混戦模様のセ・リーグ、出だしで躓いた広島が首位に躍り出ました。この前まで優勝確率 0.4%だったのに、今は 47%とはどう言うことか? って突っ込みをよくされます。広島がどん底だったときの勝率は2割3分。勝率23%のチームが10連勝する(古典的)確率は、0.23の10乗で 0.00004% しか無いんですよ。それが起きてしまったのだから、事後確率が 0.4%から47%になっても何の不思議も無い、って分かって貰えるでしょうかね。

案外、下手に算数で考えるより、直感の方が事後確率の数字と合っていることが良くあります。

4月のどん底状態の広島では、あのままで優勝できる確率は、直感的に考えて 1%もなかったと思いませんか? そして、この5月の絶好調の広島では、このまま行けば、そりゃ 47%ぐらいは優勝できそうじゃないですか?

人間の直感というのは、実はとても良くできているなあ、と思ったりします。

ま、このまま行かないから長いシーズンは面白いわけですし、もう少しすれば、セ・リーグ各チームには鬼門の交流戦が始まりますね。1カードずつになってから、ソフトバンクとホームで当たるかロードで当たるかが結構大きい気がしています。

ソフトバンクの強さは誰も異論がないと思いますが、そんなソフトバンクに大きく勝ち越しているのがロッテ。しかし、ロッテがソフトバンクより強いのかと問われれば、答えに窮します。チームごとに、なにか「相性」があると思う人の方が多いと思うのですが、はたして、この「相性」とはどこから来るんでしょうね。



https://eikai.co.jp/ ドメインのサイトは、WordPress プラグイン実装の実験場となるため、時々アクセスができなくなったり、更新が滞ったり、表示がおかしかったりするかもしれません。できだけそういうことがないようにしますが、ご了承下さい。

そんなの、テストサーバでやれよ、と怒られそうですが、弊社サイトは弊社の本番テストの場という位置づけなので、ここがテストサーバなのです。本運用環境に近い場でテストするフェイズとなりましたので、そこそこアクセス数のある弊社サイトにて、実環境での負荷などを測定します。

アクセス数が多くなってくるオールスター明けには今年度の仕様を確定させたいと思います。


2019年のシーズンも開幕し、今年の確率計算も始まりました! 速報は試合終了後20分、その日の計算は、全試合終了後1時間後を目標に更新していきます。

まだ1試合なので、勝率10割のチームと0割のチームしか居ませんから、このまま行けば全勝と全敗です。確率計算ではもう少し複雑な計算をしていますが、まだ極端な値が出る事に変わりはありません。せめて3週間、対戦が一巡するまでお待ちください。描くチームとのホーム・ビジターの対戦が一巡する5月半ば頃には、そろそろ意味のある数字になってきます。

今年は、2つの方向で、さらに楽しんで頂けるサイト作りを進めていきたいと思っています。チャート(グラフ)の描画も始まりましたが、今年はもっとグラフィカルな表示の方法も試したいですし、ご希望の方向けに、もっと詳細なデータも提供していきたいです。

「何でもかんでもWordPressに入れるな」と怒られそうですが、何でもかんでも入れようとしています。WordPressのアップデートで拡張部分が破壊されないように、標準的なプラグインの形式にコードを書き直したり、 新しいデータストアを導入しています。もっと余裕があれば、とても遅い計算部分をGPUに最適化したり、新しいアルゴリズムなど、試したいことがいっぱいですが、まだここに手をつける余裕が無くてすみません。

ともあれ、今年も応援の応援、よろしくお願い致します!


AIの手法を取り入れた、より高度な確率計算手法の確立のため、2月9日に筑波大学で開かれた、スポーツ科学へのAIの応用に関する研究会に、企業参加として招待頂きました。これからも学術部門・企業部門を問わず、活発な意見交換を行い、野球統計学の新しい手法の模索と、他分野への貢献に寄与すべく、今年も邁進していきます。


日米で大活躍したイチロー選手が事実上の引退を表明されました。これだけ長い期間、世界の第一線で活躍された実績もさることながら、年齢を感じさせない体の維持管理のストイックさと、日本代表としての熱い愛国心とを併せ持つ、男も惚れてしまう選手だと思います。

そんな、世界の9割が尊敬するであろうイチローですが、引退会見で少し気になる言葉が出てきました。「(主にアメリカの)野球が、頭を使わないものになってきている」といった趣旨だったと思います。おそらくは、過度にデータに依存した守備陣形や配球など、データアナリストに頼った近代野球が、イチローの目には快く映らなかったのではないでしょうか。

私は、言うまでもなくデータが大好きです。野球はチームスポーツですので、個人がバラバラに動くよりも、同じ方向性を持って動いた方が絶対に有利です。日本の、私の好きなチームなら「家族のようなチーム」で、自ずと皆が指揮官の方針に沿って考えて行動するでしょう。しかし、比較的個人主義の強いアメリカにおいて、皆を納得させて同じ方向に向かせる材料は「データ」になるのではないでしょうか。この守備位置がデータ上有利だから、この配球がデータ上有利だから、こうしよう。と、チームをまとめるのです。

科学や計算機の分野に携わっていると、科学に疎い人ほど科学を万能のものとして、計算機に疎い人ほど計算機を万能の道具として考えがちな傾向があると思います。イチローは言うまでもなく一流の野球選手ですが、統計のプロフェッショナルではありません。ですが「頭を使わなくても良くなっている」と感じるという事は、最新のAIがはじき出す作戦が、イチローの考えとそれほど食い違わないことを示唆していると思います。なぜなら、AIがトンチンカンな指示を出すと思うなら、AIの指示に従うかどうか、人間が考えなくてはなりません。データ野球が、イチローの長年培ってきた直感に追いつき始めていて、長年考えに考えた色々な野球の一部を、何も考えない選手ができるようになってきた、とも言えると思います。データ上は、データの活用はかなりの効果を上げています。

とはいえ、野球は長いシーズンを戦うスポーツです。年間150試合近く試合があり、1試合あたり、おおよそ30~50組の対戦があります。年間で言えば 6000組の対戦があるのです。データは、その6000組の対戦の傾向を示すだけであり、個別の1つに対して高確率で何か言えるものではありません。例えば、サイコロを6000回振れば、おおよそ1000回前後、1の目が出ます。これは基本的な統計データです。ですが、次の1回で1が出るかどうかは、1/6 の確率であるとしか言えません。そもそも、ほとんどの選手が3割前後の打率で、あまり差はありません。ですが、打者1巡の猛攻は、正規分布から予想される確率よりも多く起こります。

データ上有利な作戦が存在するなら、それを採用するのは、勝つために当たり前だと思います。しかし、データでマークされながらも、その上を行くプレイで球場は沸き立ちます。それそこが一流選手だろうと思います。イチローは「記録はまた次の選手が更新していくもの」と言いましたが、データの先を考えない選手が、頭を使わずにイチローの成績を超えていくとは到底思えません。

イチローは自分が成し遂げた努力の蓄積を、とても過小評価している気がします。イチローの積み上げた努力と功績は、データ野球が簡単に超えられるものではないと、私は思います。