About 槌本 裕二

えっとワークのシステムを作っています。

日米で大活躍したイチロー選手が事実上の引退を表明されました。これだけ長い期間、世界の第一線で活躍された実績もさることながら、年齢を感じさせない体の維持管理のストイックさと、日本代表としての熱い愛国心とを併せ持つ、男も惚れてしまう選手だと思います。

そんな、世界の9割が尊敬するであろうイチローですが、引退会見で少し気になる言葉が出てきました。「(主にアメリカの)野球が、頭を使わないものになってきている」といった趣旨だったと思います。おそらくは、過度にデータに依存した守備陣形や配球など、データアナリストに頼った近代野球が、イチローの目には快く映らなかったのではないでしょうか。

私は、言うまでもなくデータが大好きです。野球はチームスポーツですので、個人がバラバラに動くよりも、同じ方向性を持って動いた方が絶対に有利です。日本の、私の好きなチームなら「家族のようなチーム」で、自ずと皆が指揮官の方針に沿って考えて行動するでしょう。しかし、比較的個人主義の強いアメリカにおいて、皆を納得させて同じ方向に向かせる材料は「データ」になるのではないでしょうか。この守備位置がデータ上有利だから、この配球がデータ上有利だから、こうしよう。と、チームをまとめるのです。

科学や計算機の分野に携わっていると、科学に疎い人ほど科学を万能のものとして、計算機に疎い人ほど計算機を万能の道具として考えがちな傾向があると思います。イチローは言うまでもなく一流の野球選手ですが、統計のプロフェッショナルではありません。ですが「頭を使わなくても良くなっている」と感じるという事は、最新のAIがはじき出す作戦が、イチローの考えとそれほど食い違わないことを示唆していると思います。なぜなら、AIがトンチンカンな指示を出すと思うなら、AIの指示に従うかどうか、人間が考えなくてはなりません。データ野球が、イチローの長年培ってきた直感に追いつき始めていて、長年考えに考えた色々な野球の一部を、何も考えない選手ができるようになってきた、とも言えると思います。データ上は、データの活用はかなりの効果を上げています。

とはいえ、野球は長いシーズンを戦うスポーツです。年間150試合近く試合があり、1試合あたり、おおよそ30~50組の対戦があります。年間で言えば 6000組の対戦があるのです。データは、その6000組の対戦の傾向を示すだけであり、個別の1つに対して高確率で何か言えるものではありません。例えば、サイコロを6000回振れば、おおよそ1000回前後、1の目が出ます。これは基本的な統計データです。ですが、次の1回で1が出るかどうかは、1/6 の確率であるとしか言えません。そもそも、ほとんどの選手が3割前後の打率で、あまり差はありません。ですが、打者1巡の猛攻は、正規分布から予想される確率よりも多く起こります。

データ上有利な作戦が存在するなら、それを採用するのは、勝つために当たり前だと思います。しかし、データでマークされながらも、その上を行くプレイで球場は沸き立ちます。それそこが一流選手だろうと思います。イチローは「記録はまた次の選手が更新していくもの」と言いましたが、データの先を考えない選手が、頭を使わずにイチローの成績を超えていくとは到底思えません。

イチローは自分が成し遂げた努力の蓄積を、とても過小評価している気がします。イチローの積み上げた努力と功績は、データ野球が簡単に超えられるものではないと、私は思います。


いよいよ明日29日は、日本プロ野球の開幕戦ですね!

当サイトも、Google Analytics が異常値と判定するぐらい、急激にアクセス数が伸びています!

Googleアクセス解析で統計的に偶然ではないアクセス数の急上昇を観測

残念ながら、このサイトの更新では食べていけないので、年度末締めの案件に追われておりますが、今年もご支援を頂きながら、できる範囲内でコンテンツを充実させていきたいと思っておりますので、引き続きのご支援よろしくお願い致します。

それでは、今年もそれぞれのチームを応援しながら、データに一喜一憂しましょう!


  • 3/30 レギュラーシーズン開幕
  • 4/13 西武、CS進出濃厚。残り131試合を73勝ぐらいで → 9/17 確定
  • 5/20 広島、CS進出濃厚。残り104試合を55勝ぐらいで → 9/14 確定
  •  6/ 6 楽天、パ・リーグ最下位濃厚 → 7/28 取消 → 10/1 復活 → 10/5 確定
  •  7/21 広島、セ・リーグ優勝濃厚。残り62試合を34勝ぐらいで → 9/26 確定
  •  7/28 日本ハム、CS進出濃厚。残り54試合を25勝ぐらいで → 9/27 確定
  •  8/26 ソフトバンク、CS進出濃厚。残り34試合を16勝ぐらいで → 9/22 確定
  •  9/14 ヤクルト、CS進出濃厚。残り17試合を6勝ぐらいで → 10/1 確定
  •  9/17 西武、パ・リーグ優勝濃厚。残り15試合を7勝8敗ぐらいで → 9/30 確定
  •  9/21 ヤクルト、セ・リーグ 2位濃厚 → 10/2 確定
  •  9/23 ソフトバンク、パ・リーグ 2位濃厚 → 10/2 確定
  •  9/23 日本ハム、パ・リーグ 3位濃厚 → 10/2 確定
  •  9/26 広島、セ・リーグ優勝! おめでとうございます!!
  •  9/30 西武、パ・リーグ優勝! おめでとうございます!!
  • 10/2 オリックス、パ・リーグ 4位濃厚 → 10/4 確定
  • 10/5 ロッテ、パ・リーグ 5位確定
  • 10/5 パ・リーグの全順位が確定しました。
  • 10/6 巨人、CS進出濃厚。残り1試合を1勝ぐらいで → 10/9 確定
  • 10/6 巨人、セ・リーグ3位濃厚 → 10/9 確定
  • 10/6 DeNA、セ・リーグ4位濃厚 → 10/9 確定
  • 10/7 中日、セ・リーグ 5位濃厚 → 10/8 確定
  • 10/7 阪神、セ・リーグ最下位濃厚 → 10/8 確定
  • 10/9 セ・リーグの全順位が確定しました。
  • 10/10 レギュラーシーズンの全日程が終了しました。
  • 10/18 広島、セ・リーグCSを制し、日本シリーズへ。
  • 10/21 ソフトバンク、パ・リーグCSを制し、日本シリーズへ。
  • 11/ 3 ソフトバンク、日本シリーズ優勝!! おめでとうございます!!


It is difficult to set up many computer with powerful CPU and GPU and large memory. Then we must share the resource of one powerful computer.

We can use a famous job queuing system “condor“. We have to use the condor to run programs which occupy CPU and/or GPU more than 10 minutes, which is enough for R&D.

condor_submit can submit your long jobs for each CPU and GPU. The online manual is located here. Read stable version.

A simple example: job1/submit.conder

universe                = vanilla
executable              = a.out
arguments               = infile$(Process).txt
should_transfer_files   = IF_NEEDED
when_to_transfer_output = ON_EXIT
initialdir              = workdir/run$(Process)
transfer_input_files    = infile$(Process).txt
log                     = job1.log
request_GPUs            = 1
queue 100

Submit your jobs by “condor_submit job1/submit.conder”
See the status of compute nodes by “condor_status”
See status of your jobs by “condor_q”

$(Process) will be replaced to process number 0-99 for “queue 100”. In the most case, you will need to prepare “initialdir” to store outputs and logs. The /home is shared via NFS, file transfer is not needed.
If you need to different input information for each jobs respectively, it will be useful.

If you want to use GPU, “request GPUs = 1” must be set.

The Tensorflow may allocate all available memory for one job by default, independently of how much memory jobs really need.
I know it is for the best memory bandwidth performance, but the gain is very small in most case.
Please consider to set “gpu_options.allow_growth = True”.
And your usage can be check by command “nvidia-smi”.

Remove “request GPUs” unless you need GPU. Your jobs run in parallel on 12 cores CPU.
Why all 24 logical cores will not be used is for single core performance and reserve for local users.

When you want to run multithread jobs, set “universe = parallel” may help us, but not work fine now…

universe                = parallel
executable              = a.out
arguments               = infile$(Process).txt
should_transfer_files   = IF_NEEDED
when_to_transfer_output = ON_EXIT
initialdir              = workdir/run$(Process)
transfer_input_files    = infile$(Process).txt
log                     = job1.log
machine_count           = 1
request_cpus            = 12
queue 100
Posted in HPC

中国の春節を花火で祝う映像がニュースで流れますが、私の地元では、旧正月の行事として「とんど」があります。

私の地域では、とんどづくりに2日、とんどに1日を使います。ちなみに、竹の櫓を「とんど」と呼び、とんどを焼くことを「とんど焼き」という地域が多いようですが、私の地域では、とんどを焼くことも「とんど」と言います。「明日はとんとじゃけ」みたいに使います。

また「とんど」「どんと」など呼び方も方言があります。もっとも、とんどの共通語はどこの言葉でしょうね。とんどを焼くことを「とんど焼き」と言う地域が多いようですが、うちの地域では、とんどを焼くことも「とんど」と言います。動詞にするときは「とんどをする」ですね。もちろん「とんどを焼く」でも意味は通じますが、あまり言いません。

どんどは基本的に、竹と縄だけを使い、櫓を組みます。これが「とんど」の骨組みになります。その中に、竹の葉・余った竹・広葉樹などを詰め込み、外側を茅葺きにして、檜の枝で棚飾りを作ります。このとんどを、夜更けに燃やし、残り火で餅を焼いて食べ、1年間の無病息災を願います。今年も、限界集落の皆が集まって、2日がかりでとんどをこしらえました。今年はその様子を連続写真で撮ってみました。

平成31年 東広島市黒瀬町田代地区2班 とんどづくりの様子

とんどは、広島地域で広く行われていますが、その大きさや作りも様々で、神輿のように担いで回る地域もあるそうです。うちの地域のとんどは、とても担げる大きさではありません。また、時期も、新暦の正月過ぎに行う地域が多いようで、時間も、午前に作って午後には燃やしてしまう所が多いようです。

このとんどづくりも、かなりの重労働なんです。動画の始めの方、青いつなぎに黒の防寒着の男性(私)が竹の枝打ち(枝を落とすこと)をやっていますが、1本に5分以上かかっています。後半で、ベテランの女性が大量の枝打ちを行っているのですが、早回しでは分からないぐらいの手際の良さです。とんどづくりでは、櫓を組むところをメインで担当してきたので、そちらのノウハウはだいぶ分かってきましたが、集まった人それぞれが、得意な技能を出し合ってはじめてとんどが完成するんだな、と、この動画を見て改めて思いました。

会社の運営と全く同じですね。船頭は信頼して貰える人でなければならないし、それぞれがそれぞれのできることをやって、一つの目標を達成する。その役割分担に優劣はありません。

普段、茶軸キーボードより重い物は押さない私ですが、帰郷して8年目にして、やっと骨組みの重要な部分を任されるようになりました。滑る竹を縄だけで固定していくのですが、ちゃんと縛り方を覚えると、見事に固定されます。ただ、これが見かけ以上に重労働で、しっかり引っ張って、締めて、結ぶ、という作業中、力が抜けません。一方、ベテランの方は、何度か要所で力を入れるものの、緩まない持ち方、結び方を知っているので、楽に締めていきます。この辺は、プログラミングに似ているかもしれませんね。力業でガンガン書き進める若手と、基本を押さえて最小限のコードで書いちゃうベテラン、みたいな?

さて、私が加わった骨組み作りですが、やらかしちゃいました。寝かせて組み立てた骨組みを起こす際に、土台付近の竹が割れる事故が起こったのです。どうも、最初に竹を切り出す際に、選んだ竹が良くなかったようです。できるだけまっすぐなものを選ぶのはもちろん、1年目の柔らかい竹ではなく、3年目ぐらいの固い竹を選ばなければダメだったようで。こんなの上の世代には常識ですが、私の頭には竹の年齢などまったく考慮されておらず、失敗となりました。

失敗は失敗として、その後、ちゃんとした竹で組み直しリカバーできました。会社組織でも同じですが、失敗を責めるより、リカバーに専念するほうがよほど建設的ですね。ちなみに、バッテリーが切れたので、このリカバーの様子は動画に入っておらず、翌週、櫓が建った状態に飛んでいます。

動画からも分かる様に、限界集落の主戦力は60代、人数もギリギリです。とんども年々簡素になっていきます。あと10年も続けられるでしょうか。氏子の神社の記録によると、私たちの先祖がこの土地を開墾して神社を建ててから今年で1,097年だそうで、自分たちの代で、千百年の歴史に幕が下りるのかと思うと、少し寂しいです。


ながらく更新が滞ってしまいましたが、もう2月も一週間が過ぎようとしています。各球団ともキャンプが始まり、これから練習試合、オープン戦とみていたら、すぐに開幕ですね。待ち遠しいです!

メガフォン放送をふり返って、シーズン終盤になるにつれ、声の張りがなくなっていくなあ、と自分でも思います。この秋~冬は、大きく体調を崩していたのですが、寒くなるにつれ、徐々に良くなってきました。通院は減りませんが、ヨガをしたり、ジョギングをしたりと、とにかく体調維持のためにできる事は何でもやっています。

さて、今シーズンのアップデートですが、昨年ご支援を頂いた分は、サーバのチューニングに使いました。混雑時のスマートフォンからのアクセスがより快適になったはずです。また、wordpress の独自 plugin を整理して、今後の拡張に耐えるよう、設計を整理中です。見えない部分ばかりですが、開幕までにできそうなのはここまでです。

選手単位のシミュレーションですが、やはり、言うは易しで、やってみるとノード数が1段足りなかったり、それで学習手法も大きく変わったりと、色々と難航しています。ただ、これのおかげでAI界隈の方々と繋がりができまして、大学の研究会に呼んでいただくなどで、面白い動きになってきております。

日々のシミュレーションに先発投手を考慮する件は、すみません、まだ全然進んでいません。シーズンが始まるあたりで、上記の選手単位のシミュレーションを一区切りさせて、こちらを優先させようと思っています。

いかんせん、本業の合間を縫っての趣味の範疇でしか時間を割けていないので、環境構築の時間や費用の捻出すらままならない状況です。本業も零細企業ですので、それほど余裕もなく、なかなかこちらにリソースを回せません。引き続きご支援お待ちしております。


消費税増税に伴う経済対策や軽減税率の制度が色々議論されています。

しかし、根本的な疑問。

そもそも、税とは、金が金を呼ぶ資本主義において、富の再分配を行い、国民に(そこそこ)等しく公共サービスを提供するためにあるはずです。高所得者には損になるけれど、低所得者には有利になるべきはずのもの。

増税そのものが低所得者の首を絞めるような税なら、そもそも税設計に問題があるのでは? そもそも、消費するためには所得が必要なので、所得税で集めれば十分なはず。

消費税を徴税するために民間が支払っている経理コストをざっくり見積もると、月3万円×12ヶ月+決算期14万円 = 50万円、×200万社で1兆円単位なんですよね。軽減税率が加わればよりややこしくなります。ホント無駄なコストです。

官僚は「所得税は景気に左右されやすいが、消費税は安定財源になる」と言いますが、景気を安定させるのは財務省の最大の仕事なので、そこはそちらが頑張るところでしょうに。

また、世界で値下げ競争が激化している法人税ですが、日本でも色々な減免政策がとられていて、大企業への実効税率が大幅に抑制されているんです。そういう減免が受けられない中小企業が3割近く納税しているのに、大企業は利益に対して非常に軽い税率になってしまっている。富の再分配から言えば間違いとも言えますが、しかし、大企業の設備投資や先行研究が明日の日本経済を引っ張っていくので、これを阻害するのは自分の首を絞めることにもなります。そもそも利益の少ない中小企業の納める法人税額などたかがしれているので、いっそ、シンプルに、一律減税してしまえばいいと思います。国際大企業の拠点が租税回避地にどんどん逃げてしまうより、アジアの拠点として日本を使って貰うほうがはるかに大事ですよ。

社会保険関係の税金も、半分企業負担というインチキ。給与明細には、額面25万、天引き5万、会社負担も5万、手取りは20万円、となってますが、企業経理から見ると、人件費30万円、納税10万円、手取り20万円になっているわけで、見た目の天引き額を半額にしているだけ。完全なまやかしです。

また、国民健康保険税など、超高所得者への税率が極端に下がるなど、おかしな税率になっているし、そもそも社会保険庁が国税庁と別にこの徴収を行うのは無駄も多いので、所得税に組み入れて単純化すべきです。

税金なんて、究極的には3種類で良いんです。

  • 社会サービスと富の再分配のための所得税
  • 死蔵資産を社会に還元させる資産税
  • 機会の平等を担保するための相続贈与税

ついでに、国会議員の報酬は、固定給を8割減して、出来高制にしたらどうかと。

素人のどうでもいい話に、お付き合いありがとうございました。


日本シリーズが始まりますね! モデル計算に必要な統計量が少ないため、日本シリーズの確率計算は難しいのですが、一応、試合前はこのような値になっています。

ソフトバンク広島確率
40 9.5%
4116.9%
4218.7%
4316.7%
3413.5%
2412.1%
14 8.7%
04 3.9%

これを、4-0 または 4-1 での勝利を圧勝、4-2 以上にもつれての決着を有利、として、Twitter で行ったアンケート(投票数101)と比べてみます。

ソフトバンク広島確率アンケート得票
40-126%ソフトバンク圧勝34%
42-335%ソフトバンク有利28%
2-3426%広島有利23%
0-1413%広島圧勝15%

アンケートでも、ソフトバンクが優勢とみる方が多く、事前確率と同じような値になりました。素直な統計モデルを用いているので、人間が感じる感覚と大きなずれもないようですね。さて、運命の第一戦は、本日18:30プレイボール。千賀・大瀬良両エースの投げ合いに、強力打線がどう機能するか、楽しみですね。


今日、あっ、もう昨日か。注目のドラフト会議でしたね。ドラフトについて語れるほど詳しくはないので、これはスポーツメディアにお任せしますが、単純な手計算をしてみようかと。

各チーム、育成も含めて10人弱の選手をドラフトで獲得します。外国人選手も含めれば、年間10人ぐらいの新戦力が入ってくるわけですね。

それは、同時に、年間10人ほどがグランドを去って行くことも意味します。

早い選手は5年ぐらいで戦力外となる一方で、10年、15年、20年と活躍する選手も居ます。ここで、ざっくりと、5年後から10年活躍するのがレギュラー級、とすれば、今日プロへの切符を手に入れた若者が、10年後にレギュラーをはっている割合は1割ぐらいということになりますね。

人生を左右するには狭き門のようにも思いますが、若手研究者の関門である、ポスドクからテニュアへの門に比べたら1割は随分希望が持てる数字のように思います。まして、それがプロ野球選手という夢の大舞台への門なのですから、むしろ険しくも輝かしい道のようにも思えます。

このサイトでも、将来性を見越して頂けた方からのサポートを募集していますが、協力して頂けるのは、アクセス数の 0.01%ぐらいです。もちろん、こんなおじさんの将来性と比べても仕方ありませんが、10%はとても大きな可能性だと思います。

色々な試練が待っていると思いますが、怪我にだけは気をつけて、長い目で、かつ、1日1日を大事に頑張って欲しいと思います。それより、お前が頑張れよ、と言われそうですが…。


急場しのぎで立ち上げたサポーター制度ですが、数日の間で、数名の方よりご支援を頂きました。事前アンケートでも、無料でデータを公開しつつも、せっかく払うのなら、何かしら見返りがあるといいよね、という、とても寛大で自然なご意見を多く頂いたので、基本データに加えて、心ばかりのサポーター限定コンテンツを無理矢理用意しました。今後も、無理矢理用意していきます。

正直、この限定コンテンツの代金だと思うと、とんでもなく割高なものを売りつけていますが、コンテンツの企画・運営も、霞を食べては続けていけないことに、こうして、現金という具体的な形でご支援頂けること、とてもありがたく、尊く思っております。

資本家でもなんでもない、田舎の貧乏百姓の家に生まれても、高等教育を受けることができ、そこで学んだ知識を、こうしたプロジェクトにつぎ込み、これが会社の仕事として継続出来れば、本当にありがたい人生です。

色々な形でのご支援を頂いておりますが、最終ゴールで必要な「毎日のリアルタイムデータ」がとても高額なので、頂いたご支援に対し、どう応えていくかが問われてきます。とても難しいですが、今のところ、このようなロードマップを描いています。

  • まず、継ぎ接ぎだらけのプログラムとWebサイト・サーバ類を整理する。10万円ぐらいで随分良くなる。
  • 環境が整えば、現在のモデルに先発投手を考慮した拡張を導入する。最終目標に比べれば簡易な計算ではあるが、随分面白くなるはず。ここまでを来シーズンに間に合わせたい。
  • (ここが最初の時間とコストの壁)
  • 100万円ぐらい集まったら、テンソル計算の速い計算機を揃えたい
  • ずっと思い描いていた、選手単位でのシミュレーションを実装してく。たぶん3ヶ月ぐらいで最初の成果物が出せる
  • (ここに大きなコストの壁)
  • 数百万円集まったら、係数導出用データが買える。これで、開発した選手単位の計算モデルでの計算ができるようになる。
  • ていうか、これで数百万集められたら、それは凄いことで、きっとテレビ局からオファーがあって、中継とのタイアップとかもできるはず
  • (ここに大きな時間の壁)
  • それに耐えられる品質にするためには、更なる計算能力と2年ぐらいの調整が必要だが、マネタイズの幅も広がってくるはず

継続しているうちに、また色々な可能性が出てくると思います。ほぼ白紙委任でご支援頂くことで、柔軟な方針転換ができます。これまでも紆余曲折しながら続けてきたプロジェクトですので、これからも色々な可能性を探っていきます。

Continue reading