統計の本を読んでいたところ、「疑似相関」という言葉が出てきました。
アイスクリームが売れると、ビールもよく売れる。2つの間に相関関係があるに違いない!というものです。
実際には、アイスクリームとビールの売り上げに相関関係があるわけではなく、ただ暑いから売れているだけです。
この「暑い」という3つ目の要素があるので、2つの相関関係があるように見える、というからくりです。
これを読んで、真っ先に思いついたのは、やっぱり競馬でした。
なんでこの要素が勝ちにつながるのか、理由はわからないけど、データとしては出ている、ということがたくさんあります。もっともらしいものから、オカルト的なものまで。
もしかしたら、世の中の競馬予想の根拠とされているデータは、もっともらしく見えて、ほとんど疑似相関なのかもしれません。
たとえば、先日の京成杯で、10年間で一度も7枠の馬が馬券にからんだことがないというデータがありましたが、見事に7枠の馬が来ました。データを100%信じて買っていたら、大ハズレです。
それこそこれは疑似相関ではないか?そう思って調べてみると、今年の7枠は1番人気の馬1頭でしたが、2022年は10番人気と4番人気。2021年は9番人気と5番人気。2020年は10番人気と4番人気。2019年は1番人気と8番人気でした。
2019年に1番人気が入っていましたが、それ以外の馬は微妙な人気。つまり、7枠が悪いのではなく、たまたま7枠に入った馬が微妙だっただけかもしれません。
このように、世の中の競馬予想に関する情報は、もしかしたら疑似相関ばかりかもしれません。そして、疑似相関だとうまく見抜ければ、真の理由に近づき、的確な予想につながる気がしています。そう単純にはいかないと思いますが・・・