株価とベンフォードの法則
いろいろな銘柄の株価を見ていると、
最上位の数字に1とか2が多いことに気が付くと思います。
例えばあなたの持っている銘柄の今日の終値を見てみて下さい。
1,000円台だったり、10万円台だったりしませんか?
このような現象はベンフォードの法則 (Benford's Law) と呼ばれています。詳しくはこちらのページなどで紹介されています。
簡単に説明すると、桁数がいろいろなたくさんの数字があるとき、先頭の数字の分布が
log10(1+1/D)
に従う、というのがベンフォードの法則です。
ただし、Dは1-9の数字です。あるいは次の式の方が分かりやすいかも知れません。
log10(D+1) - log10(D)
この式によると、30%以上の数字は1から始まり、17.6%は2から始まります。
つまり全体の半分近くが1か2から始まるということになります。
この法則の応用の1つとして、
決算資料の捏造をチェックするというようなことが行われています。
つまり決算書からすべての数字を抜き出して、その先頭の数字を数えます。
その分布がベンフォードの法則から大きく外れているようだと、
その決算書は人間の手によって捏造されたものである確率が高くなるというわけです。
では日本の株式市場で取引されている各銘柄の株価については
どうなっているのでしょうか?
もしこれがベンフォードの法則から大きく乖離しているようだと、
そこには何らかの歪みが生じていることになり、
効率的市場仮説の反例の1つになるかと思います。
2000年から2004年の各年の大発会の日の終値を用いて、これを検証しました。
その結果が下の棒グラフです。

横軸がそれぞれの数字、縦軸がその数字が株価の一番上の桁にある銘柄の割合です。
左側の棒が実際の株価について集計したもの、
右の棒が上の式を用いて計算した理論値です。
かなりの精度で理論値と同じ傾向が見られました。日本の株式市場で取引されている銘柄の株価も、ベンフォードの法則に従っている、と言って良さそうです。

このグラフは、計算値と理論値とのずれについて計算した結果です。
4が最も乖離が大きく、理論値に比べ12%程高い頻度で出現しています。
逆に理論値と比べ一番頻度が低いのは8で約7%下回っています。
となりあった数字で最も差が激しいのは4と5です。
この間には何か有意な差があるのかも知れません。
1つ考えられるのは単位株制度です。
2001年10月に単位株制度が廃止され単元株制度となりましたが、
単位株制度においては、ほとんどの銘柄が額面50円で取引されていました。
もしかしたら4で始まる株価が比較的多いのは、この影響なのかも知れません。