結城あすかの毎日電波思考 (あすか日記)

アクセスカウンタ

zoom RSS 文系エリート様の統計記事を鵜呑みにしてはいけないにょ

<<   作成日時 : 2018/05/06 01:30   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

 数字があれば信憑性が高いと思ってるのか、何かと我田引水に都合の良い統計を持ち出してくるのは公務員の作文と文系バカエリート様のネット記事だにょ。
 ま、公務員の作文なんかは故意に結論を捻じ曲げるために意図的にやってるのがミエミエだからここでは論じないにょ。一方、文系エリート様のネット記事には意図的なものもあれば、そもそも統計の意味を理解していないからマヌケな結論に至ってるというものも多いにょ。

 今回取り上げる例も、故意にやってるなら相当にしたたかだと思うけど、多分に統計の意味を理解してないという可能性の方が遥かに高いと思うにょ。


   「両親の身長が高過ぎる」と心配している女の子へ


 記事では正規分布について触れた後で、日本人の身長の統計が正規分布であるという前提のもとで、極端に身長の高い人や低い人は極めて少なく、多くの人は平均値から標準偏差の範囲内に収まり、「平均値への回帰」があるから、両親の身長が高過ぎてもその娘はその標準偏差内に収まる可能性が高いとかいうようなことを言ってるにょ。
 ま、賢明な人にはこれだけでいろいろとツッコミどころがあることがわかると思うにょ。

 そもそも正規分布というのは、「サイコロを100回振って出た目の合計」とかいうように個々の目の出現確率がどんな場合でもイーブンで、目の合計というサンプル値が最終的な平均値付近でメジャー値を取る場合、そのサンプル値を1000回とか10000回とか数多く取った時に理想的に出現する統計傾向に過ぎないにょ。
 日本人の身長なんてものは平均値付近に収束することが科学的に保証されてるわけではなく、ただ、1億人ぐらいのサンプルと取ったらいろいろな個々の条件が相殺されてしまって、現象として正規分布に近いような統計結果になってるだけの話だにょ。
 つまり、身長の統計が正規分布を示しているとしても、それは日本全国のサンプルを集めた上での全体的な傾向を示しているだけであって、遺伝的に身長の高い一族とか逆に身長の低い一族が存在しないということを示してるわけではないにょ。

 文系の統計記事によく見られる誤解として、統計結果を確率的保証値と取り違えてることが多いけど、この記事の趣旨もそういう誤解から来てるところが大きいかにょ。統計結果はあくまで、サンプル集合が示す全体的傾向に過ぎないのであって、個々のサンプルの値として保証されてるものではないにょ。
 身長の統計で言えば、これは何の条件もなく単に日本人全体の身長を集めた全体の傾向を示してるだけであって、「両親の身長が高過ぎる」という条件を加味した場合のことなど何も示していないにょ。

 この統計結果としての傾向と保証値は違うということの一番わかり易い例は、スマホゲームとかのガチャの確率かにょ。あるレアなアイテムの出現確率が0.1%であるとした場合、1000回ガチャを回した人が1000人ぐらいいたら、統計的にはそのアイテムを1人1個獲得したというような結果になるだろうにょ。ただし、これは1000回ガチャを回せば誰でも必ず1個獲得できるというわけではないにょ。数個獲得できる人もいれば、獲得できない人もかなりの数いるだろうにょ。
 これを保証値とするためには、ガチャの有効回数を全1000回に固定し、その1000回中に必ずそのアイテムが出る仕掛けが必要だにょ。確率とか統計結果とかはあくまで傾向を示すだけであって、結果の保証にはそれなりの仕組みや理屈が必要だにょ。

 ここまで書けば「平均値への回帰」というのが意味不明というのがわかるだろうにょ。統計というのは全体傾向を示すだけであって、個々のサンプルに何か作用するものではないにょ。サンプルが数多くあれば、平均値に近いものが全体として多くなるというだけであって、特定の値を平均値に近付けるような現象はどこにも発生しないにょ。
 以上は単純に数学としての統計学の話だけど、人間の身長(それも統計平均とかじゃなく具体的個人の身長)とかいう話だと、統計なんかよりも遺伝子とか生活環境とかそんなものの影響の方が遙かに大きいのは自明だにょ。身長が高いのが優性遺伝であるなら、両親ともに高けりゃ娘が高くなる可能性は大きいだろうし、貧困で栄養失調を起こしてるような生活環境なら十分に成長できずに平均よりずっと低い身長になるかもしれないにょ。

  
高身長同士男女の子孫と低身長同士の男女の子孫に「平均値への回帰」が生じなければ、現代でも高身長族と低身長族に二分化しているはずだ。


 身長差による統計上の分化が生じていないというのは、確かに「平均値への回帰」というような現象が起きているのかもしれないけど、それは統計的作用ではないにょ。単に高い人同士や低い人同士の結婚だけで子孫が作られてるわけじゃなく、何十世代も経れば各世代の身長的特徴なんて誤差に過ぎなくなる程度のものでしか無いということを示してるだけだろうにょ。
 統計に精度を求めるには一定以上のサンプル数が必要なのと同様、遺伝的傾向を統計で語るにはそれなりの世代数を経た上でないと意味がないにょ。そして統計は傾向を示すだけで結果を保障するものではないにょ。何百年何千年とかいうスパンでの身長の統計傾向を(きちんとしたサンプルを示した上で)語るならともかく、「両親の身長が高過ぎる」という女の子個人の身長を語るには何の根拠にもならないにょ。

 ま、実際のところ身長が高いのが優性遺伝なのかどうかは知らないけど、統計とか持ち出してくるなら、「両親の身長が高過ぎる」という限定条件を踏まえた上での統計資料を持って語るくらいの誠意は示してほしいものだと思うにょ。
 ということで、統計を根拠として持ち出してる記事だからと鵜呑みにするようなことはやめたほうが良いということだにょ。

統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)統計でウソをつく法―数式を使わない統計学入門 (ブルーバックス)
ダレル・ハフ 高木 秀玄

講談社 1968-07-24
売り上げランキング : 24305

Amazonで詳しく見る
by G-Tools

テーマ

関連テーマ 一覧


月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
本 文
文系エリート様の統計記事を鵜呑みにしてはいけないにょ 結城あすかの毎日電波思考 (あすか日記)/BIGLOBEウェブリブログ
文字サイズ:       閉じる