« ロング・イエロー・ロード:秋吉敏子=ルー・タバキン ビッグバンド | Main | マウスを飼う じゃない 買う »

May 11, 2005

血液型性格診断の嘘

 どこかの大学の先生(近場だが)の本のようだが,これは全く違う話。昔ある掲示板で問題にした話だが,その掲示板自体がなくなったので,ここでもう一度出しておこうと思う。

 このようなタイプの研究報告が出た,さて,これは血液型と性格の関連の存在を肯定するものか?

「わが○○リサーチでは,10代から50代の男女400人を対象に,血液型と性格の関連についてアンケート調査いたしました。調査はランダムに質問紙を送り,400人の方から返送されたデータをもとに結果を求めました。調査の結果,血液型によって性格がことなるという結果を数多く見出すことができました。たとえば,ダイエットの経験については,全体では約50%の方がダイエットを行っているのに対し,B型20代では75%,AB型10代ではなんと100%の調査者がダイエットを行っている事実が判明しました。この違いをして,血液型と個人の傾向に関連がないと誰が言えるでしょうか?」

 相当の人がひっかかりやすい文章だろう。心理学でも400人のサンプルをとって研究をすれば,それは「相当」のものである。さらに50%と75%,100%。降水確率なら間違いなく傘を持っていくかどうか変わるはず。しか〜し。ここが問題なのです。次に謎解きをしてみよう。

(1)10代から50代の男女に,年代と性別,血液型でばらつきが出ないようにサンプルを集めたとしたら,10代の男性のサンプルは何人か?
 世代(5)×性(2)×血液型(4)で,全部で40グループ。つまり1グループ10人になる。実際心理学の研究では,何らかのデータを収集するとき,1グループ30〜50人から200人以上になる事が多い(統計学上の理由から)。10人のグループで,50%と75%の差といえば,2.5人の差である。実は偶然でも,このくらいの偏りはありうるものである。
(2)ランダムに送りつけた質問紙から,ばらつきの出ないデータはとれるか?
 日本では,A型が多く,AB型が少ない。その比率はA:O:B:ABで4:3:2:1,これから考えると,実際にはAB型で10代の女性は,400人のうちの4人しかいないことになる。たまたま4人が全員ダイエット経験者だった,としても,そのグループの人数が少なければこの程度の偶然はありうるのである。
(3)平均50%とは,どういう意味か?
 400人中約200人がダイエットをしたことを意味するが,ダイエットは世代や性を通じて,みんな同じようにするのだろうか?実際には若い女性についてのダイエット率は,同世代の男性よりも高い比率であることが分かっている。もし若い女性のダイエット率が75%程度だとしたら,AB型の10代のダイエット期待値は4人中3人,1人増えて4人になっても,それは驚くことにならない「偶然」かもしれない。

 我々はかなりの「教育」を受けている。多くの人に,それも「ていねいな科学的方法」で調査すれば,それは信頼できるという先入観がかえってついているのかもしれない。一見正しそうに見える記事があっても,よくよく考えるとかなり間違った方法がとられていることも多いので,よーく考えてみるのがよいかもね。

(補遺)
心ある友人によると,単純なケースを仮定しても8000人以上のサンプルがこの場合必要とのこと。ありがとうございました。

|

« ロング・イエロー・ロード:秋吉敏子=ルー・タバキン ビッグバンド | Main | マウスを飼う じゃない 買う »

Comments

ちょっと気になったので意見を.

「心理学ではこのようなデータは普通30~50人」とありますが,こうやってしまうと,「30人から50人とれば安心」って思ってしまいませんか?

30~50人くらいだと,結構誤差が大きいのではないかと思います.簡単のために何かの質問のyes/noを判定して,A型が何%yesと答える人がいるか比率を推定するします.50人とったとすると(質問の答えが独立にベルヌイ分布になるとして,2項分布を正規分布に近似させたりして計算),yesが30%の場合には標準誤差が6.5%で,95%信頼区間の幅はほぼ6.5*4=26%となっちゃいます.

結局は,許せる誤差をどのくらいにするかという問題ですが,上下1%の誤差(95%信頼区間幅が2%)なら許してやろうとなると,今やった計算だと8500人くらい必要です.要するに,「微々たる差だから気にするな」ということを主張したいと思えば50人だと全然足りないのではないかと思います.

30~50人くらいが多いというのは確かだとは思いますが,「心理学では普通」ってのが少しひっかかりました.目的によっては普通じゃなくなるし,特に血液型と性格の関係は否定的な結論になることが多いので.

視聴率と同じなので,参考までにリンク書きまーす.
http://www.videor.co.jp/rating/wh/07.htm

計算間違っていたらすいません
ではではー.

Posted by: しまだひであき | May 11, 2005 at 09:41 PM

島田君へ
参考資料も読みました,8500人ね,やっぱり多いな。
仮想的に考えたネタだったので,最適被験者数を考慮したわけではなかったのです。0・1データでχ2検定をかけたと仮定して,比較的安定した差が見出せそうな1セルが,このくらいかなという「経験的数値」でした。
「心理学では普通」は厳密に言えばナシですよね。便宜的に分かりやすく伝える以上のメリットはないです。まあ,400ではまったくダメだろうという気はしたのですが。
最初は2000位でもダメはダメだろうなと思いました(最小のセルの期待値が20人になる),8500は予想外でした。
ありがとう,何かの形で示したいと思います。

Posted by: nikata | May 11, 2005 at 10:29 PM

仮説検定で差を出すってことが目的になると,また話は違ってくると思います.たとえば,50人で30%だったら,帰無仮説50%として有意ですから,この程度の差を見たいなら十分ということになるでしょう.

どのくらいの差があるのかをある程度推定しておいて,そこから実験の規模を決めるってのは,すごく重要だと思うのですが,実際どの程度やってるんですかね?もちろん,真の値は誰も分からないので,経験的にやった方が実は能率的なのかもしれないなーとも思っていますし,推定できないからこそおもしろい研究だってところがあると,規模はやってみなきゃ分からないってことになってしまいます.実験屋さんがどんな考えで規模を決めているのか気になるところです.私は一回やった実験で少し変数を変えた実験をするときは計算してからやりますが,そうじゃないときはカンでやっちゃいます.

なお,8500人ってのは,それを40グループに分けるんじゃなくて,1グループの回答の比率をそのくらいの誤差で推定したいとしたときの,1グループの人数です.だから,40グループあったら,340000人必要!!そうなっちゃうと,そもそも「95%信頼区間で上下1%の誤差で」っていう想定自体が現実的じゃなくて,見直しを迫られることになりますね.

Posted by: しまだひであき | May 14, 2005 at 08:11 PM

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/92639/4075340

Listed below are links to weblogs that reference 血液型性格診断の嘘:

« ロング・イエロー・ロード:秋吉敏子=ルー・タバキン ビッグバンド | Main | マウスを飼う じゃない 買う »