全体表示

[ リスト ]

データの処理 (統計)

普段は統計処理をしなければならないような実験はあまりやっていないのですが、それでも統計を使わなければ難しい問題というのはあるものです。

統計と言えば、生物系の研究をしているとよく「それは違うんじゃねぇか?」という場面に出くわします。

一番多いのが、「とりあえず、ビール!」とばかりに「とりあえず、t検定!」っていうのと、なんでもかんでも「平均値」でデータを出すというものですね。

確かにt検定は王様的な存在だとは思いますが、実際やってみればt検定が使えないデータが結構多い気がします。
・・・だって、そんなにきれいに正規性を示すデータってないですよ?
(サイコロ振るように単純に測定作業を繰り返すだけなら問題ないですが)

平均値も、バラツキが多いデータとか大きな外れ値があるとそれにひっぱられてわけのわからない数値になるので、場合によっては「中央値」あたりを使った方がいいんじゃないかって場面は多いと思います。

SDとSEも、使い方がくちゃくちゃな場面が多いですね。
確かにデータ数が増えれば、SEはSDに比べてちっちゃくなってグラフの見栄えは良くなりますが、そもそも表しているものが違うのだからどっちを使うかはちゃんと考えないといけない、と思います。

ざっくばらんにいうと、平均値で棒グラフかいてbarで示す場合、
 SD: データのバラツキ具合
 SE: 平均値がとりうるであろう範囲 (真の平均値の推定)
を表すわけだから、様々な要因でデータがばらつきやすい場合はSDでそれを示した方がいいと思うわけです。
けど、「barがでかいとデータが悪い」という人が多いのも事実だと思います。(残念なことですが)


私自身、まだまだ勉強しなければならないことが多いのですが、統計処理の持つ意味をはき違えないように、頑張っていこうと思います。
(生物学での統計ってのは、適当にやるくらいなら直感とfeelingで判断した方がマシというのが私の考えですがw)


また何か勉強したらその内容について書きたいと思います。
*検定方法の使い分けガイド的なものはいずれ書こうと思います。


よしもとブログランキング

もっと見る

[PR]お得情報

いまならもらえる!ウィスパーWガード
薄いしモレを防ぐパンティライナー
話題の新製品を10,000名様にプレゼント
ふるさと納税サイト『さとふる』
実質2000円で特産品がお手元に
11/30までキャンペーン実施中!
いまならもらえる!ウィスパーうすさら
薄いしモレを防ぐ尿ケアパッド
話題の新製品を10,000名様にプレゼント
お肉、魚介、お米、おせちまで
おすすめ特産品がランキングで選べる
ふるさと納税サイト『さとふる』

その他のキャンペーン


プライバシー -  利用規約 -  メディアステートメント -  ガイドライン -  順守事項 -  ご意見・ご要望 -  ヘルプ・お問い合わせ

Copyright (C) 2019 Yahoo Japan Corporation. All Rights Reserved.

みんなの更新記事