複数の変数間の相関関係を分析する統計技法を「多変量解析」と言います。ある因子から判明していない結果を予測したり、すでに出ている結果を説明したりする時利用します。
Logistic回帰モデルの場合、予想結果は0または1で表されます。
*つまり特定の現象の発生の有無を調べるもの
例えば、複数の生活習慣と癌の有無を記載した表があったとします
目的変数(y) | 説明変数(x1, x2, x3, x4) | ||||
被験者 | 癌有無 | アルコール摂取量(ml) | 喫煙本数(本) | ホルモン剤使用有無 | 塩分摂取量(g) |
A | 1 | 500 | 10 | 0 | 8.0 |
B | 0 | 70 | 0 | 1 | 9.0 |
C | 1 | 300 | 15 | 0 | 9.4 |
(式)
l = ln(p/1-p)=b0 + b1x1+・・・・+bpXp
上記の表の説明変変数(癌の発生原因になりそうな生活習慣)を当てはめ、癌発生の有無との相関関係がわかればそれぞれの生活習慣の値から発見されていない癌の発生を予測することができます
参考
http://www.snap-tck.com/room04/c01/stat/stat99/stat0206.pdf