2012年03月10日
重回帰分析を含めた多変量解析ソフトで、説明変数(要因系) --> 目的変数(結果系)などの関連をパス図を使って分かりやすく表示するグラフィカルモデリングという無料ソフトがある。ここではこれをダウンロードした状態で、簡単な使用法を紹介する。なお、マニュアル(GMマニュアル.pdf)も入っているので、これを読めばとりあえず使い方が分かる。
1.使用するデータ:Golf2001GM.csv (プロゴルファーの獲得賞金額とゴルフスコアの簡易版)
2.変数間を偏相関係数の大きさをランク付けしてグラフ化した例
(ただし、0.1以下は小さい順に 0 と置いて繰り返し再計算:詳しくは後で説明する)
上の図はとりあえず偏相関係数の大きさに応じて結んだ簡単な関連図だが、これだけでも全体のイメージが掴める。ステップを踏んで順に説明する。
3.G-GM アイコン
(実際のデータは 120組あるが、その一部が表示される。)
5.多変量解析 --> グラフィカルモデリング --> 無向グラフ の順に指定、偏相関係数の表が現れる。
6.詳細設定 --> 自動切断基準 --> 切断判定値 0.100 を指定すると、計算が繰り返されて次の表になる。この考え方がグラフィカルモデリングのポイントの一つで、偏相関係数の小さい枝を順次切り落とし、中枝と太枝を残して関連図を描けば感覚的に分かりやすい。
7.推定モデル --> 独立グラフ をクリックすれば、次のような関連図が描かれる。
変数の●印をマウスで Drug すれば移動するので下の図のようにすることもできる。
8.上図に矢印を入れ、関連性の強さを標準偏回帰係数で表示すれば更に分かりやすくなる。
これは次回に説明する。
1.使用するデータ:Golf2001GM.csv (プロゴルファーの獲得賞金額とゴルフスコアの簡易版)
2.変数間を偏相関係数の大きさをランク付けしてグラフ化した例
(ただし、0.1以下は小さい順に 0 と置いて繰り返し再計算:詳しくは後で説明する)
3.G-GM アイコン
をクリックし、グラフィカルモデリングのプログラムを起動する。
4.ファイル をクリックし、 CSV( データ行列)形式 を指定、Golf2001GM.csv を開く。(実際のデータは 120組あるが、その一部が表示される。)
5.多変量解析 --> グラフィカルモデリング --> 無向グラフ の順に指定、偏相関係数の表が現れる。
6.詳細設定 --> 自動切断基準 --> 切断判定値 0.100 を指定すると、計算が繰り返されて次の表になる。この考え方がグラフィカルモデリングのポイントの一つで、偏相関係数の小さい枝を順次切り落とし、中枝と太枝を残して関連図を描けば感覚的に分かりやすい。
変数の●印をマウスで Drug すれば移動するので下の図のようにすることもできる。
8.上図に矢印を入れ、関連性の強さを標準偏回帰係数で表示すれば更に分かりやすくなる。
これは次回に説明する。
コメント