では、MacOSX(Cocoa-Java版)を使った分析例を紹介します(もちろん、他のバージョンでも基本的な使い方は変わりません)。
はじめに、分析内容を簡単に説明しておきましょう。
ここで取り上げる例は、企業規模や勤続年数を説明変数とした大卒男女の賃金構造の分析です。データは『賃金センサス』(2001年版)を使います。
なお、この事例に関しては、蓑谷千凰彦『計量経済学 第3版』1997年(スタンダード経済学シリーズ、東洋経済新報社)を参考にしました。
データ・ファイルの構造は以下のとおりです。データの1行目には、ラベルを使うことができます。
| sex |
year |
scale1 |
scale1 |
wage |
| 1 |
0 |
1 |
0 |
2744.88 |
| 1 |
1.5 |
1 |
0 |
3456 |
| 1 |
3.5 |
1 |
0 |
3995.64 |
| ... |
... |
... |
... |
... |
この他に性別×勤続年数(sex*year)、規模1×勤続年数(scale1*year)、規模2×勤続年数(scale2*year)を加えています。
<注>
ここで、賃金は第1巻第2表「年齢階級、勤続年数階級別所定内給与および年間賞与その他特別給与額」から、「所定内給与額」×12+「年間賞与等」としました。
また、勤続年数(year)、性別(sex)、企業規模(scale)は、以下のようにコーディングします。
year :1-2年=1.5, 3-4年=3.5, 5-9年=7,...
sex :male=1, female=0
scale1: 1000人以上=1
scale2: 100-999人=1
(1)TinyQ の起動
まずソフトウェアを起動します。

(2)データファイルを開く
次に、「開く」メニューからCSV形式で保存されたデータファイルを開きます。
すると、被説明変数を選択するためのダイアログが表示されますから、wage を選びます。

(3)説明変数の選択
被説明変数を選択すると、メニューの下に被説明変数 wage が表示されます。また、ウィンドウの下にあるステータスバーには分析中のファイル名 wageData01.csv のパスが表示されます。
画面中央のテーブルには、「Variables」、「F-Value」、「Std.Coefficient」の各項目が表示されています。
変数を取り込むには、F 値に注目します。この値が最も大きい変数が最も説明力のある変数です。最初は、モデルに定数項だけがが取り込まれています。
さらにF 値の欄を見てみると、勤続年数(year)が 351.4 で最も大きいので、この変数をモデルに取り込みます。変数を選択するときは、その行をクリックします。
選択済みの変数はF 値がマイナスとなります。

変数を選択すると、全体が再計算されます。そこで、上記と同様に説明力の高い変数を選択していきます。変数を選択するかどうかの基準は、F 値の絶対値が 2 より大きいかどうかを目安とします。
テーブルのすぐ上に表示された多重共線性(Multicolinearity)は、現時点での相関行列の行列式を示しています。この値が急激に減るときは多重共線性が発生している可能性があるので注意が必要です。この値が(0.1)のk-1乗(kは説明変数の個数)より小さいと多重共線性が発生している恐れがあります。
標準偏回帰係数は、すべてのデータをその標準偏差で割ってから重回帰分析をしたときの偏回帰係数を意味します。この値が大きい変数は、被説明変数(この場合 wage)に対する影響力が大きい変数です。

(4)結果の表示
性別、勤続年数、規模1×勤続、規模2×勤続の4つの変数を選択した段階で、F 値が2 を上回る変数がなくなりました。これで分析は終わりです。[Calc]−[Show Result]メニューをクリックして、分析結果を表示してみましょう。各変数の偏回帰係数とt 値が表示されます。
数値の小数点以下の桁数は、[Calc]−[Set Decimal]で1〜5桁の間で設定することができます。

分析結果は以下のとおりです。
| R^2 | 0.97370 |
| 自由度調整済みR^2 | 0.97155 |
wage = 3029.82832 + 765.17778 * sex + 152.36260 * year + 90.54067 * scale1-year + 51.86443 * scale2-year
計算結果は[File]−[Save Result As...]から、CSV 形式で保存することができます。
サンプル・データ
ダウンロード wageData01.csv(1.4KB)
|