作成:2003年2月25日


TQTinyQ2.1 取扱説明書


TQ「TinyQ」とは?

 「TinyQ」は、「対話型変数選択法」による重回帰分析プログラムです。
 本プログラムは、多変量解析プログラム「まるば」を参考にして開発されています。「まるば」は、小林龍一立教大学名誉教授によって開発されたもので、重回帰分析・主成分分析・数量化1類・数量化2類・数量化3類・数量化4類などの多変量解析ができるという本格的なプログラムです。これに対して「TinyQ」は、「まるば」(Dos版)の「対話型変数選択法」に基づく重回帰分析のみを実現するプログラムです。
 このページでは、MacOSX版(Cocoa-Java)、Windows版(配布再開)、Pure Java版がご利用できます。

トップへ

TQ「対話型変数選択法」とは?

 「TinyQ」を使えば、重回帰分析における説明変数の選択を対話的に行うことができます。以下、変数を選択するときの手順を簡単に説明します。
 まず、それぞれの説明変数について「変数選択のためのF−値」を計算します。このF−値が最も大きな変数が、計算上最も説明力のある変数です。あなたは、分析の理論的含意を考慮しながら、F−値の高い変数を順番に説明変数として取り込んでいきます。大まかな目安としてF−値が2より大きいものを説明変数に取り込みます。最終的にF−値が2以上のものがなくなれば計算は終了します。

トップへ

TQ「TinyQ」の操作方法

 では、MacOSX(Cocoa-Java版)を使った分析例を紹介します(もちろん、他のバージョンでも基本的な使い方は変わりません)。
 はじめに、分析内容を簡単に説明しておきましょう。

 ここで取り上げる例は、企業規模や勤続年数を説明変数とした大卒男女の賃金構造の分析です。データは『賃金センサス』(2001年版)を使います。
 なお、この事例に関しては、蓑谷千凰彦『計量経済学 第3版』1997年(スタンダード経済学シリーズ、東洋経済新報社)を参考にしました。


 データ・ファイルの構造は以下のとおりです。データの1行目には、ラベルを使うことができます。

sex
year
scale1
scale1
wage
1 0 1 0 2744.88
1 1.5 1 0 3456
1 3.5 1 0 3995.64
... ... ... ... ...


この他に性別×勤続年数(sex*year)、規模1×勤続年数(scale1*year)、規模2×勤続年数(scale2*year)を加えています。

<注>
ここで、賃金は第1巻第2表「年齢階級、勤続年数階級別所定内給与および年間賞与その他特別給与額」から、「所定内給与額」×12+「年間賞与等」としました。
また、勤続年数(year)、性別(sex)、企業規模(scale)は、以下のようにコーディングします。
year :1-2年=1.5, 3-4年=3.5, 5-9年=7,...
sex :male=1, female=0
scale1: 1000人以上=1
scale2: 100-999人=1

(1)TinyQ の起動
 まずソフトウェアを起動します。



(2)データファイルを開く
 次に、「開く」メニューからCSV形式で保存されたデータファイルを開きます。
 すると、被説明変数を選択するためのダイアログが表示されますから、wage を選びます。



(3)説明変数の選択
 被説明変数を選択すると、メニューの下に被説明変数 wage が表示されます。また、ウィンドウの下にあるステータスバーには分析中のファイル名 wageData01.csv のパスが表示されます。
 画面中央のテーブルには、「Variables」、「F-Value」、「Std.Coefficient」の各項目が表示されています。
 変数を取り込むには、F 値に注目します。この値が最も大きい変数が最も説明力のある変数です。最初は、モデルに定数項だけがが取り込まれています。

 さらにF 値の欄を見てみると、勤続年数(year)が 351.4 で最も大きいので、この変数をモデルに取り込みます。変数を選択するときは、その行をクリックします。
 選択済みの変数はF 値がマイナスとなります。



 変数を選択すると、全体が再計算されます。そこで、上記と同様に説明力の高い変数を選択していきます。変数を選択するかどうかの基準は、F 値の絶対値が 2 より大きいかどうかを目安とします。

 テーブルのすぐ上に表示された多重共線性(Multicolinearity)は、現時点での相関行列の行列式を示しています。この値が急激に減るときは多重共線性が発生している可能性があるので注意が必要です。この値が(0.1)のk-1乗(kは説明変数の個数)より小さいと多重共線性が発生している恐れがあります。

 標準偏回帰係数は、すべてのデータをその標準偏差で割ってから重回帰分析をしたときの偏回帰係数を意味します。この値が大きい変数は、被説明変数(この場合 wage)に対する影響力が大きい変数です。



(4)結果の表示
 性別、勤続年数、規模1×勤続、規模2×勤続の4つの変数を選択した段階で、F 値が2 を上回る変数がなくなりました。これで分析は終わりです。[Calc]−[Show Result]メニューをクリックして、分析結果を表示してみましょう。各変数の偏回帰係数とt 値が表示されます。
 数値の小数点以下の桁数は、[Calc]−[Set Decimal]で1〜5桁の間で設定することができます。


 分析結果は以下のとおりです。

R^20.97370
自由度調整済みR^2 0.97155

 wage = 3029.82832 + 765.17778 * sex + 152.36260 * year
+ 90.54067 * scale1-year + 51.86443 * scale2-year

 計算結果は[File]−[Save Result As...]から、CSV 形式で保存することができます。

サンプル・データ
ダウンロード
wageData01.csv(1.4KB)

トップへ


TQ注意事項

  • 「TinyQ」は、「まるば」がもつ多様な機能のうち、ほんの1部を実現するに過ぎません。より高度な分析をしたい方は「まるば」をご参照下さい。
    また、統計学の基本やプログラムについての詳細な解説は省略しています。詳しくは参考文献をご覧下さい。

  • 本プログラムはフリーウェアーなのでどなたでも無料で利用できます。


トップへ


まるば参考文献

  • 小林龍一『相関・回帰分析入門』日科技連出版社、1972年
  • 小林龍一『パソコンによる統計解析』培風社、1983年
  • 小林龍一『パソコンによる多変量解析』培風社、1984年
  • 小林龍一『多変量解析プログラム まるば』1996年(自費出版)


トップへ


TQ用語の説明

  • 【CSV形式のデータ】
     TinyQで利用可能なデータファイルは、データ要素がカンマで区切られた形式、いわゆるCSV(Comma Separated Value)形式に限られる。CSV形式のファイルは一般的な表計算ソフトで利用可能である。
     また、第1行目はデータラベルとして利用できる。

  • 【変数選択用のF値】
     回帰分析において、各変数の説明力は編回帰係数をその標準偏差で割った値、いわゆるt値で判断される。「まるば」や「TinyQ」における変数選択用のF値は、このt値の2乗である。厳密には、F値の絶対値を、自由度1、n−k−1のF分布の上側5%点と比較して検定する(nはデータ数、kは変数の数)。しかし、通常はF値が2以上であれば変数に説明力があると考えて変数を取込む。プログラムにおいて、取込んだ変数のF値はマイナスの値になっていることに注意。

  • 【多重共線性】
     多重共線性とは、変数間の相関関係が非常に高い状態を指す。説明変数間に多重共線性が存在すると、偏相関係数の値が不安定になったり、その統計的有意性が低下したりする。
     「TinyQ」では、相関行列の行列式を計算しているが、この値が急速に減少する時には多重共線性の疑いがある。

  • 【標準偏回帰係数】
     編回帰係数を標準偏差で修正したもので、この値が大きい変数ほど被説明変数Yに対して影響力が大きい。


トップへ


TQ謝辞

 本プログラムの開発にあたって、「まるば」の開発者である小林龍一先生にアドバイスをいただきました。心から感謝いたします。
 また、東京情報大学助教授の内田治先生には、本プログラムの誤りを指摘していただいたうえ、有益なコメントをいただきました。この場をかりてお礼申し上げます。

トップへ

TQダウンロード

    Macintosh
  • TinyQ 2.1.0 for MacOSX(英語版)512KB
     Cocoa-Java版のため、最初の起動に時間がかかりますが、起動後の動作はPureJava版より格段に早くなりました。
     なお、PureJava版のMac用パッケージの配布は終了しました。

    【修正履歴】
    ver2.0.1
    (2002.11)
    • TiyQ2.0にいくつか不具合が見つかったので修正しました
    ver.2.0.2
    (2003.1)
    • いくつかの表記上の誤りを訂正しました
    • R^2と自由度修正済みR^2の両方を表示するようにしました
    • 残差の標準偏差、すなわち標準誤差(Std. Error)を表示するようにしました
    • 結果をCSV形式で保存する際、桁区切りを表すカンマが記録されていたため、データ区切りとみなされてしまうという問題がありました。そのため、数値の桁区切り表示をしないようにしました
    ver.2.1.0
    (2003.1)

     なお、MacOS X版は日本語対応する予定です。

    Windows(参考用)
  • TinyQ for Windows ver.2.1.1(日本語版) 213KB
     計算経過をF-値で並べ替える機能をつけ、メニューの配置をMac版に揃えました。(2003.2.25)

  • Pure Java
  • TinyQ for JAVA(日本語版)25KB
     TinyQを実行するためのJarファイルです。このファイルだけでもMacOSX(v.10.1以上)やJDKをインストールしたWindowsで動作させることができます。

  • TinyQ for Java 1.1 on Windows(日本語版)260KB
     JDK1.3をインストールしたWindowsで実行できます。(JDK、正確にはJava2 SDK1.3は、サン・マイクロシステムズ社のホームページから無料でダウンロードできます)
     Windowsでは、MS-DOSプロンプトから、jdk1.3\bin\にパスを切り、"java -jar TinyQ.jar"で実行することができます。
    <例>
    JDKのインストール先:C:\JDK1.3\
    TinyQ.jarファイルの場所:C:\TinyQ\
     この場合、以下のような文書をテキストファイルとして作成・保存した後、拡張子をtxtからbatに変更します。
    cd c:\TinyQ
    path c:\jdk1.3\bin\
    java -jar TinyQ.jar
    このバッチファイルをダブルクリックすることで、TinyQを起動することができます。

    マニュアル
  • TinyQ 2.1 取扱説明書(PDFファイル)588KB


トップへ


TQご意見はこちらへ

 TinyQに関するご意見、お問い合わせは村上英吾(a5murakami@yahoo.co.jp)までお願いします。

 また、TinyQを利用した研究などがあれば、ご連絡いただければ幸いです。

トップへ