<< faculty's book | Main | ESS >>

2005年05月01日

midterm season

日本はGWらしいけれど,UofCでは,今週末から来週半ばにかけて,負担がどどっと押し寄せてくる。midterm seasonなのです。

まず,昨日土曜日に,downtownで,accounting and financial analysis IIのmidterm。fall quarter以来,久々のテスト。難しくはなく,financial accountingもaccounting and financial analysis Iもとっていなくても何とかなる。ただし,前の晩は,午前1時まで復習していたけれど。

で,とりあえずmidterm一つ目が終わったので,

Saturday, April 30, 2005

UNIVERSITY SYMPHONY ORCHESTRA

"Spring Forth!" - The exuberance of the season explodes in Beethoven's playful, buoyant Symphony No. 2 in D Major, Ravel's evocative impressions of the spirit of Spain in Rapsodie Espagnole, and Arturo Marquez's nostalgic and sensuous Danzon No. 2 (1994), a nostalgic and sensuous dance that begins slowly and accelerates throughout. Barbara Schubert conducts.

Mandel Hall, 8 pm, $10 adults, $5 students

ひやっとしたところが数カ所あったけれど,結構良かった。後半の選曲がUSらしいといえばUSらしいかもしれない。

そして,昨日の夕方から,LaLondeのProblem Setに取り組んで,今になってやっと終了。regressionは大したことないんだけれど,といっても,dummyが多くて最初の打ち込みが面倒:
lm(formula = I(log(wage)) ~ school + I(aged - school - 6) + I((aged -
school - 6)^2) + tenure + I(race == 1) + I(race == 2) + I(urban ==
1) + I(urban == 2) + I(urban == 3) + I(region == 1) + I(region ==
2) + I(region == 3) + I(married == 1) + I(married == 2) +
I(married == 3) + I(married == 4) + I(sex == 1) + I(occup ==
1) + I(occup == 2) + I(occup == 3) + I(occup == 4) + I(occup ==
5) + I(occup == 6) + I(occup == 7) + I(occup == 8) + I(occup ==
9) + I(occup == 10) + I(occup == 11) + I(occup == 12))
Residuals:
Min 1Q Median 3Q Max
-3.486559 -0.243535 0.003588 0.245751 2.414315
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.351e+00 4.450e-02 120.237 < 2e-16 ***
school 5.939e-02 1.844e-03 32.205 < 2e-16 ***
I(aged - school - 6) 1.983e-02 1.092e-03 18.169 < 2e-16 ***
I((aged - school - 6)^2) -3.936e-04 2.136e-05 -18.431 < 2e-16 ***
tenure 1.513e-02 5.703e-04 26.535 < 2e-16 ***
I(race == 1)TRUE 7.085e-03 2.029e-02 0.349 0.7269
I(race == 2)TRUE -3.800e-02 2.384e-02 -1.594 0.1110
I(urban == 1)TRUE 8.061e-02 1.192e-02 6.763 1.42e-11 ***
I(urban == 2)TRUE 8.545e-02 1.068e-02 8.004 1.32e-15 ***
I(urban == 3)TRUE -1.041e-01 1.158e-02 -8.989 < 2e-16 ***
I(region == 1)TRUE 1.484e-04 1.137e-02 0.013 0.9896
I(region == 2)TRUE -9.326e-02 1.124e-02 -8.297 < 2e-16 ***
I(region == 3)TRUE -1.207e-01 1.087e-02 -11.106 < 2e-16 ***
I(married == 1)TRUE 1.016e-01 1.082e-02 9.395 < 2e-16 ***
I(married == 2)TRUE 1.443e-02 5.530e-02 0.261 0.7941
I(married == 3)TRUE 4.754e-02 2.250e-02 2.113 0.0346 *
I(married == 4)TRUE 9.298e-02 1.484e-02 6.267 3.82e-10 ***
I(sex == 1)TRUE 2.282e-01 8.533e-03 26.738 < 2e-16 ***
I(occup == 1)TRUE 4.868e-01 3.445e-02 14.131 < 2e-16 ***
I(occup == 2)TRUE 4.396e-01 3.487e-02 12.609 < 2e-16 ***
I(occup == 3)TRUE 4.885e-01 3.752e-02 13.018 < 2e-16 ***
I(occup == 4)TRUE 2.035e-01 3.409e-02 5.968 2.47e-09 ***
I(occup == 5)TRUE 2.512e-01 3.368e-02 7.460 9.29e-14 ***
I(occup == 6)TRUE -3.232e-01 5.937e-02 -5.443 5.34e-08 ***
I(occup == 7)TRUE 2.886e-01 4.188e-02 6.891 5.84e-12 ***
I(occup == 8)TRUE -3.330e-02 3.394e-02 -0.981 0.3265
I(occup == 9)TRUE 3.402e-01 3.385e-02 10.052 < 2e-16 ***
I(occup == 10)TRUE 2.058e-01 3.475e-02 5.922 3.26e-09 ***
I(occup == 11)TRUE 2.171e-01 3.678e-02 5.903 3.68e-09 ***
I(occup == 12)TRUE 7.927e-02 3.716e-02 2.133 0.0329 *
---
Residual standard error: 0.4036 on 11781 degrees of freedom
Multiple R-Squared: 0.4996, Adjusted R-squared: 0.4983
F-statistic: 405.5 on 29 and 11781 DF, p-value: < 2.2e-16

てな感じ。
でも,LaLondeに殺意を抱いたのは,data cleaning。まず,「top/bottomの1%ずつをcleanしろ」と言われてほいほいと消したところ,次の問題で「でも,今消した中に,消すべきでなかったものが含まれているかもしれない。全部チェックし直せ。」

うがー。このデータセット,1万2千人で,そのうち上下2%消したから,240人分のデータについて,一つ一つ不自然さの有無をチェックしろってことですか?
...チェックが終わった時点で,精神的にすさまじく消耗しましたよ,全く。

ソスソスソスeソスソス hatsuru : 2005年05月01日 15:53

ソスgソスソスソスbソスNソスoソスbソスN

ソスソスソスフエソスソスソスgソスソスソス[ソスフトソスソスソスbソスNソスoソスbソスNURL:
http://www.law.tohoku.ac.jp/~hatsuru/cgi-local/mt/mt-tb.cgi/320

ソスRソスソスソスソスソスg

ちなみに,上のは,途中経過で,最後に作ったのとは違います。あまりsignificantでないvariablesはeliminateしている。

それと,Heckman's two-step estimationの問題があって,RのmicEconライブラリの"heckit"を使ってみたら,計算途中でエラーが出て結果が出ず。正確には,2回エラーが出て,1回目は計算はじめてから5分後くらいに「502MBのメモリを使いつくしました」。メモリを1G与えて計算させてみたら,もう一度エラー。heckitの中をのぞいてみると,systemfitなどとは違って手抜きの(笑)ライブラリであることが判明。手動でprobitから計算しなおしました。

にしても,変数30個で1万2千個のデータのprobit計算は時間がかかる。一応,5回のiterationでmaximum likelihoodの推定に到達しているんですが。次にPCを買うときは,メモリ2Gくらいつんだ激速マシンにしよう...

ソスソスソスeソスソス hatsuru : 2005年05月02日 12:05