R言語: 統計モデル全然理解できね

[ R プログラミング言語 ]

お小遣い帳を分析しようとしたとしましょう。Rでxtabsを使うと、こんな風に、どの月にどのくらい何をつかっていたかが簡単に集計できてたいへん便利です(データは架空ですよ)。

> df <- read.csv("test.csv")
> df
   月度   品名   費目  費用
1     2 送別会   外食  4500
2     2  R入門   書籍  3000
3     2 飲み会   外食  8000
4     2   天ぷら   外食  9500
5     2   余市   酒手  1550
6     3   塊魂   娯楽   900
7     3 ビール   酒手  5880
8     4 ビール   酒手  5880
9     4 ワイン   酒手  2100
10    4   定期 交通費 12000
> xtabs(費用 ~ 費目 + 月度, df)
        月度
費目       2     3     4
  外食   22000     0     0
  娯楽       0   900     0
  書籍    3000     0     0
  酒手    1550  5880  7980
  交通費     0     0 12000
>

...って意味わかんね! xtabsの第一引数は、「統計モデル」だそうで、~の左が目的変数・右が説明変数、かんぜんにちんぷんかんぷんです。勉強したおぼえもない。統計学はたいへん苦手な科目だったんですが、分かると世界がひろがりそうだから、勉強しなおそうかなあ...

トラックバック

このエントリーのトラックバックURL:
http://www.skoji.jp/mtbin/mt-tb.cgi/1204

コメント

xtabsパッケージは、カテゴリー別に合計値を出してくれるんですね。これ、重宝しそうです。
最初、tapply(df$費用],df$費目,sum) との違いがわかりませんでした・・・ orz

s/xtabsパッケージ/xtabs関数/

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)