順序尺度データの解析 - Jonckheereの検定
最近、研究データを解析していて順序尺度データを説明変数とした解析をやらなければならない状況になりました。
ダミー変数を使ってGLMで解析するのはしっくりこないし、チューキーとかの多重比較をするのも違う気がするし...。
ネットで探していると、Jonckheereの検定という検定を見つけました。
この検定は、カテゴリの順序が進むに伴って応答変数が増加するのか減少するのかを検定できます!まさに求めていたもの!!
使われる機会が多そうですが、あまり使われていないようです。
例えば、カテゴリが1から4まである状況で、応答変数が以下のときを考えます。
カテゴリ1:33 38 31
カテゴリ2:40 37 42
カテゴリ3:48 50 46
カテゴリ4:53 49 51
この場合、カテゴリが進むにつれて応答変数が増加するという仮定をおきます。
各カテゴリ間の各データを比べて仮定に合うペアの数を数える。
(1と2だと、33vs40、33vs37、33vs42、38vs40、38vs37...)
1 vs 2:カテゴリ2の方が大きいペア数は、8つ
1 vs 3:カテゴリ3の方が大きいペア数は、9つ
1 vs 4:カテゴリ4の方が大きいペア数は、9つ
2 vs 3:カテゴリ3の方が大きいペア数は、9つ
2 vs 4:カテゴリ4の方が大きいペア数は、9つ
3 vs 4:カテゴリ4の方が大きいペア数は、8つ
検定統計量は、ペア数の合計52となる。
Rでは、clifunというパッケージにあるjonckheere.testという関数で実行できる。
jonckheere.test(x,g,alternative="",nperm=NULL)
x:応答変数
g:順序尺度
alternative:two.side、increasing、decreasingから選択(例の仮定にあたる)
nperm:よくわからない...。デフォルト(NULL)のまま...。
使える検定なのにまだまだ知らないものはたくさんあるなと感じた一日でした。