順序尺度データの解析 - Jonckheereの検定

最近、研究データを解析していて順序尺度データを説明変数とした解析をやらなければならない状況になりました。

ダミー変数を使ってGLMで解析するのはしっくりこないし、チューキーとかの多重比較をするのも違う気がするし...。

ネットで探していると、Jonckheereの検定という検定を見つけました。

この検定は、カテゴリの順序が進むに伴って応答変数が増加するのか減少するのかを検定できます！まさに求めていたもの！！

使われる機会が多そうですが、あまり使われていないようです。

例えば、カテゴリが１から４まである状況で、応答変数が以下のときを考えます。

カテゴリ１：33　38　31

カテゴリ２：40　37　42

カテゴリ３：48　50　46

カテゴリ４：53　49　51

この場合、カテゴリが進むにつれて応答変数が増加するという仮定をおきます。

各カテゴリ間の各データを比べて仮定に合うペアの数を数える。

（１と２だと、33vs40、33vs37、33vs42、38vs40、38vs37...）

1 vs 2：カテゴリ２の方が大きいペア数は、８つ

1 vs 3：カテゴリ３の方が大きいペア数は、９つ

1 vs 4：カテゴリ４の方が大きいペア数は、９つ

2 vs 3：カテゴリ３の方が大きいペア数は、９つ

2 vs 4：カテゴリ４の方が大きいペア数は、９つ

3 vs 4：カテゴリ４の方が大きいペア数は、８つ

検定統計量は、ペア数の合計52となる。

Rでは、clifunというパッケージにあるjonckheere.testという関数で実行できる。

jonckheere.test(x,g,alternative="",nperm=NULL)

x：応答変数

g：順序尺度

alternative：two.side、increasing、decreasingから選択（例の仮定にあたる）

nperm：よくわからない...。デフォルト(NULL)のまま...。

使える検定なのにまだまだ知らないものはたくさんあるなと感じた一日でした。

生態学徒の備忘録