Чтобы определить меры связывания или меры согласования, определите функцию согласования следующим образом:
Позвольте быть случайной пары с связкой , и с связкой . Затем определите
так называемая функция согласования . таким образом
Как доказано на прошлой неделе,
Основываясь на этой функции, можно получить несколько мер согласования. Популярная мера тау Кендалла, от Kendall (1938) , который определяется как т.е.
что просто .
Здесь вычисления могут быть сложными. Рассмотрим следующий пример:
set.seed(1) > n=40 > library(mnormt) > X=rmnorm(n,c(0,0), + matrix(c(1,.4,.4,1),2,2)) > U=cbind(rank(X[,1]),rank(X[,2]))/(n+1)
Тогда, используя функцию R, мы можем легко получить тау Кендалла,
> cor(X,method="kendall")[1,2] [1] 0.3794872
Чтобы получить наш собственный код (и немного больше понять, как получить этот коэффициент), мы можем использовать
> i=rep(1:(n-1),(n-1):1) > j=2:n > for(k in 3:n){j=c(j,k:n)} > M=cbind(X[i,],X[j,]) > concordant=sum((M[,1]-M[,3])*(M[,2]-M[,4])>0) > discordant=sum((M[,1]-M[,3])*(M[,2]-M[,4])<0) > total=n*(n-1)/2 > (K=(concordant-discordant)/total) [1] 0.3794872
или следующее (мы будем использовать случайные величины довольно часто),
> i=rep(1:n,each=n) > j=rep(1:n,n) > Z=((X[i,1]>X[j,1])&(X[i,2]>X[j,2])) > (K=4*mean(Z)*n/(n-1)-1) [1] 0.3794872
Другой мерой является ранговая корреляция Спирмена из Спирмена (1904) ,
где есть распространение .
Здесь, что приводит к следующим выражениям
Численно мы имеем следующее
> cor(X,method="spearman")[1,2] [1] 0.5388368 > cor(rank(X[,1]),rank(X[,2])) [1] 0.5388368
Обратите внимание, что также можно написать
Другой мерой является индекс cograduation, полученный от Gini (1914) , полученный путем введения нормы L1 вместо нормы L2 в предыдущем выражении,
Обратите внимание, что этот индекс также можно определить как . Вот,
> Rx=rank(X[,1]);Ry=rank(X[,2]); > (G=2/(n^2) *(sum(abs(Rx+Ry-n-1))- + sum(abs(Rx-Ry)))) [1] 0.41
И, наконец, еще одна мера — из Blomqvist (1950) . Позвольте обозначить медиану , то есть
Затем определите
или эквивалентно
> Mx=median(X[,1]);My=median(X[,2]) > (B=4*sum((X[,1]<=Mx)*((X[,2]<=My)))/n-1) [1] 0.4