Estou apenas tentando replicar uma afirmação feita no artigo a seguir, Finding Biclusters Correlated from Gene Expression Data , que é:
Proposição 4. Se . então nós temos:
Eu. Se é um bicluster perfeito com modelo aditivo, é um bicluster perfeito com correlação em colunas; ii. Se é um bicluster perfeito com modelo aditivo, é um bicluster perfeito com correlação em linhas; iii. Se e são biclusters perfeitos com modelo aditivo, é um bicluster correlacionado perfeito. X I J C J X I J R I C J X I J
Essas proposições podem ser facilmente comprovadas ...
... mas é claro, eles não provam isso.
Estou usando alguns exemplos simples no documento, além de código R base + personalizado, para ver se consigo demonstrar essa proposição.
corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)
(da Tabela 1F)
algum código personalizado para converter o formato padrão X = para conforme descrito no artigo: X = R C T
svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
# but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?
R <- with(x, t(t(u) * sqrt(d)))
C <- with(x, t(t(v) * sqrt(d)))
if (!ignoreRank) {
ind <- which(x$d >= zerothresh)
} else {
ind <- 1:r
}
return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}
aplique esta função ao conjunto de dados:
> svdToRC(svd(corbic))
$R
[,1] [,2]
[1,] 0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,] 4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752
$C
[,1] [,2]
[1,] -1.092343 -1.0037767
[2,] 1.223860 -0.9812343
[3,] 3.540063 -0.9586919
[4,] -3.408546 -1.0263191
A menos que eu esteja alucinando, essas matrizes não são aditivas, mesmo que o corbic exiba uma correlação perfeita entre linhas e colunas. Parece estranho que o exemplo que eles fornecem exiba a propriedade que eles disseram que deveria ... a menos que eu esteja perdendo algum tipo de etapa de transformação antes ou depois do DVD?
4iii
diz isso P(R), P(C), additivity => P(X)
? (Estou abreviando " Y
é um bicluster perfeito" como P(Y)
). Parece que você está indo na outra direção, esperando a aditividade das outras condições. Por favor, explique mais.
4iii
não diz que se X
é um bicluster perfeitamente correlacionado R
e C
será aditivo. A implicação vai na outra direção. Agora, eu concordo que é estranho que o exemplo que eles dão não pareça com os teoremas a seguir. Talvez haja alguma outra informação que você poderia fornecer? Existe algum outro teorema que vai na outra direção?