Qual é o papel do MDS nas estatísticas modernas?


18

Recentemente, deparei-me com dimensionamento multidimensional. Estou tentando entender melhor essa ferramenta e seu papel na estatística moderna. Então, aqui estão algumas perguntas norteadoras:

  • Quais perguntas ele responde?
  • Quais pesquisadores geralmente estão interessados ​​em usá-lo?
  • Existem outras técnicas estatísticas que executam funções semelhantes?
  • Que teoria é desenvolvida em torno dela?
  • Como o "MDS" se relaciona com o "SSA"?

Peço desculpas antecipadamente por fazer uma pergunta tão confusa / desorganizada, mas também é a natureza do meu estágio atual neste campo.


7
As ilustrações em outras partes do SE tratam dos dois primeiros itens: gis.stackexchange.com/a/20428 ; gis.stackexchange.com/a/15567
whuber

Respostas:


24

Caso você aceite uma resposta concisa ...

Que perguntas ele responde? Mapeamento visual de dissimilaridades aos pares no espaço euclidiano (principalmente) de baixa dimensionalidade.

Quais pesquisadores geralmente estão interessados ​​em usá-lo? Todos que pretendem exibir grupos de pontos ou obter uma ideia das possíveis dimensões latentes ao longo das quais os pontos se diferenciam. Ou quem quer apenas transformar uma matriz de proximidade em dados de pontos X variáveis.

Existem outras técnicas estatísticas que executam funções semelhantes? PCA (linear, não linear), análise de correspondência, desdobramento multidimensional (uma versão do MDS para matrizes retangulares). Eles estão relacionados de maneiras diferentes ao MDS, mas raramente são vistos como substitutos dele. (PCA linear e CA são operações de redução de espaço de álgebra linear estreitamente relacionadas em matrizes quadradas e retangulares, respectivamente. MDS e MDU são algoritmos iterativos de ajuste de espaço geralmente não-lineares iterativos semelhantes em matrizes quadradas e retangulares, respectivamente.)

Que teoria é desenvolvida em torno dela? A matriz de dissimilaridades observadas é transformada em disparidades T de modo a minimizar o erro ESTE de mapear as disparidades por meio de distâncias euclideanos em m espaço -dimensional: S t = m D + E . A transformação pode ser solicitada linear (MDS métrica) ou monotônica (MDS não métrica). E pode ser um erro absoluto ou um erro ao quadrado ou outra função de tensão . Você pode obter um mapa para uma única matriz SDmST=mD+EES(MDS clássico ou simples) ou um mapa para muitas matrizes de uma só vez com um mapa adicional de pesos (diferenças individuais ou MDS ponderada). Também existem outras formas, como MDS repetido e MDS generalizado. Portanto, o MDS é uma técnica diversificada.

Como o "MDS" se relaciona com o "SSA"? Noções sobre isso podem ser encontradas na página da Wikipedia do MDS.

Atualização para o último ponto. Esta nota técnica da SPSS deixa impressão de que SSA é um caso de Multidimensional desdobramento (procedimento PREFSCAL em SPSS). O último, como observei acima, é algo MDS aplicado a matrizes retangulares (ao invés de quadradas simétricas).


3
(+1) Bom resumo! Forrest Young (já citado por @whuber em seu comentário), Yoshio Takane e Jan de Leeuw têm alguns artigos muito bons sobre o MDS.
chl

@chl, obrigado: artigos úteis na página de Takane em abundância
ttnphns

6

@ttnphns forneceu uma boa visão geral. Eu só quero adicionar algumas coisas pequenas. Greenacre fez um bom trabalho com a Análise de Correspondência e como ela está relacionada a outras técnicas estatísticas (como MDS, mas também PCA e outras), você pode dar uma olhada nas coisas dele (por exemplo, esta apresentação pode ser útil). Além disso, o MDS é normalmente usado para fazer um enredo (embora seja possível extrair apenas algumas informações numéricas), e ele escreveu um livro para esse tipo geral de enredo e o colocou na web gratuitamente aqui(embora apenas um capítulo seja sobre gráficos MDS por si só). Por fim, em termos de uso típico, é usado com muita frequência em pesquisas de mercado e posicionamento de produtos, onde os pesquisadores o usam descritivamente para entender como os consumidores pensam sobre as semelhanças entre os diferentes produtos concorrentes; você não deseja que o seu produto seja pouco diferenciado do resto.


1
(+1) Entendendo Biplots , de Gower e Coll. também é um ótimo livro (ele vem com um pacote R binário , somente para Windows), com cerca de 50 pp. em MDS e biplots não lineares.
chl

2
@chl, obrigado pela dica, esse livro parece interessante.
gung - Restabelece Monica

1

Uma força adicional é que você pode usar o MDS para analisar dados para os quais você não conhece as variáveis ​​ou dimensões importantes. O procedimento padrão para isso seria: 1) fazer com que os participantes classifiquem, classifiquem ou identifiquem diretamente a similaridade entre os objetos; 2) converter as respostas em matriz de dissimilaridade; 3) aplique o MDS e, idealmente, encontre um modelo 2 ou 3D; 4) desenvolver hipóteses sobre as dimensões que estruturam o mapa.

Minha opinião pessoal é que existem outras ferramentas de redução de dimensão que geralmente são mais adequadas para esse objetivo, mas que o MDS fornece é a oportunidade de desenvolver teorias sobre as dimensões que estão sendo usadas para organizar julgamentos. É importante também ter em mente o grau de estresse (distorção resultante da redução de dimensão) e incorporá-lo ao seu pensamento.

Eu acho que um dos melhores livros lançados no MDS é "Applied Multidimensional Scaling" de Borg, Groenen & Mair (2013).

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.