Meu desejo é descrever a complexidade do tempo de várias abordagens de agrupamento. Por exemplo, suponha que tenhamos pontos de dados em m espaço dimensional.
Suponha-se ainda que a matriz de pares de dissimilaridade de n x n dimensões já é calculado e que já passou S ( m ⋅ n 2 ) passos. Qual é então a complexidade do tempo apenas de
- cluster hierárquico (HC) usando a ligação de Ward
- HC usando ligação completa
- HC usando ligação média
- HC usando ligação única
- abordagem k- médio
- abordagem k- significa
Existe algum benefício se a matriz de dissimilaridade já não estiver computada? Pelo que entendi, é necessário para a abordagem HC e k -medóide, mas não para k - significa?
Obrigado pela ajuda!