Percentil Superior por Grupo


2

todos. Alguém pode me ajudar com o seguinte? Quaisquer ponteiros ou assistência é apreciada!

Eu tenho um subconjunto do conjunto de dados com +500.000 linhas semelhante a este

|— Group —|— Name —|— Value1 —|— Value2 —|

Dentro de cada grupo, Estou tentando identificar os nomes no top 5 e no top 10 percentile do Value 1 , para que eu possa continuar a calcular a soma do valor 2 para cada um dos percentis identificados.

Até agora eu fui capaz de criar uma tabela dinâmica que se parece com isso.

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

Eu pude identificar os percentis manualmente, mas imagino que haja uma maneira mais fácil. Fiz várias pesquisas sobre como proceder, mas só encontro procedimentos para encontrar percentis em todo o conjunto de dados.


1
Parece que você está apresentando uma linha de cabeçalho para alguns dados e um esquema para um produto de trabalho intermediário que acredita ser útil, mas não está conseguindo o que você deseja. Tente postar alguns dados reais junto com os cabeçalhos e modelos e uma representação dos resultados desejados para esses dados de entrada. Não precisa ser real, viver dados - na verdade, é melhor que não seja. Os grupos podem ser “gato”, “cachorro”, “raposa”, “vermelho”, “azul”, “verde”, etc .; nomes podem ser "Tom", "Dick", "Harry", "John", Paul ", George" e "Ringo"; os valores podem ser 1, 2, 4, 8, 10, 20, 40, 80.… (cont.)
G-Man

(Cont’d) ... Por favor, não responda nos comentários; editar sua pergunta para torná-lo mais claro e completo.
G-Man

Eu não acho que haveria um caminho fácil para isso. Você provavelmente precisará auxiliar colunas onde você calcula soma por categoria ( SUMIF ) e percentil ( LARGE, SUMIFS ).
Máté Juhász

Respostas:


1

A maneira como sua tabela dinâmica é configurada, aplicando um filtro top 10 Names vai encontrar o topo Names dentro de cada Group. Se você quiser encontrar o topo Names no geral, você tem que colocar o Names campo antes do Group campo.

Aqui está uma maquete que eu fiz:

Original

Quando eu filtro para o Top 2 Names:

Top 2 Names

Quando eu coloco Names como o campo superior e, em seguida, filtrar para o Top 2:

Corrected Top 2 Names


Como sugerido nos comentários, você também pode adicionar colunas auxiliares aos dados originais que calculam o impacto de cada linha e, em seguida, determinar se está no Top 10 e retornar TRUE / FALSE. Você pode então aplicar um filtro à tabela dinâmica para mostrar apenas aqueles com TRUE nesse campo.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.