Winsorizing data significa substituir os valores extremos de um conjunto de dados por um determinado valor percentual de cada extremidade, enquanto Recortar ou Truncar envolve remover esses valores extremos.
Eu sempre vejo os dois métodos discutidos como uma opção viável para diminuir o efeito de valores discrepantes ao calcular estatísticas como a média ou desvio padrão, mas não vi por que alguém pode escolher um sobre o outro.
Existem vantagens ou desvantagens relativas ao uso de Winsorizing ou Recorte? Existem certas situações em que um método seria preferível? É usado com mais frequência na prática ou é basicamente intercambiável?