Padrão:
Assume que os dados normalmente distribuem recursos e os dimensionam para zero média e 1 desvio padrão.
Após a aplicação do redimensionador, todos os recursos terão a mesma escala.
Minmaxscaler:
Isso reduz seus dados no intervalo de -1 a 1 (se houver valores negativos)
Isso é usado quando a distribuição não é guassiana, responde bem se o desvio padrão for pequeno.
Este scaler é sensível a valores discrepantes…
Padronização do escore Z ou escala Min-Max?
“Padronização ou escala Min-Max?” - Não há resposta óbvia para esta pergunta. realmente depende da aplicação.
Por exemplo, nas análises de agrupamento, a padronização pode ser especialmente crucial para comparar semelhanças entre os recursos com base em determinadas medidas de distância. Outro exemplo de destaque é a Análise de Componentes Principais (PCA), onde geralmente preferimos a padronização do que a escala Min-Max, pois estamos interessados nos componentes que maximizam a variação
No entanto, isso não significa que a escala Min-Max não seja útil! Uma aplicação popular é o processamento de imagens, onde as intensidades de pixel precisam ser normalizadas para se ajustarem a um determinado intervalo (ou seja, de 0 a 255 para o intervalo de cores RGB). Além disso, um algoritmo de rede neural típico requer dados em uma escala de 0-1.