Qual é a diferença entre depuração e enriquecimento de dados e quando você deve usar cada um?

A limpeza de dados está levando os dados coletados e tentando colocá-los em melhor forma para que possam ser analisados ​​ou analisados ​​melhor. Os dados brutos geralmente apresentam erros de ortografia, campos eliminados ou partes de campos, dados numéricos que estão fora dos limites, abreviações variadas (por exemplo, St. Str. Street ou nada) que podem impedir que os campos correspondam e outros problemas.

O enriquecimento de dados, por outro lado, está “enriquecendo” seus próprios dados / banco de dados, trazendo campos adicionais de outra fonte, para que você tenha um conjunto de dados mais completo que permita mais e melhores análises. Por exemplo, se você possui seu próprio banco de dados de seus clientes e pode obter informações sobre renda familiar para adicionar ao seu próprio banco de dados, isso seria chamado de enriquecimento de dados.

Considerando o exposto, deve ficar claro que a limpeza de dados é usada ao ler os dados coletados para análise e o enriquecimento de dados é usado quando há necessidade de ir além dos dados que você já possui.

Qual é a diferença entre depuração e enriquecimento de dados e quando você deve usar cada um?

Enriquecimento de dados

O Enriquecimento de Dados descreve o processo de mesclagem de conjuntos de dados para criar um novo e mais valioso conjunto de dados. Normalmente, dados externos (por exemplo, dados demográficos) podem ser combinados com dados transacionais internos para (novamente, por exemplo) alocar clientes para uma categoria demográfica específica. Os dados de mapeamento externo podem ser combinados com os dados de código postal (CEP) de um cliente para colocar sua residência em um local

Visualização de dados

. Em ambos os casos, você acaba com um conjunto de dados que pode ser usado de maneiras que o original não pôde.

Limpeza de dados

Uma forma vigorosa (às vezes muito vigorosa) de

Limpeza de dados

.

Definições extraídas de

Dicionário de dados e análises

.