Qual é a diferença entre estatística computacional e ciência de dados?

A estatística computacional é uma maneira de fazer estatística. Do ponto de vista da disciplina, geralmente é restrito no departamento de Estatística. Não é muito encontrado no mundo corporativo. Não há muitos trabalhos com esta descrição.

A Ciência de Dados é um assunto interdisciplinar, que combina estatística e ciência da computação. Do ponto de vista disciplinar, é o departamento de estatística ou ciência da computação. É muito encontrado no mundo corporativo. Existem mais trabalhos com esta descrição.

A estatística computacional é um subconjunto da ciência de dados, sem dúvida o mais importante. Pode ser descrito livremente como "estatísticas tradicionais usando computadores".

A ciência de dados inclui vários outros elementos que não estão no escopo da estatística computacional, principalmente:

  • Aprendizado de máquina (embora alguns incluam isso também) Análise de big data

Embora a estatística computacional seja uma subárea da computação científica que segue o rigor científico, os cientistas de dados geralmente se contentam em aceitar qualquer método que forneça o melhor valor comercial.

Pelas definições que uso, estatística computacional é um subconjunto da ciência de dados. Dependendo do que estou fazendo, por exemplo, meu atual "papel" como cientista de dados de consultoria, quase todo o trabalho que faço seria rotulado como estatística computacional 10 anos atrás. Certamente, há dez anos, algumas das minhas ações não seriam possíveis, mas uma boa parte disso ainda seria denominada estatística computacional.

Caso você esteja se perguntando, fora das estatísticas computacionais, ultimamente, tem havido algum trabalho teórico da informação (parte do trabalho de ciência de dados), alguma engenharia de dados (talvez trabalho de ciência de dados) e, um tempo atrás, houve uma série de pequenas provas legais que eu fiz para alguém com relação à validade da estimativa (definitivamente não é um trabalho padrão de ciência de dados, mas muito útil, pois salvou meu cliente de muitas coleta de dados desnecessárias. A teoria é definitivamente útil na prática - apenas verifique se suas suposições são válidas).