Qual é a diferença entre estatística e aprendizado de máquina?
  • O Machine Learning é um pessoal de banco de dados que faz análise de dados.A estatística aplicada é estatísticos que fazem análise de dados (estatística matemática é matemático fazendo estatística, uma meta-atividade análoga aos cientistas teóricos da computação que investigam, por exemplo, PAC e convergência - Infográficos são designers gráficos que fazem análises de dados.O jornalismo de dados é jornalistas que fazem análises de dados.Econometria é economistas que fazem análises de dados (e aqui você pode ganhar um Prêmio Nobel) .Psicometria é psicólogos que fazem análises de dados.Chemometria e Cheminformatics são químicos fazendo análise de dados. Bioinformática são biólogos fazendo análise de dados.
  • O Machine Learning é um pessoal de banco de dados que faz análise de dados.A estatística aplicada é estatísticos que fazem análise de dados (estatística matemática é matemático fazendo estatística, uma meta-atividade análoga aos cientistas teóricos da computação que investigam, por exemplo, PAC e convergência - Infográficos são designers gráficos que fazem análises de dados.O jornalismo de dados é jornalistas que fazem análises de dados.Econometria é economistas que fazem análises de dados (e aqui você pode ganhar um Prêmio Nobel) .Psicometria é psicólogos que fazem análises de dados.Chemometria e Cheminformatics são químicos fazendo análise de dados. Bioinformática são biólogos fazendo análise de dados.
  • O Machine Learning é um pessoal de banco de dados que faz análise de dados.A estatística aplicada é estatísticos que fazem análise de dados (estatística matemática é matemático fazendo estatística, uma meta-atividade análoga aos cientistas teóricos da computação que investigam, por exemplo, PAC e convergência - Infográficos são designers gráficos que fazem análises de dados.O jornalismo de dados é jornalistas que fazem análises de dados.Econometria é economistas que fazem análises de dados (e aqui você pode ganhar um Prêmio Nobel) .Psicometria é psicólogos que fazem análises de dados.Chemometria e Cheminformatics são químicos fazendo análise de dados. Bioinformática são biólogos fazendo análise de dados.

Estou respondendo a este apenas porque discordo parcialmente de todas as respostas anteriores. Em suma, acredito que Estatística e Aprendizado de Máquina são essencialmente equivalentes, mas são praticados por duas comunidades diferentes, que seguem práticas de publicação diferentes (conferências para ML, periódicos para Stat) e usam diferentes locais de publicação (por exemplo, JACM x Ann.Stat) e seja contratado por diferentes departamentos (CS / EE x Stat / Math). Cada vez mais, as comunidades estão interagindo e compartilhando idéias. O aprendizado de máquina enfatiza aspectos computacionais e propriedades de amostra finita. O Statistics possui muitos modelos assintóticos e paramétricos. Mas então, o Boostrap, EM, PCA, foi inventado por estatísticos, e a teoria do PAC é uma pedra angular do ML, e muitos artigos sobre esse assunto são publicados em periódicos de estatísticas. Portanto, isso é mais uma atitude genérica do que uma clara diferenciação. É justo acreditar que o nascimento do BC tenha sido amplamente benéfico para a Estatística (a ênfase em aplicações e computação, métodos de conjuntos, teoria de Vapnik-Chervonenkis) e que o pessoal do BC está se beneficiando de uma grande quantidade de teoria estatística já em vigor (o teoria dos processos empíricos, por exemplo). Como estatístico em treinamento, congratulo-me com o fato de que os cientistas da computação nos tiraram muita teoria (assintótica) e entraram em abordagens mais inventivas, como nos primeiros dias da estatística (pense Pearson, Fisher, De Finetti, Tukey, não Le). Cam ou Has'minsky).

Em sua defesa, eu acrescentaria que a estatística também vai muito além da regressão, e muitos conceitos são mapeados entre os dois campos: regressão categórica é classificação, estimativa de densidade é aprendizado não supervisionado, desenho experimental, análise seqüencial e problemas de bandidos são aprendizado ativo, estatísticas bayesianas e modelos gráficos são ... estatísticas bayesianas e modelos gráficos. No entanto, existem partes do ML que não estão no Statistics, por exemplo, controle autônomo de robôs, aprendizado descentralizado, abordagens semânticas da representação do conhecimento. E algumas estatísticas específicas do domínio (séries temporais, método generalizado de momentos) não são cobertas pelo ML. Mas tenho a impressão de que as áreas de pesquisa mais ativas dos dois campos se sobrepõem em grande parte.