Qual é a diferença entre um cientista de dados, um engenheiro de aprendizado de máquina e um analista de dados?

Eu escrevi sobre este tópico com alguns detalhes aqui, mas aqui está a versão curta:

O Data Analyst é geralmente uma posição de nível inicial ou de início de carreira que envolve a coleta, limpeza e análise de dados, mas provavelmente não está escrevendo modelos para aprendizado de máquina ou fazendo análises preditivas. As expectativas de habilidade variam muito para as funções de DA (e também podem ser chamadas de "analista de negócios", "analista de marketing" etc.), mas geralmente você precisa conhecer pelo menos SQL e um pouco de Python ou R.

O Data Scientist é um papel mais avançado que requer todas as habilidades de um analista de dados, mas também a capacidade de escrever modelos de aprendizado de máquina para análises preditivas e / ou análises mais avançadas. Novamente, as expectativas de habilidades podem variar muito de empresa para empresa, mas geralmente essa pessoa se sentiria bastante à vontade em R ou Python, incluindo o uso de pacotes populares de aprendizado de máquina e também à vontade com SQL, com um sólido conhecimento de estatística para entender qual modelos estão fazendo, etc.

O Machine Learning Engineer pode ser considerado um tipo de cientista de dados e, para algumas empresas, esses dois títulos são basicamente intercambiáveis. Pode-se esperar que um engenheiro de aprendizado de máquina tenha um conhecimento ainda mais profundo dos modelos de aprendizado de máquina de vários tipos (e a matemática que os sustenta) do que um cientista de dados, mas isso realmente varia de acordo com a empresa. Em algumas empresas, também é de esperar que um engenheiro de ML funcione mais como um engenheiro de software, implementando soluções de ML em produtos voltados para o cliente ... mas, novamente, isso varia muito de acordo com o empregador.

De fato, nada disso é imutável. Vi trabalhos de “Data Analyst” anunciados que exigem habilidades de aprendizado de máquina, por exemplo. Como essa área é relativamente nova, muitas empresas realmente não sabem o que estão procurando ou o que precisam, e o resultado infeliz é que é difícil generalizar muito sobre qualquer um desses cargos, porque diferentes empresas os definem de maneira bastante diferente. .

Em geral, embora os cargos de analista sejam mais juniores e paguem significativamente menos bem (a média atual dos EUA é de cerca de US $ 70 mil). Os cargos de cientista de dados e engenheiro de ML pagam muito melhor (ambos custam em torno de US $ 130 mil nos EUA), mas também têm requisitos mais altos de habilidades técnicas e muitas vezes também querem ver mais experiência no currículo. É bastante comum que as pessoas iniciem as funções de analista de dados e trabalhem até o Data Scientist ou, dependendo da empresa e de seus interesses, o ML Engineer.