Qual é a diferença entre big data e cloud?

A partir das respostas postadas aqui, acredito que agora você sabe a diferença entre os dois.

Então, eu prefiro falar sobre como a Cloud ajuda no trabalho com Big Data.

Como o CIO do Banco Global mencionou uma vez, "a maioria das organizações está se afogando em dados, mas está ansiosa por insights". Com a explosão de dados gerados em uma empresa, tornou-se ainda mais difícil gerenciar esses dados para processamento transacional ou analítico e obter insights significativos.

É aí que entra a nuvem. Ele fornece infraestrutura como servidores e armazenamento remotos e serviços como implantação de processamento e clusters para suas necessidades de BI. Além disso, a nuvem oferece elasticidade, escalabilidade e acessibilidade que permitem otimizar a utilização de recursos.

Big data e computação em nuvem são tendências e tecnologias de longo prazo no setor de TI. Big data está se tornando o termo mais popular do setor. Devido ao crescente número de dados de diferentes fontes, a grande corporação exige o sistema conhecido como big data. Big data e computação em nuvem não são iguais, ambos são diferentes um do outro. Vamos começar examinando os recursos do big data.

Big data e computação em nuvem são tendências e tecnologias de longo prazo no setor de TI. Big data está se tornando o termo mais popular do setor. Devido ao crescente número de dados de diferentes fontes, a grande corporação exige o sistema conhecido como big data. Big data e computação em nuvem não são iguais, ambos são diferentes um do outro. Vamos começar examinando os recursos do big data.

Big Data

Big data é um dos termos mais populares atualmente. O próprio nome diz que contém uma enorme quantidade de dados. Além de conter os dados, também fornece o caminho para coletar, armazenar, organizar e analisar dados coletados de várias fontes.

O big data contém uma enorme quantidade de dados que podem ser estruturados, semiestruturados e não estruturados. Ele fornece as maneiras de processar todos esses dados em informações valiosas para a organização tomar outras decisões. Big data é a combinação dos seguintes recursos.

O big data mantém o volume, a variedade e a velocidade dos dados. Os dados no big data são em grande quantidade. Geralmente, o big data mantém os intervalos de dados em exabyte, petabytes etc. Lembre-se de que as fontes de dados do big data não são únicas. Os dados são provenientes de várias fontes, como registro de vendas, relatório do departamento de P&D, relatório do concorrente e informações da Internet.

Lembre-se de que os dados nem sempre estão no formato de estrutura porque são coletados de várias fontes. O big data analisa os dados em velocidade extremamente rápida. Devido à velocidade do Big Data, ele é aplicado em inteligência artificial e aprendizado de máquina.

Computação em nuvem

Computando em nuvem o próprio nome explicando o que é. É o uso da tecnologia para armazenar e acessar dados e aplicativos pela Internet. Não é semelhante ao big data, porque você não pode ter seus próprios recursos pessoais para computação em nuvem.

Categoria de computação em nuvem

SaaS (software como serviço)

Sass é uma das empresas de computação em nuvem mais famosas que muitas empresas estão usando SaaS para fornecer seus serviços aos clientes. Neste, um software instalado no servidor principal da empresa e os usuários o utilizam através do computador ou de qualquer outro dispositivo baseado na Internet. Moz é o melhor exemplo de SaaS. É uma computação em nuvem baseada na Internet.

IaaS (infraestrutura como serviço)

Nesse tipo de computação em nuvem, as empresas fornecem o espaço de armazenamento em seus computadores para os usuários. O usuário obtém a quantidade específica de espaço conforme os termos da empresa. O usuário pode organizar o arquivo conforme sua escolha. É o mesmo que armazenamento local, mas a única diferença é que esse espaço de armazenamento é fornecido pela Internet. Google Drive e Dropbox são o melhor exemplo de IaaS.

Plataforma (aprovada) como serviço

O PaaS é uma das mais populares de computação em nuvem. Ele fornece a plataforma para os usuários desenvolverem os softwares através das ferramentas fornecidas pela empresa Paas. Os usuários podem gerenciar facilmente o software. Um dos exemplos mais populares de PaaS é o Amazon Web Services (AWS)

Vamos resumir

Agora, examinamos profundamente as características da computação em nuvem e do big data. Big data é um grande conjunto de dados, por outro lado, a computação em nuvem tem como objetivo fornecer armazenamento ou acessar o grande conjunto de dados pela Internet. No podemos dizer que big data é usado para tomar uma decisão com base em dados. Por outro lado, a computação em nuvem é sobre o uso dos dados do computador de outros pela Internet.

Fonte original:

Diferença entre big data e computação em nuvem [infográficos]

São duas coisas diferentes.

Big data geralmente se refere ao armazenamento e processamento de um grande volume de dados.

Nuvem (computação) refere-se a um conjunto de recursos que fornecem

a infraestrutura

(servidores e armazenamento), bem como

Serviços

(por exemplo, aprendizado de máquina, implantações etc.) que podem ser provisionadas pela Internet, geralmente por meio de APIs.

O big data tende a exigir um grande número de infraestrutura e é aí que os dois países se cruzam. A computação em nuvem facilita a ativação de servidores (e a redução deles também) que podem ser usados ​​para fins de big data.

Além da infraestrutura, os provedores de nuvem também fornecem serviços gerenciados onde fornecem e mantêm a infraestrutura para big data, para que os clientes possam se concentrar apenas nos casos de uso. Por exemplo :

Amazon EMR

.

A nuvem está apenas se referindo a onde algo vive ou ocorre, em um servidor remoto hospedado em outro lugar.

Embora a análise e implementação de big data ocorram na nuvem, ela não está restrita à nuvem. Muitas empresas possuem repositórios internos de escala megalítica, os quais tendem localmente.

Você vê os termos juntos porque muitas empresas estão adotando sistemas baseados na nuvem por vários motivos (velocidade, custo, proteção de ativos, eficiência), mas o que essas empresas estão fazendo pode ser feito em servidores internos, desde que adequadamente grande e provisionado.

Estes são dois tópicos separados que podem ser usados ​​juntos. Ambos têm alguma indefinição em suas definições, o que também pode levar a algumas incertezas. Então, deixe-me tentar defini-los (basicamente, e tenho certeza que os outros verão essas definições de maneira um pouco diferente)

Computação em nuvem:

Infraestrutura que pode ser facilmente retransmitida para qualquer número de cargas de trabalho. Esses recursos de computação são agrupados em uma nuvem de computação. Os usuários podem configurar e atribuir partes da nuvem de computação para trabalhar em suas tarefas, enquanto a carga de trabalho de outros usuários também está na nuvem. Aumentos e diminuições nos recursos de computação podem ser feitos para qualquer carga de trabalho rapidamente, pois os recursos subjacentes são indiferenciados.

Isso leva a várias vantagens sobre os modelos de computação tradicionais.

  • Novas cargas de trabalho podem ser aceleradas muito rapidamente - sem ciclos de compra, sem configuração de HW, basta implantar e ir
  • O desempenho da computação pode variar rapidamente - os recursos de computação podem ser alterados para cima ou para baixo para atender aos requisitos atuais, economizando custos
  • Padronização mais alta - como os recursos de computação em nuvem têm um conjunto limitado de configurações, todos os aplicativos precisam executar, o que impulsiona a reutilização de software entre aplicativos
  • Infraestrutura como código - como a maioria das configurações de nuvem pode ser estabelecida ou alterada com código, os ambientes de computação tornam-se facilmente reproduzíveis, resultando em maior capacidade de expandir, realocar ou recuperar soluções de computação

Existem também algumas desvantagens na nuvem:

  • Em algum nível, os computadores na nuvem são compartilhados - os provedores precisam garantir que haja um forte isolamento entre os usuários
  • Quando os computadores na nuvem estão ociosos, alguém ainda precisa "pagar" por eles - geralmente o tempo ocioso é incluído na taxa de uso da nuvem (uma vez que o computador médio dedicado do datacenter é utilizado apenas 30% e a maioria dos grandes provedores de nuvem tem mais de 90%) isso realmente não é uma desvantagem)

Existem também variedades de modelos de computação em nuvem:

  • Nuvem pública - Uma empresa terceirizada que fornece recursos de computação em nuvem (pense na AWS)
  • Nuvem privada - Normalmente, o departamento central de TI de uma grande empresa configuraria uma nuvem para obter uma melhor utilização dos recursos de computação
  • Nuvem híbrida - Uma combinação de recursos de nuvem pública e privada para obter os benefícios de ambos

Big Data:

O conteúdo de informações / dados é geralmente descrito como Big Data se tiver um tamanho muito grande e for de várias fontes variadas. No entanto, em muitos casos, as soluções de dados são chamadas de Big Data apenas com base no tamanho. De qualquer forma, geralmente cabe aos implementadores descrever suas soluções como Big Data ou não.

A definição prática geralmente tem mais a ver com as ferramentas e processos que estão sendo usados ​​do que com uma descrição dos dados. Quando as empresas fazem a transição do trabalho em suas cargas de trabalho de dados históricos e se expandem para trazer novas ferramentas (Hadoop, Data Warehouses, Streaming analytics etc.), essa transição geralmente é chamada de "mudança para o Big Data". Como tal, a definição varia amplamente de empresa para empresa. Mais dados do que estão acostumados, juntamente com as novas ferramentas que nunca usaram antes, é igual a um evento de transição organizacional que é mais frequentemente chamado de transição de Big Data. Muito mole.

Big Data na nuvem pública:

Como você provavelmente detectou, esses tópicos aparentemente não relacionados geralmente andam de mãos dadas. Isso se deve à mudança na economia fornecida pela nuvem e à capacidade de experimentar rápida e barata as novas ferramentas que foram configuradas em nuvens públicas. Como uma organização que é solicitada pela gerência para reunir todas as fontes de dados variadas de uma empresa e "desbloquear" o valor existente, vou gastar milhões de dólares em novo hardware e software para ver qual valor existe ou vou usar o modelo de pagamento conforme o uso disponível na nuvem pública? Essas empresas de nuvem pública oferecem ofertas prontas para uso, onde posso ter acesso a todas as ferramentas variadas e começar a trabalhar em soluções dentro de um dia. Configurar isso no modelo tradicional exige que eu investigue as ferramentas, selecione um conjunto, defina o hardware para executá-lo, envie a solicitação de compra de capital, aguarde um quarto, peça o equipamento, instale e configure-o e comece a aprender como "desbloquear" o valor nos dados. A maioria das pessoas está escolhendo a nuvem pública.

Portanto, esses dois conceitos são bem separados, mas geralmente aparecem juntos. Como tal, posso ver totalmente como pode haver confusão sobre o que cada um é e como eles são diferentes.

Eu espero que isso ajude