Greenplum vs teradata

Difícil identificar um único culpado…

O fato de pertencer ao Pivotal não ajudou, pois os problemas de desempenho foram aumentando - e nenhuma solução adequada foi fornecida; o código aberto do seu portfólio chegou um pouco tarde demais quando surgiram outros produtos baseados no Postgres.

O golpe de graça veio do MPP baseado em HDFS, Redshift, Impala, que relegou Greenplum a - suspirar! - domínio de dívida técnica e herdada. Eles perderam o barco :(

A2A

Se bem me lembro, esse banco de dados era um concorrente da Teradata. Isso significa que exigia hardware especializado e funcionava apenas no local. No entanto, seu principal concorrente foi a Vertica. Vertica não exigia hardware especial, além de poder executar na nuvem. Quando a Amazon lançou o Redshift, ele já estava atrasado no mercado. Digo que o Redshift matou o Greenplum e não ficaria surpreso com o pessoal de marketing da Amazon que o nomeou especificamente em oposição ao Greenplum.

Essa é a minha opinião. Os fatos reais são provavelmente mais conhecidos por Curt Monash.

A Greenplum era originalmente uma empresa de banco de dados fundada em 2003 e criou um dos primeiros produtos de data warehouse com uma arquitetura distribuída em expansão usando tabelas relacionais orientadas a colunas. Era um bom sistema que lidava com grandes cargas de trabalho OLAP, mas também era caro, exigia requisitos de hardware exigidos e era complicado de operar e dimensionar, o que significava que estava mais limitado às grandes empresas que tinham essa escala de dados e dinheiro para lidar com isso.

Depois que foi adquirida pela EMC, a tecnologia do banco de dados acabou sendo entregue ao Pivotal para manutenção, mas nunca teve os mesmos recursos de desenvolvimento e praticamente estagnou. Mesmo quando era de código aberto, nunca tinha participação de mercado para desenvolver uma grande comunidade.

O Greenplum também é construído em uma versão antiga do PostgreSQL e, recentemente, houve novos investimentos e esforços heróicos para elevá-lo aos padrões modernos, mesclando o código mais recente, mas ainda é apenas na v8.3 enquanto o Postgres está prestes a lançar a v12. E isso é antes de levar em conta todos os vários avanços em consultas e processamento de dados que os concorrentes desenvolveram nesse meio tempo que exigirão ainda mais trabalho para copiar e adaptar novamente.

Nos 15 anos desde que começou, o mundo dos bancos de dados avançou rapidamente e agora existem dezenas de sistemas avançados de data warehouse com desempenho incrível e capacidade de rodar em hardware comum por uma fração do custo. A ascensão da computação em nuvem e dos serviços gerenciados também eliminou amplamente a necessidade de executar diretamente o software de banco de dados para a maioria das empresas.

Infelizmente, o Greenplum agora é apenas um sistema de banco de dados antigo, complicado e desatualizado e praticamente desapareceu.

A área de banco de dados MPP / Analytic / HTAP é um campo muito movimentado, com várias ofertas comerciais estabelecidas e, cada vez mais, de código aberto, o que limita a popularidade e a adoção de muitos desses produtos. O Greenplum é um produto sólido, com uma base de clientes estabelecida que o utiliza com satisfação, e a Pivotal continua a injetar dinheiro em P&D para aprimorá-lo daqui para frente. Na verdade, ele fez grandes progressos nos últimos anos com a re-plataforma do Postgres 9.xe a capacidade de executar em ambientes de nuvem e k8s.

Em resposta à resposta de Mani Gandham, o Greenplum começou como uma oferta apenas de software e foi oferecido como um produto de software desde que foi introduzido. Antes da aquisição da EMC, eles ofereceram uma arquitetura de referência baseada nos servidores Sun “Thumper” como uma arquitetura oficialmente abençoada. Quando a EMC (uma empresa de hardware de computadores) comprou a Greenplum, naturalmente começou a oferecer um dispositivo para executar o software (Data Computing Appliance ou DCA ) Embora o DCA não tenha sido barato, custou menos do que os outros principais data warehouses do dia (Oracle Exadata, Teradata, Netezza etc.) e foi bastante poderoso. A Dell assumiu a oferta de uma arquitetura de hardware em escala adaptada ao GPDB, e também estão disponíveis arquiteturas de referência de outros fornecedores de hardware. Você também pode ativar instâncias Greenplum dos mercados da AWS, Azure e Google Cloud se os servidores físicos não forem a sua cara.

Além disso, como mencionado anteriormente, o Pivotal gastou muito tempo e esforço portando o GPDB para o Postgres 9 e, daqui para frente, acompanhará as melhorias na principal base de código do Postgres. Continua sendo uma opção para análises de SQL em larga escala e cargas de trabalho de data warehousing, e eu acho que sua capacidade de incorporar algoritmos de aprendizado de máquina e ciência de dados via MADLib e PL / Python são ótimos recursos para tornar as análises avançadas acessíveis aos usuários de negócios que usam principalmente SQL .