Nunca se falou tanto em dados no ambiente corporativo como hoje. Coletar, organizar, interpretar e analisar esses dados é vital para manter as empresas competitivas. E em um mundo onde as barreiras entre o online e offline praticamente desapareceram, a quantidade de informação disponível é potencialmente infinita.
Para armazenar essas informações que podem (ou não) ser utilizadas, uma das alternativas para centralizar essas informações é usar um repositório como o Data Lake (lago de dados).
Mas, se o CRM da HubSpot visa ser uma plataforma para as empresas centralizarem as informações, é possível usar o HubSpot como Data Lake? Desvendaremos isso aqui para você.
O que é um Data Lake?
De uma maneira resumida: um Data Lake é um sistema de armazenamento de dados em formato bruto, ou seja, ainda não foram estruturados. Seu ambiente é altamente escalável e suporta volumes de dados extremamente grandes.
Geralmente é usado como armazenamento único de todos os dados corporativos, já que suporta informações em seu formato nativo de uma grande variedade de origens. Um Data Lake pode conter dados estruturados (como informações de bancos de dados relacionais em linhas e colunas), dados semi-estruturados (CSV, XML, entre outros), dados não estruturados (emails, docs e PDFs) e dados binários (imagens, áudio, vídeo).
As informações podem ser usadas a qualquer momento e para diversas finalidades. Os dados são filtrados e transformados apenas quando necessário. E o melhor, o usuário pode extrair insights e reports direto do lago de dados sem comprometer o material bruto. Isso permite a reutilização das informações, ao contrário dos bancos de dados já refinados para um objetivo próprio. Os Data Lakes permitem que várias pessoas em uma organização, como cientistas de dados, desenvolvedores e analistas de negócios, acessem dados com a ferramenta que preferir.
O termo Data Lake foi criado por James Dixon, diretor de tecnologia da Pentaho, em 2010 para diferenciar o sistema de armazenamento do Data Mart:
“Se você pensar em um Data Mart como um depósito de água engarrafada, limpa, embalada e estruturada para fácil consumo, o Data Lake é um grande corpo de água em um estado mais natural. O conteúdo do fluxo do Data Lake vem de uma fonte para encher o lago, e vários usuários do lago podem vir para examinar, mergulhar ou coletar amostras.”
Hoje, os maiores players do mercado como Google, Microsoft, Oracle e Amazon oferecem soluções de Data Lake. O sistema pode ser usado em uma grande variedade de ambientes, incluindo a nuvem.
Vantagens de utilizar um Data Lake
Como os dados estão em seu estado bruto, eles podem ser trabalhados por uma ampla variedade de objetivos, incluindo: processamento de Big Data; visualização de dados, ferramentas de machine learning, inteligência artificial entre outros.
Esse nível de variedade de aplicações e agilidade analítica pode se traduzir em lucro: uma pesquisa da Aberdeen (consultoria de negócios) descobriu que as organizações que usam o Data Lake superaram empresas semelhantes em 9% no crescimento orgânico da receita. A mesma pesquisa indicou as principais vantagens em investir em Lago de Dados nas empresas: aumento da eficiência operacional, acesso a dados por todos departamentos, custos mais baixos de transação e menor custo de armazenamento de dados.
Com uma base de dados limpa e pronta para ser utilizada, as empresas conseguem agilizar o fluxo de informações em toda a organização e fornecer informações críticas dentro do prazo. Ou seja, com o Data Lake companhias são capazes de utilizar a eficiência de dados internos para realizar suas atividades de forma mais eficaz.
Posso usar o HubSpot como Data Lake?
A resposta para esta pergunta é: Não!
Apesar do HubSpot permitir o armazenamento de um grande volume de dados, um ponto fundamental do HubSpot é que os dados fiquem armazenados de uma forma estrutura previamente definida, como: propriedades, objetos customizados (custom objects) e HubDB (estrutura própria de banco de dados da HubSpot.
Assim, o HubSpot estaria mais próximo do conceito de “data warehouse”. De acordo com Amazon, data warehouse é um banco de dados otimizado para analisar dados relacionais provenientes de sistemas transacionais.
Aqui temos algo bastante interessante. O HubSpot tem algumas ferramentas específicas para realizar relatórios mais sofisticados, como:
- Datasets (Conjuntos de dados): disponível no HubSpot Operations Hub Enterprise;
- Reports Add-on: recurso adicional que pode ser contratado para expandir o potencial de criação de relatórios.
- Integração nativa com o Snowflake Data Share: plataforma líder em Data Engineering, Data Science, Data Application e Data Sharing.
Mesmo o HubSpot tendo uma cerca relação com "data warehouse", por ser uma ferramenta de CRM e Automações, as grandes empresas levam somente para o HubSpot as informações de outros sistemas pertinentes para o relacionamento com o cliente e importantes para os processos de automações (seja para incluir ou remover os contatos em fluxos de trabalho).
Outro detalhe importante é que a HubSpot não recomenda levar os dados sensíveis pessoais de contatos para a plataforma.
Conclusão
O HubSpot é uma excelente plataforma para centralização dos dados dos contatos que podem contribuir para melhorar as experiências com os clientes. Entretanto, é importante utilizar uma ferramenta própria de data lake, como Snowflake, para que os cientistas de dados extraiam os insights que podem melhorar a operação.
Com as ferramentas existentes de relatórios do Hubspot e os dados do CRM (como funil de vendas), os gestores e boards podem obter dados em tempo real, por exemplo, sobre previsibilidade de receita (forecast de vendas) e satisfação dos clientes. Assim, o HubSpot pode revelar dados do que está acontecendo na operação, tendo um "papel" diferente do que o Data Lake pode revelar.
E as informações do HubSpot, podem ser extraídas para o Data Lake, de forme que gere ainda mais insights para os seus Cientistas de Dados.
A NA5 é especialista em HubSpot Enterprise no Brasil e ajuda grandes empresas com implementação e na contratação da plataforma.