Databricks - Databricks
| Modelo | Privado |
|---|---|
| Indústria | Software de computador |
| Fundado | 2013 |
| Fundadores | Ali Ghodsi , Andy Konwinski, Ion Stoica , Patrick Wendell, Reynold Xin , Matei Zaharia , Arsalan Tavakoli |
| Quartel general | , |
| Receita |
|
Número de empregados |
2.000 |
| Local na rede Internet | databricks.com |
A Databricks é uma empresa de software empresarial fundada pelos criadores do Apache Spark . A empresa também criou Delta Lake, MLflow e Koalas, projetos de código aberto que abrangem engenharia de dados , ciência de dados e aprendizado de máquina . Databricks desenvolve uma plataforma baseada na web para trabalhar com Spark, que fornece automatizado de gerenciamento de cluster e ipython -style cadernos . Além de construir a plataforma Databricks, a empresa está co-organizando cursos online abertos massivos sobre o Spark e realiza uma conferência para a comunidade do Spark - o Data + AI Summit, anteriormente conhecido como Spark Summit.
História
O Databricks cresceu a partir do projeto AMPLab da University of California, Berkeley, que estava envolvido na criação do Apache Spark , uma estrutura de computação distribuída de código aberto construída sobre o Scala . A empresa foi fundada por:
- Ali Ghodsi , CEO da Universidade da Califórnia, professor adjunto de Berkeley.
- Andy Konwinski, ex-aluno de PhD em Berkeley e committer do Apache Spark .
- Arsalan Tavakoli-Shiraji, ex-aluno de PhD em Berkeley e committer do Apache Spark.
- Ion Stoica , presidente executivo da Universidade da Califórnia, professor e co-fundador de Berkeley e CTO da Conviva .
- Matei Zaharia , tecnólogo-chefe, que criou o Apache Spark enquanto era Ph.D. candidato na Universidade da Califórnia, Berkeley, e depois professor na Universidade de Stanford .
- Patrick Wendell, ex-aluno de PhD em Berkeley e committer do Apache Spark.
- Reynold Xin , ex-aluno de PhD em Berkeley e committer do Apache Spark.
Em novembro de 2017, a empresa foi anunciada como um serviço primário no Microsoft Azure por meio da integração Azure Databricks.
A empresa desenvolve Delta Lake, um projeto de código aberto que visa trazer confiabilidade aos data lakes para aprendizado de máquina e outros casos de uso de ciência de dados.
Em junho de 2020, a Databricks adquiriu a Redash, uma ferramenta de código aberto projetada para ajudar cientistas e analistas de dados a visualizar e construir painéis interativos de seus dados.
Em fevereiro de 2021, a Databricks fez parceria com o Google Cloud , fornecendo integração com o Google Kubernetes Engine e a plataforma BigQuery do Google . A Fortune classificou o Databricks como um dos melhores grandes "locais de trabalho para a geração Y" em 2021. Na época, a empresa disse que mais de 5.000 organizações usavam seus produtos.
Em agosto de 2021, a empresa concluiu sua oitava rodada de financiamento levantando US $ 1,6 bilhão e avaliando os Databricks em US $ 38 bilhões, significativamente mais alto do que a avaliação de 15 a 20 bilhões feita pela Broadcom do concorrente Databricks SAS Institute.
Financiamento
Em setembro de 2013, a Databricks anunciou que levantou $ 13,9 milhões de Andreessen Horowitz e disse que pretendia oferecer uma alternativa ao sistema MapReduce do Google . A Microsoft foi um investidor notável da Databricks em 2019, participando da Série E da empresa por um valor não especificado. A empresa levantou US $ 1,9 bilhão em financiamento, incluindo US $ 1 bilhão da Série G liderada por Franklin Templeton em uma avaliação pós-monetária de US $ 28 bilhões em fevereiro de 2021. Outros investidores incluem Amazon Web Services , CapitalG (uma empresa de growth equity sob a Alphabet, Inc. ) e Salesforce Ventures.
| Series | Encontro | Quantia (milhões $) | Investidores Líderes |
|---|---|---|---|
| UMA | 2013 | 13,9 | Andreessen Horowitz |
| B | 2014 | 33 | New Enterprise Associates |
| C | 2016 | 60 | New Enterprise Associates |
| D | 2017 | 140 | Andreessen Horowitz |
| E | Fevereiro de 2019 | 250 | Andreessen Horowitz |
| F | Outubro de 2019 | 400 | Andreessen Horowitz |
| G | Janeiro de 2021 | 1.000 | Franklin Templeton Investments |
| H | Agosto de 2021 | 1.600 | Morgan Stanley |
Produtos
A Databricks desenvolve e vende uma plataforma de dados em nuvem usando o termo de marketing "lakehouse", um portmanteau baseado nos termos " data warehouse " e " data lake ". O lakehouse do Databricks é baseado na estrutura de software livre Apache Spark que permite consultas analíticas em dados semiestruturados sem um esquema de banco de dados tradicional .
O Delta Engine da Databricks foi lançado em junho de 2020 como um novo mecanismo de consulta que se sobrepõe ao Delta Lake para aumentar o desempenho da consulta. É compatível com Apache Spark e MLflow, que também são projetos de código aberto da Databricks.
Em novembro de 2020, a Databricks introduziu o Databricks SQL (anteriormente conhecido como SQL Analytics), que permite aos usuários executar inteligência de negócios e relatórios analíticos diretamente em data lakes. Os analistas podem consultar conjuntos de dados diretamente com SQL padrão ou usar conectores de produto para integrar diretamente com ferramentas de business intelligence como Tableau , Qlik , Looker e ThoughtSpot .
As empresas usam o Databricks como uma plataforma centralizada para cargas de trabalho de dados, como aprendizado de máquina, armazenamento e processamento de dados, análise de streaming e business intelligence.
Operações
A Databricks está sediada em San Francisco . Também possui operações no Canadá, Reino Unido, Holanda, Cingapura, Austrália, Alemanha, França, Japão, China e Índia.