O código é um IA modelo, um algoritmo que é treinado em conjuntos de dados e pode aprender com novos dados para executar uma variedade de tarefas.
O CEO da Databricks, Ali Ghodsi, disse que o lançamento visa demonstrar uma alternativa viável ao treinamento de um tipo de modelo de IA chamado modelo de linguagem grande com enormes recursos e poder de computação.
Um grande modelo de linguagem sustenta o chatbot viral ChatGPT da OpenAI. A OpenAI, avaliada em US$ 29 bilhões, treina seus modelos de IA com enormes quantidades de dados em um supercomputador do investidor Microsoft Corp. Os custos de computação são “de encher os olhos”, disse o CEO da OpenAI, Sam Altman.
A OpenAI cobra das empresas pelo acesso a seus modelos para seus próprios aplicativos e projetou US$ 1 bilhão em vendas até 2024.
O esforço da Databricks vem com ressalvas. Ghodsi disse à Reuters que, embora o chatbot de código aberto exibisse capacidades impressionantes em tarefas como redigir postagens de blog, a empresa não havia lançado testes formais de benchmark para mostrar que o bot correspondia ao desempenho do ChatGPT.
A Databricks vende software de análise e mineração de dados baseado em nuvem para empresas e disse no ano passado que ultrapassou US$ 1 bilhão em receita anualizada.
A Databricks quer que as empresas treinem seus próprios modelos de IA usando seu software. Ghodsi disse que os pesquisadores da empresa pegaram um modelo de dois anos disponível gratuitamente e o treinaram com uma pequena quantidade de dados por três horas em um único computador que qualquer pessoa com cartão de crédito pode alugar.
“O futuro será que todos terão seu próprio modelo e poderão realmente treiná-lo e torná-lo melhor”, disse Ghodsi. “E dessa forma, eles também não precisam passar seus dados para outra pessoa.”
A mudança da Databricks ocorre em um momento em que as startups estão levantando milhões de dólares em investimentos de capital de risco para treinar seus modelos de IA e enquanto grandes empresas de tecnologia, como Google e Meta Platforms da Alphabet, correm para reduzir o tamanho e o custo dos modelos de IA, melhorando sua precisão.
“Minha crença é que, no final, você fará esses modelos cada vez menores, e eles serão de código aberto”, disse Ghodsi. “Todos os terão.”