A Microsoft anunciou que construiu um novo supercomputador para alimentar o ChatGPT. Após investir US$ 1 bilhão na OpenAI em 2019, a empresa quis montar uma máquina de ponta para a startup de pesquisa em IA. Entretanto, conforme relatado pelo site Bloomberg, a companhia não possuía algo que funcionasse para a OpenAI e não havia a certeza de que poderia projetar algo tão grande utilizando seu serviço de nuvem Azure.

Microsoft constrói supercomputador para alimentar ChatGPT

A OpenAI está tentando treinar cada vez mais programas de inteligência artificial (processo chamado machine learning ou aprendizado de máquina) para criar modelos de linguagem. Estes softwares consomem grandes volumes de dados e desenvolvem cada vez mais parâmetros com as variáveis que a IA descobriu através do treinamento e do retreinamento. Ou seja, é necessário um grande poder de processamento em nuvem que seja capaz de fornecer um desempenho alto por um longo período.

Para conseguir atender às necessidades da OpenAI, a Microsoft teve de estudar formas de utilizar diversos chips gráficos A100 da NVIDIA e alterar a forma como a empresa posiciona os servidores nos racks para evitar uma queda de energia. Embora o vice-presidente executivo da Microsoft, responsável por supervisionar a nuvem e a IA, tenha dito que não há um custo específico para este projeto, ele afirmou que "provavelmente é maior" do que várias centenas de milhões de dólares. O gerente geral da infraestrutura de IA do Azure da Microsoft, Nidhi Chappell, diz:

Construímos uma arquitetura de sistema que pode operar e ser confiável em uma escala muito grande. Foi isso que tornou possível o ChatGPT. Esse é um modelo que saiu disso. Haverá muitos, muitos outros.

Reação do público e a necessidade de um supercomputador

Novo supercomputador é necessário após o grande sucesso do chatGPT. Fonte: Oficina da Net
Novo supercomputador é necessário após o grande sucesso do ChatGPT. Fonte: Oficina da Net

O projeto de supercomputador feito pela Microsoft para a OpenAI possibilitou o lançamento do ChatGPT, que foi um sucesso após ser disponibilizado para o público geral. O sucesso foi tanto que o modelo de linguagem da OpenAI inspirou os negócios de outras empresas como a Google, que lançou o Bard, e a Baidu que anunciou o ERNIE Bot.

Atualmente a Microsoft utiliza os mesmos recursos computacionais que foram criados para a OpenAI treinar seus modelos de linguagem com inteligência artificial, incluindo o novo bot de pesquisa do Bing. A empresa também está vendendo o sistema para outros clientes, como o Oficina da Net chegou a relatar. Agora, a Microsoft está trabalhando no desenvolvimento da próxima geração de supercomputador voltado para IA, que faz parte de seu acordo expandido com a OpenAI, onde a companhia adicionou mais US$ 10 bilhões ao seu investimento. Scott Guthrie diz:

Não construímos algo personalizado para eles - começou como algo personalizado, mas sempre o construímos de forma a generalizá-lo para que qualquer pessoa que queira treinar um grande modelo de linguagem possa aproveitar as mesmas melhorias. Isso realmente nos ajudou a nos tornarmos uma nuvem melhor para IA em geral.

O novo supercomputador para o ChatGPT

O treinamento intenso de um modelo de linguagem de IA necessita de muitas unidades de processamento gráfico integradas em um só lugar, ou seja, estamos falando de um supercomputador. Entretanto, após o ChatGPT ser desenvolvido, foram necessários ajustes no supercomputador desenvolvido pela Microsoft. A desenvolvedora do Windows utiliza chips gráficos para inferência, mas estes processadores estão geograficamente dispersos em mais de 60 regiões, onde estão os data centers da companhia.

A Microsoft está adicionando agora ao supercomputador de IA o mais recente chip gráfico da NVIDIA para cargas de trabalho voltadas para inteligência artificial, o H100, além da última versão da tecnologia de rede Infiniband da NVIDIA, para possibilitar o compartilhamento de dados com mais velocidade.