A DeepSeek, uma start-up chinesa, tem transformado o cenário da inteligência artificial ao reduzir significativamente os custos de treinamento de IA. A empresa utiliza diversas “táticas tecnológicas”, com ênfase em uma técnica inovadora conhecida como “mixture of experts”. Essa técnica tem permitido que a DeepSeek otimize o uso de seus chips, tornando o processo de treinamento mais eficiente e acessível.
O “mixture of experts” envolve o uso de múltiplas redes de especialistas que são ativadas seletivamente, dependendo das tarefas. Isso resulta em economia substancial de recursos, uma vez que apenas os especialistas necessários são acionados em cada operação. Dessa forma, a DeepSeek consegue realizar treinamentos complexos com um consumo energético e financeiro consideravelmente menor, destacando-se no competitivo mercado de inteligência artificial.
Esse avanço não apenas potencializa a eficiência das operações de IA, mas também democratiza o acesso a tecnologias avançadas, favorecendo a inovação em diversas áreas que dependem de processamento de dados em larga escala. Com suas estratégias inovadoras, a DeepSeek se posiciona como uma força disruptiva no setor, apontando um caminho promissor para o futuro da tecnologia.
Para mais detalhes, acesse a matéria completa em: https://www.nytimes.com/2025/02/12/technology/deepseek-ai-chip-costs.html