Na segunda-feira, 13 de maio, a OpenAI veio a público apresentar a nova versão do ChatGPT e anunciar as novidades.
O novo produto da empresa se chama ChatGPT 4o (sendo “o” de omni) e tem esse nome e essa característica por ser multimodal de nascença.
O que isso significa?
Significa que o modelo foi criado, desde os treinamentos iniciais, para gerar inputs e outputs de texto, imagem e áudio, o que faz com que ele entenda e interaja melhor com essas formas de comunicação.
Ele não é adaptado para entender outras linguagens, ele é criado com base nelas. Até ontem, essa era uma característica exclusiva do Gemini 1.5 Pro.
Esse tipo de treinamento é responsável pela capacidade que o GPT tem em conversar de forma mais humana, o que gerou um frisson na internet.
De forma prática, vai permitir que desenvolvedores criem aplicações móveis com interações mais humanas, algo parecido com o que assistimos no filme Her.
ChatGPT 4o é gratuito
Mas, para mim, o que terá um impacto maior no longo prazo é a disponibilização de um modelo de IA com maior capacidade de resolver problemas complexos, de forma gratuita, no site da OpenAI.
E também com um custo de API 50% mais barato em relação ao GPT-4.
Isso significa que a maior parte das aplicações que estão sendo desenvolvidas com IA vão ficar consideravelmente melhores.
E isso significa também que provavelmente quase ninguém vai usar mais o saudoso e querido GPT 3.5.
Na prática, teremos um avanço relevante nas aplicações que usam inteligência artificial e no uso delas por pessoas que não aderiram à assinatura do ChatGPT.
O que significa mais gente usando IA e mais gente obtendo resultados melhores. É um passo importante para uma maior adoção da inteligência artificial no dia a dia das pessoas.
Meus testes com GPT 4o
Inspirado pelo vídeo que viralizou ontem, eu pedi ao GPT que atuasse como um instrutor de inglês e, nessa função, conversasse comigo na língua para que eu a praticasse.
A IA então decidiu bater um papo sobre o clima e sobre a cidade onde moro. Foi um papo bem simpático que durou aproximadamente 5 minutos.
Ao final, pedi para que ela apontasse meus erros de pronúncia e erros de gramática. Confesso que não achei que ela ia conseguir, mas… Me surpreendi com o resultado. Ela me sinalizou algumas palavras que pronunciei errado e me deu dicas de gramática.
Óbvio que não substitui um professor de inglês.
Aliás, ter um professor para revisar esse resultado seria algo fenomenal.
Mas depois desse teste fiquei pensando em toda a aplicabilidade desse modelo para a educação, com potencial de criar agentes que atuem como tutores de estudantes de baixa renda e, pelo celular, os ajudem a ter um rendimento melhor na escola.
—
Bem, é isso, a dica que do para você é testar o modelo e tentar identificar o melhor uso para o seu caso e seu dia a dia. Vale lembrar que apesar de mais inteligente e mais rápido, conceitos de básicos de engenharia de prompt ainda são necessários, viu? Então use o que você sabe e teste.