Fontes dizem esperar o próximo grande modelo de IA da OpenAI em meados de 2024, de acordo com um novo relatório.
Quando a OpenAI lançou seu modelo GPT-4 AI há um ano, criou uma onda de imenso entusiasmo e pânico existencial devido à sua capacidade de imitar a comunicação e composição humana.
Desde então, a maior questão em IA permanece a mesma: quando o GPT-5 será lançado?
Durante entrevistas e aparições na mídia em todo o mundo, Sam Altman, CEO da OpenAI, frequentemente recebe essa pergunta e geralmente dá uma resposta tímida ou evasiva, às vezes acompanhada de promessas de coisas incríveis que estão por vir.
De acordo com um novo relatório do Business Insider, espera-se que a OpenAI lance o GPT-5, uma versão melhorada do modelo de linguagem de IA que alimenta o ChatGPT, em meados de 2024 – e provavelmente durante o verão.
Duas fontes anônimas familiarizadas com a empresa revelaram que alguns clientes corporativos receberam recentemente demonstrações do GPT-5 e melhorias relacionadas ao ChatGPT.
Um CEO que viu recentemente uma versão do GPT-5 descreveu-o como “muito bom” e “materialmente melhor”, com a OpenAI demonstrando o novo modelo usando casos de uso e dados exclusivos de sua empresa.
O CEO também sugeriu outras capacidades não lançadas do modelo, como a capacidade de lançar agentes de IA que estão sendo desenvolvidos pela OpenAI para executar tarefas automaticamente.
Perguntamos aos representantes da OpenAI sobre a data de lançamento do GPT-5 e o relatório do Business Insider.
Eles responderam que não tinham nenhum comentário específico, mas incluíram um trecho de uma transcrição da recente aparição de Altman no podcast Lex Fridman.
ex Fridman (01:06:13) Então, quando o GPT-5 será lançado novamente?
Sam Altman(01:06:15) Não sei. Essa é a resposta honesta.
Lex Fridman (01:06:18) Ah, essa é a resposta honesta. Pisque duas vezes se for este ano.
Sam Altman(01:06:30) Lançaremos um novo modelo incrível este ano. Não sei como vamos chamá-lo.
Lex Fridman (01:06:36) Então isso leva à questão de como liberamos essa coisa?
Sam Altman(01:06:41) Lançaremos nos próximos meses muitas coisas diferentes. Eu acho que seria muito legal. Acho que antes de falarmos sobre um modelo semelhante ao GPT-5 chamado assim, ou não chamado assim, ou um pouco pior ou um pouco melhor do que você esperaria de um GPT-5, acho que temos muitos outras coisas importantes para liberar primeiro.
Nesta conversa, Altman parece sugerir que a empresa está preparada para lançar um grande modelo de IA este ano, mas se será chamado de “GPT-5” ou será considerado uma grande atualização para o GPT-4 Turbo (ou talvez uma atualização incremental como GPT-4.5) está no ar.
Como seu antecessor, espera-se que o GPT-5 (ou como será chamado) seja um modelo multimodal de linguagem grande (LLM) que pode aceitar texto ou entrada visual codificada (chamada de “prompt”).
E como o GPT-4, o GPT-5 será um modelo de previsão do próximo token, o que significa que ele produzirá sua melhor estimativa do próximo token provável (um fragmento de uma palavra) em uma sequência, o que permite tarefas como completar uma frase ou escrever um código.
Quando configurados de uma maneira específica, os modelos GPT podem potencializar aplicativos de chatbot conversacionais como o ChatGPT.
A OpenAI lançou o GPT-4 em março de 2023 como uma atualização de seu antecessor mais importante, o GPT-3, que surgiu em 2020 (com o GPT-3.5 chegando no final de 2022).
Em novembro passado, a OpenAI lançou o GPT-4 Turbo, que reduziu drasticamente os custos de inferência (execução) do melhor modelo de IA da OpenAI, mas foi atormentado por acusações de “preguiça”, onde o modelo às vezes se recusa a responder a solicitações ou concluir projetos de codificação conforme solicitado.
A OpenAI tentou corrigir o problema da preguiça várias vezes.
LLMs como os desenvolvidos pela OpenAI são treinados em enormes conjuntos de dados extraídos da Internet e licenciados por empresas de mídia, permitindo-lhes responder às solicitações dos usuários de maneira humana.
Porém, a qualidade da informação fornecida pelo modelo pode variar dependendo dos dados de treinamento utilizados, e também com base na tendência do modelo em confabular informações.
Se o GPT-5 puder melhorar a generalização (sua capacidade de realizar novas tarefas) e, ao mesmo tempo, reduzir o que é comumente chamado de “alucinações” na indústria, provavelmente representará um avanço notável para a empresa.
Conforme o relatório, a OpenAI continua treinando o GPT-5 e, após a conclusão, o modelo passará por testes internos de segurança e mais “red teaming” para identificar e resolver quaisquer problemas antes de seu lançamento público.
A data de lançamento pode ser adiada dependendo da duração do processo de testes de segurança.
É claro que as fontes do relatório podem estar erradas e o GPT-5 pode ser lançado mais tarde por motivos que não sejam testes.
Portanto, considere isso um forte boato, mas esta é a primeira vez que vemos uma possível data de lançamento do GPT-5 de uma fonte confiável.
Além disso, sabemos agora que o GPT-5 está completo o suficiente para ser testado, o que significa que seu principal treinamento está provavelmente concluído.
Provavelmente ocorrerão mais refinamentos.