OpenAI Lança a Série o1-preview: Avanços em Modelos de Raciocínio para Resolver Problemas Complexos
A OpenAI anunciou o lançamento da série o1-preview, uma nova geração de modelos de inteligência artificial (IA) desenvolvidos para enfrentar desafios mais sofisticados em áreas como ciência, programação e matemática.
Disponível a partir de 12 de setembro, essa série promete elevar o patamar das soluções de IA, oferecendo capacidades aprimoradas para resolver problemas complexos de maneira mais eficiente e precisa.
Introdução à Série o1-preview
A série o1-preview representa um avanço significativo na evolução dos modelos de raciocínio da OpenAI.
Diferente dos modelos anteriores, os o1 são projetados para dedicar mais tempo ao processamento antes de gerar uma resposta, simulando de forma mais fiel o pensamento humano.
Isso permite que os modelos raciocinem sobre tarefas complexas e solucionem problemas mais desafiadores em comparação com suas versões anteriores.
Atualmente, o primeiro modelo desta série já está disponível tanto no ChatGPT quanto na API da OpenAI.
Embora ainda esteja em fase de pré-visualização, a OpenAI prevê atualizações e melhorias regulares para aprimorar ainda mais seu desempenho.
Além disso, juntamente com este lançamento, a empresa está incluindo avaliações para a próxima atualização, que já está em desenvolvimento.
Como Funciona
Os modelos da série o1-preview foram treinados para simular o processo de pensamento humano, refinando suas estratégias, testando diferentes abordagens e reconhecendo erros durante a resolução de problemas.
Esse treinamento permite que os modelos melhorem continuamente seu processo de raciocínio, aumentando sua eficácia em tarefas complexas.
Em testes realizados pela OpenAI, a atualização deste modelo demonstrou desempenho comparável ao de estudantes de doutorado em tarefas desafiadoras nos campos de física, química e biologia.
Além disso, os modelos o1-preview se destacaram em matemática e programação. Em um exame qualificatório para a Olimpíada Internacional de Matemática (IMO), o GPT-4o acertou apenas 13% dos problemas, enquanto o modelo de raciocínio o1-preview alcançou 83% de acertos.
Em competições de codificação, o modelo atingiu o percentil 89 no Codeforces, demonstrando sua robustez e precisão.
Embora ainda não possua algumas funcionalidades úteis do ChatGPT, como navegação na web e upload de arquivos e imagens, o GPT-4o já oferece maior capacidade em muitas situações comuns no curto prazo.
Para tarefas de raciocínio complexo, essa série representa um avanço significativo, estabelecendo um novo nível de capacidade em IA.
Em reconhecimento a esse marco, a OpenAI decidiu reiniciar a contagem e denominar essa série como OpenAI o1.
Segurança Reforçada
A OpenAI desenvolveu uma nova abordagem de treinamento de segurança para os modelos da série o1, aproveitando suas habilidades de raciocínio para aderir de forma mais eficaz às diretrizes de segurança e alinhamento.
Isso inclui a capacidade de seguir regras de segurança mesmo quando são feitas tentativas de “jailbreaking” (burlar as restrições do modelo).
Em testes rigorosos, o modelo o1-preview obteve uma pontuação de 84 em uma escala de 0 a 100 em cenários de “jailbreaking”, significativamente superior ao GPT-4o, que pontuou 22.
Essa melhoria reflete a eficácia da nova abordagem de treinamento de segurança, que utiliza as capacidades de raciocínio dos modelos para aplicar as regras de segurança de maneira contextualizada.
Para garantir a segurança desses novos modelos, a OpenAI reforçou seu trabalho de segurança, governança interna e colaboração com governos federais.
Isso inclui testes rigorosos, avaliações utilizando o Preparedness Framework, equipes de red teaming de primeira linha e processos de revisão a nível de diretoria, incluindo a Comissão de Segurança e Proteção.
Além disso, a OpenAI formalizou acordos com os Institutos de Segurança em IA dos EUA e do Reino Unido, concedendo-lhes acesso antecipado a versões de pesquisa dos modelos.
Essa parceria estabelece um processo robusto para pesquisa, avaliação e teste de futuros modelos antes e após seu lançamento público, reafirmando o compromisso da OpenAI com a segurança e a responsabilidade no desenvolvimento de IA.
Público-Alvo
Os aprimoramentos em raciocínio dos modelos o1-preview são especialmente úteis para profissionais e pesquisadores que enfrentam problemas complexos em áreas como ciência, programação e matemática.
Exemplos de aplicação incluem:
- Pesquisadores de Saúde: Anotação de dados de sequenciamento de células.
- Físicos: Geração de fórmulas matemáticas complexas necessárias para óptica quântica.
- Desenvolvedores: Construção e execução de fluxos de trabalho de múltiplas etapas em diversas áreas de desenvolvimento.
Essas capacidades avançadas permitem que os usuários abordem problemas de maneira mais eficiente e com maior precisão, potencializando a inovação e a descoberta em suas respectivas áreas.
OpenAI o1-mini: Uma Solução Eficiente para Desenvolvedores
Para oferecer uma solução mais acessível e eficiente para desenvolvedores, a OpenAI também lançou o o1-mini, um modelo de raciocínio mais rápido e econômico.
O o1-mini é 80% mais barato que o o1-preview, tornando-se uma opção poderosa e econômica para aplicações que requerem raciocínio, mas não necessitam de um conhecimento amplo do mundo.
O o1-mini é particularmente eficaz em tarefas de codificação, como geração e depuração de código complexo, oferecendo uma solução viável para desenvolvedores que buscam otimizar custos sem comprometer a qualidade das respostas.
Como Utilizar o OpenAI o1
A partir de hoje, usuários do ChatGPT Plus e Team podem acessar os modelos o1 diretamente no ChatGPT.
Tanto o o1-preview quanto o o1-mini podem ser selecionados manualmente no seletor de modelos, com limites semanais de 30 mensagens para o o1-preview e 50 para o o1-mini no lançamento inicial.
A OpenAI está trabalhando para aumentar esses limites e permitir que o ChatGPT escolha automaticamente o modelo mais adequado para cada solicitação.
Usuários do ChatGPT Enterprise e Edu terão acesso a ambos os modelos a partir da próxima semana.
Além disso, desenvolvedores qualificados para o nível de uso da API 5 podem começar a prototipar com ambos os modelos na API hoje, com um limite de 20 RPM (requisições por minuto).
A OpenAI planeja expandir esses limites após testes adicionais e está desenvolvendo recursos como chamadas de função, streaming e suporte para mensagens de sistema.
Adicionalmente, a OpenAI planeja disponibilizar o acesso ao o1-mini para todos os usuários gratuitos do ChatGPT, ampliando o alcance e a acessibilidade dessas novas capacidades de raciocínio avançado.
Próximos Passos
O lançamento da série o1-preview no ChatGPT e na API é apenas o começo. A OpenAI planeja adicionar funcionalidades adicionais, como navegação na web, upload de arquivos e imagens, entre outras, para tornar os modelos ainda mais úteis e versáteis para todos os usuários.
Além disso, a empresa continuará desenvolvendo e lançando novos modelos tanto na série GPT quanto na nova série o1, ampliando continuamente as capacidades da inteligência artificial e mantendo-se na vanguarda da inovação tecnológica.
A série o1-preview marca um passo significativo no desenvolvimento da IA, proporcionando ferramentas mais poderosas para resolver problemas complexos e avançando a fronteira das capacidades da inteligência artificial.
Com essas inovações, a OpenAI reafirma seu compromisso em fornecer soluções de IA que atendam às necessidades crescentes de precisão, eficiência e segurança em um mundo cada vez mais orientado por dados e tecnologia.