Apresentando o ChatGPT-4o com CANVAS

Uma nova maneira de trabalhar com ChatGPT para escrever e codificar

Estamos apresentando o canvas, uma nova interface para trabalhar com o ChatGPT em projetos de escrita e codificação que vão além do simples bate-papo.

O Canvas abre em uma janela separada, permitindo que você e o ChatGPT colaborem em um projeto.

Este beta inicial apresenta uma nova maneira de trabalhar juntos — não apenas por meio de conversas, mas criando e refinando ideias lado a lado.   

O Canvas foi criado com GPT-4o e pode ser selecionado manualmente no seletor de modelos enquanto estiver em beta.

A partir de hoje, estamos lançando o Canvas para usuários do ChatGPT Plus e Team globalmente. Usuários Enterprise e Edu terão acesso na próxima semana. Também planejamos disponibilizar o Canvas para todos os usuários do ChatGPT Free quando ele sair do beta.

Melhor colaboração com ChatGPT

As pessoas usam o ChatGPT todos os dias para obter ajuda com escrita e código. Embora a interface de chat seja fácil de usar e funcione bem para muitas tarefas, ela é limitada quando você quer trabalhar em projetos que exigem edição e revisões. O Canvas oferece uma nova interface para esse tipo de trabalho.

Com o canvas, o ChatGPT pode entender melhor o contexto do que você está tentando realizar. Você pode destacar seções específicas para indicar exatamente no que você quer que o ChatGPT se concentre. Como um editor de cópias ou revisor de código, ele pode dar feedback e sugestões inline com todo o projeto em mente.

Você controla o projeto no canvas. Você pode editar texto ou código diretamente. Há um menu de atalhos para você pedir ao ChatGPT para ajustar o comprimento da escrita, depurar seu código e executar rapidamente outras ações úteis. Você também pode restaurar versões anteriores do seu trabalho usando o botão Voltar no canvas.

O Canvas abre automaticamente quando o ChatGPT detecta um cenário em que ele pode ser útil. 

Você também pode incluir “use canvas” no seu prompt para abrir o canvas e usá-lo para trabalhar em um projeto existente.

Os atalhos de escrita incluem:

  • Sugerir edições: o ChatGPT oferece sugestões e feedback em linha.
  • Ajustar o comprimento: edita o comprimento do documento para torná-lo mais curto ou mais longo.
  • Alterar nível de leitura: ajusta o nível de leitura, do jardim de infância para a pós-graduação.
  • Adicione o acabamento final: verifique a gramática, a clareza e a consistência.
  • Adicionar emojis: adiciona emojis relevantes para dar ênfase e cor.

Codificação em canvas

A codificação é um processo iterativo, e pode ser difícil acompanhar todas as revisões do seu código no chat.

O Canvas torna mais fácil rastrear e entender as alterações do ChatGPT, e planejamos continuar melhorando a transparência nesses tipos de edições.

Os atalhos de codificação incluem:

  • Revisar código: o ChatGPT fornece sugestões em linha para melhorar seu código.
  • Adicionar logs: insere instruções de impressão para ajudar você a depurar e entender seu código.
  • Adicionar comentários: adiciona comentários ao código para torná-lo mais fácil de entender.
  • Corrigir bugs: detecta e reescreve código problemático para resolver erros.
  • Portar para uma linguagem: traduz seu código para JavaScript, TypeScript, Python, Java, C++ ou PHP.

Treinando o modelo para se tornar um colaborador

Treinamos o GPT-4o para colaborar como um parceiro criativo. O modelo sabe quando abrir uma tela, fazer edições direcionadas e reescrever completamente. Ele também entende um contexto mais amplo para fornecer feedback e sugestões precisos.

Para dar suporte a isso, nossa equipe de pesquisa desenvolveu os seguintes comportamentos principais:

  • Acionando a tela para escrita e codificação 
  • Gerando diversos tipos de conteúdo
  • Fazendo edições direcionadas
  • Reescrevendo documentos
  • Fornecendo crítica em linha

Medimos o progresso com mais de 20 avaliações internas automatizadas. Usamos novas técnicas de geração de dados sintéticos, como destilar saídas do OpenAI o1-preview, para pós-treinar o modelo para seus comportamentos principais.

Essa abordagem nos permitiu abordar rapidamente a qualidade da escrita e novas interações do usuário, tudo sem depender de dados gerados por humanos.

Um desafio fundamental foi definir quando acionar uma tela. Ensinamos o modelo a abrir uma tela para prompts como “Escreva uma postagem de blog sobre a história dos grãos de café”, evitando o acionamento excessivo para tarefas gerais de perguntas e respostas como “Ajude-me a cozinhar uma nova receita para o jantar”. Para tarefas de escrita, priorizamos a melhoria de “gatilhos corretos” (às custas de “não gatilhos corretos”), atingindo 83% em comparação com um GPT-4o de zero-shot de linha de base com instruções solicitadas.

Vale a pena notar que a qualidade dessas linhas de base é altamente sensível ao prompt específico usado. Com prompts diferentes, a linha de base ainda pode ter um desempenho ruim, mas de uma maneira diferente — por exemplo, sendo uniformemente imprecisa em tarefas de codificação e escrita, resultando em uma distribuição diferente de erros e formas alternativas de desempenho abaixo do ideal.

Para codificação, enviesamos intencionalmente o modelo contra o acionamento para evitar interromper nossos usuários avançados. Continuaremos refinando isso com base no feedback do usuário.

Para tarefas de escrita e codificação, melhoramos o acionamento correto do limite de decisão do canvas, atingindo 83% e 94% respectivamente, em comparação com um GPT-4o de disparo zero de linha de base com instruções solicitadas.

Um segundo desafio envolveu ajustar o comportamento de edição do modelo quando a tela foi acionada — especificamente decidir quando fazer uma edição direcionada versus reescrever todo o conteúdo. Treinamos o modelo para executar edições direcionadas quando os usuários selecionam explicitamente o texto por meio da interface, caso contrário, favorecendo reescritas. Esse comportamento continua a evoluir à medida que refinamos o modelo.

Limite de edição de tela – Escrita e codificação

GPT-4o solicitadoGPT-4o com telaCanvas full rewriteCanvas targeted edit0.00.10.20.30.40.50.60.70.80.91.0

Para tarefas de escrita e codificação, priorizamos melhorar as edições direcionadas do canvas. O GPT-4o com canvas tem desempenho melhor do que um GPT-4o de linha de base solicitado em 18%.

Por fim, treinar o modelo para gerar comentários de alta qualidade exigiu uma iteração cuidadosa. Ao contrário dos dois primeiros casos, que são facilmente adaptáveis ​​à avaliação automatizada com revisões manuais completas, medir a qualidade de forma automatizada é particularmente desafiador. Portanto, usamos avaliações humanas para avaliar a qualidade e a precisão dos comentários.

Nosso modelo de canvas integrado supera o GPT-4o zero-shot com instruções solicitadas em 30% em precisão e 16% em qualidade, mostrando que o treinamento sintético melhora significativamente a qualidade e o comportamento da resposta em comparação ao prompting zero-shot com instruções detalhadas.

Avaliações humanas avaliaram a qualidade dos comentários do canvas e a funcionalidade de precisão. Nosso modelo de canvas supera o GPT-4o de disparo zero com instruções solicitadas em 30% em precisão e 16% em qualidade.

O que vem a seguir

Tornar a IA mais útil e acessível requer repensar como interagimos com ela. O Canvas é uma nova abordagem e a primeira grande atualização da interface visual do ChatGPT desde que lançamos há dois anos.

O Canvas está em beta inicial e planejamos melhorar rapidamente suas capacidades.


Publicado

em

por

Tags: