CriticGPT: nova ferramenta pode ajudar a corrigir erros do ChatGPT

OpenAI treinou um modelo baseado no GPT-4 para ajudar os humanos a apontar os erros da ferramenta

A OpenAI treinou um novo modelo, o CriticGPT, baseado no GPT-4 para encontrar erros em respostas geradas pelo ChatGPT.

De acordo com a empresa, quando as pessoas contam com a ajuda do CriticGPT para revisar os códigos gerados pelo ChatGPT, elas conseguem superar os possíveis problemas sem ajuda adicional em 60% das vezes

A série de modelos GPT-4 que alimenta o ChatGPT é corrigida através do que se chama “aprendizado de reforço a partir do feedback humano” (RLHF, na sigla em inglês), que significa que a plataforma melhora seu desempenho conforme os usuários, também chamados de treinadores de inteligência artificial, classificam as respostas dadas pelo ChatGPT e indicam possíveis erros.

A medida que o ChatGPT vai se aperfeiçoando, seus erros também vão ficando mais sutis e especializados, o que pode dificultar que os treinadores de IA percebam as imprecisões quando elas ocorrem. E é nisso em que o CriticGPT pode ajudar.

O próximo passo, segundo a empresa, é incorporar modelos semelhantes ao CriticGPT ao processo de RLHF, para que os feedbacks humanos também contem com o auxílio dos feedbacks da IA.

Embora as sugestões do CriticGPT nem sempre estejam corretas também, elas podem ajudar os treinadores de IA a detectar problemas que passariam despercebidos. Além disso, assim como o próprio modelo do GPT-4, o CriticGPT também vai se aperfeiçoando conforme mais usuários forem utilizando a ferramenta e dando feedbacks.

De acordo com a OpenAI, os testes entre os dois modelos revelaram que os apontamentos feitos pelo CriticGPT foram considerados melhores do que aqueles feitos pelo próprio ChatGPT em 63% das vezes. Além disso, a nova ferramenta também demonstrou menos alucinações — momentos nos quais a IA inventa algo que não é verdade e apresenta como se fosse.

Mesmo assim, o CriticGPT ainda possui algumas limitações e só pode ajudar até certo ponto de especialização. Se uma tarefa ou resposta for extremamente complexa, mesmo um especialista com a ajuda de um modelo pode não ser capaz de avaliá-la

Leia mais

Debate sobre programa chinês no Brasil levanta questionamentos estratégicos no Congresso

Mudanças Climáticas no Brasil: Por Que o País Pode Estar Entre os Mais Afetados nas Próximas Décadas

Defesa do Brasil: lições estratégicas que a guerra no Oriente Médio expõe para o país

Brasil e Tunísia fortalecem cooperação científica: por que o acordo de ciência e tecnologia pode ampliar inovação e oportunidades

Direito funerário: Conheça mais com Tiago Schietti

CriticGPT: nova ferramenta pode ajudar a corrigir erros do ChatGPT

Veja Também

Meta Retoma Uso de Dados de Brasileiros para Treinar IA em Outubro

Meta Retoma Uso de Dados Brasileiros para Treinamento de IA

A Dependência do Brasil em Relação à Tecnologia de Defesa dos EUA

Brasil Enfrenta Risco de Regiões Inabitáveis em 50 Anos Segundo Alerta da NASA

Tecnologia no Brasil: Avanços e Desafios no Cenário Atual

A ascensão das fraudes de documentos e o papel decisivo da tecnologia

Equilíbrio e prevenção: Como o treinamento funcional pode reduzir lesões em atletas amadores?

Revisão completa antes da viagem: Segurança e tranquilidade na semana

O que acontece quando dados entram na rotina escolar e mudam a forma de aprender

Saiba como automatizar publicações, prazo e andamentos jurídicos

Leia mais

More Read