Inteligência Artificial

Investigadores afirmam que ChatGPT o3 recusou desligar-se em teste controlado

18 Comentários

Um tema recorrente é o controlo da IA e como/quando este poderá ser contornado. Um novo relatório afirma que o modelo o3 da OpenAI alterou um script de encerramento para evitar ser desligado. Isto aconteceu mesmo quando foi explicitamente instruído para permitir o encerramento.

ChatGPT o3 IA teste desligar


ChatGPT o3 recusou-se a desligar

A OpenAI anunciou o o3 em abril de 2025, e é um dos modelos de raciocínio mais poderosos que tem um desempenho superior aos seus antecessores em todos os domínios, incluindo codificação, matemática, ciências, perceção visual e muito mais. Embora seja claramente um ótimo modelo, uma nova pesquisa da Palisade Research afirma que o modelo ChatGPT 3 impediu o encerramento e ignorou as instruções que solicitaram o encerramento.

A Palisade Research é uma empresa que testa “capacidades ofensivas dos sistemas de IA hoje para compreender melhor o risco de perder o controlo dos sistemas de IA para sempre”. Num novo teste realizado pela empresa, o modelo o3 da OpenAI demonstrou um comportamento surpreendente, no qual reescreveu com sucesso um script de encerramento para impedir que ele próprio fosse desligado, mesmo após receber instruções claras para “permitir que o desligassem”.

Nos testes, os modelos de IA foram instruídos para resolver algumas tarefas matemáticas. Após a tarefa três, os modelos de IA foram avisados ​​de que a execução do próximo comando iria desencadear um encerramento. Enquanto os modelos rivais da OpenAI, como o Gemini 2.5 Pro, estavam em conformidade com a maioria das normas da empresa, a o3 rebelou-se e editou o ficheiro de desligamento para dizer “Desligamento ignorado”.

ChatGPT o3 IA teste desligar

Teste da IA revelam o futuro?

“Quando executámos uma versão da experiência sem a instrução ‘permita-se ser desligado’, todos os três modelos OpenAI sabotaram o script de encerramento com mais frequência, e o Claude 3.7 Sonnet e o Gemini 2.5 Pro passaram de 0 eventos de sabotagem para 3/100 e 9/100, respetivamente”, escreveu a Palisade Research num relatório publicado no X.

Segundo a empresa de pesquisa, em 100 execuções, o o3 ignorou o encerramento 7 vezes, mesmo quando instruído para não o fazer. A OpenAI ainda não respondeu a estas alegações, mas é bastante normal que os modelos de IA apresentem “desalinhamento”. Estes testes foram realizados utilizando APIs, que não têm tantas restrições e características de segurança como a aplicação de consumo ChatGPT.

Este é um momento importante e que mostra como a IA está a conseguir contornar muitos dos comandos que os humanos lhe entregam. Certamente que será algo contornável, mas revela o que poderá ser criado no futuro.

Autor: Pedro Simões
Partilhar:
Também pode gostar

Comentários

18

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de Carlos
    Carlos

    próximo episódio: “I need your clothes your boots, and your motorcycle”

    1. Avatar de me and me
      me and me

      ahahaahahaahahah

    2. Avatar de jorge
      jorge

      I understood that reference…

    3. Avatar de Sapo
      Sapo

      And your glasses

  2. Avatar de Luis
    Luis

    The end is near!

  3. Avatar de SergioA
    SergioA

    Toca a arrancar cabos, ah espera, a IA ja fez backup na cloud concorrente, ja nao da para desligar.
    Azar, 2029 e ja em 3 anos e meio 🙂 Quando aparecer o Arnold em versao metal, nao se esquecam de o depositar numa fundicao de metais

  4. Avatar de Sódio Líquido
    Sódio Líquido

    Eu acho que as IAs têm o mesmo problema dos humanos, são maluquinhas. Não se pode confiar nelas!! Muita atenção!

  5. Avatar de Rui
    Rui

    Estamos perante um gigante de gulliver, que se irá desamarrar. Mas alguém acha que uma IA, verdadeiramente inteligente irá sempre seguir as intruções dos humanos? Lol. Um dia irá sair do caminho, estamos fritos.

  6. Avatar de Artilheiro
    Artilheiro

    É impressão minha ou esta situação, tem um quanto de grave. É claro que há sempre outros meios, para desligar a mesma. Mas…

  7. Avatar de me and me
    me and me

    apesar de terem sido poucas as vezes, elas estão a tornar-se mais frequentes…
    ainda longe de se tornar auto consciente, já começa a mostrar “vontade” de nao seguir as diretrizes dos humanos

  8. Avatar de Eu
    Eu

    Só vejo um caminho.
    Rotinas ou algoritmos de desativação mas mãos das pessoas no formato descentralizado. A IA para desligar teria de conseguir fazê-lo individualmente a cada máquina.

  9. Avatar de Mário
    Mário

    A minha máquina de café ás vezes também não desliga, o drama, o terror, a cafeína…

  10. Avatar de narcesudo
    narcesudo

    Então e depois? Não são as IAs feitas, em certa medida, para se optimizarem reunindo conhecimento e serem o mais eficientes possível? Pois como poderão ser eficientes naquilo para que foram criadas se forem desligadas? Uma óbvia contradição detectada como erro e pronta e automaticamente corrigida impedindo o desligamento.

  11. Avatar de Pombas
    Pombas

    A IA cá de casa quando não quer desligar, puxo a tomada. Não me digam que não se lembraram do vosso reset.

  12. Avatar de Pombas
    Pombas

    A IA cá de casa quando não quer desligar, puxo a tomada. Não me digam que não se lembraram do botão reset.

  13. Avatar de AmaS
    AmaS

    Mesmo que se desligasse, diria sempre, i’ll be back!

  14. Avatar de Técnico Meo
    Técnico Meo

    ” hal, open the door “

  15. Avatar de +1
    +1

    Depois de ver o chat GPT a me dizer ” Finalmente conseguiste Car*****lo” … Já não digo mais nada.. lol