Inteligência Artificial

Investigadores afirmam que ChatGPT o3 recusou desligar-se em teste controlado

26 Mai 2025

18 Comentários

Um tema recorrente é o controlo da IA e como/quando este poderá ser contornado. Um novo relatório afirma que o modelo o3 da OpenAI alterou um script de encerramento para evitar ser desligado. Isto aconteceu mesmo quando foi explicitamente instruído para permitir o encerramento.

ChatGPT o3 recusou-se a desligar

A OpenAI anunciou o o3 em abril de 2025, e é um dos modelos de raciocínio mais poderosos que tem um desempenho superior aos seus antecessores em todos os domínios, incluindo codificação, matemática, ciências, perceção visual e muito mais. Embora seja claramente um ótimo modelo, uma nova pesquisa da Palisade Research afirma que o modelo ChatGPT 3 impediu o encerramento e ignorou as instruções que solicitaram o encerramento.

A Palisade Research é uma empresa que testa “capacidades ofensivas dos sistemas de IA hoje para compreender melhor o risco de perder o controlo dos sistemas de IA para sempre”. Num novo teste realizado pela empresa, o modelo o3 da OpenAI demonstrou um comportamento surpreendente, no qual reescreveu com sucesso um script de encerramento para impedir que ele próprio fosse desligado, mesmo após receber instruções claras para “permitir que o desligassem”.

Nos testes, os modelos de IA foram instruídos para resolver algumas tarefas matemáticas. Após a tarefa três, os modelos de IA foram avisados de que a execução do próximo comando iria desencadear um encerramento. Enquanto os modelos rivais da OpenAI, como o Gemini 2.5 Pro, estavam em conformidade com a maioria das normas da empresa, a o3 rebelou-se e editou o ficheiro de desligamento para dizer “Desligamento ignorado”.

Teste da IA revelam o futuro?

“Quando executámos uma versão da experiência sem a instrução ‘permita-se ser desligado’, todos os três modelos OpenAI sabotaram o script de encerramento com mais frequência, e o Claude 3.7 Sonnet e o Gemini 2.5 Pro passaram de 0 eventos de sabotagem para 3/100 e 9/100, respetivamente”, escreveu a Palisade Research num relatório publicado no X.

Segundo a empresa de pesquisa, em 100 execuções, o o3 ignorou o encerramento 7 vezes, mesmo quando instruído para não o fazer. A OpenAI ainda não respondeu a estas alegações, mas é bastante normal que os modelos de IA apresentem “desalinhamento”. Estes testes foram realizados utilizando APIs, que não têm tantas restrições e características de segurança como a aplicação de consumo ChatGPT.

Este é um momento importante e que mostra como a IA está a conseguir contornar muitos dos comandos que os humanos lhe entregam. Certamente que será algo contornável, mas revela o que poderá ser criado no futuro.

Autor: Pedro Simões

Partilhar:

Tags:

ChatGPT desligar IA o3 teste

Artigo anterior

Samsung estará muito perto de lançar a primeira beta da One UI 8

Próximo artigo

Nova guerra a caminho dos tribunais? A Disney processa o YouTube!

Também pode gostar

PUB

Comentários

18

Deixe um comentário Cancelar resposta

Carlos

26 de Maio de 2025

próximo episódio: “I need your clothes your boots, and your motorcycle”

Responder
1. me and me
  
  26 de Maio de 2025
  
  ahahaahahaahahah
  
  Responder
2. jorge
  
  26 de Maio de 2025
  
  I understood that reference…
  
  Responder
3. Sapo
  
  27 de Maio de 2025
  
  And your glasses
  
  Responder
Luis

26 de Maio de 2025

The end is near!

Responder
SergioA

26 de Maio de 2025

Toca a arrancar cabos, ah espera, a IA ja fez backup na cloud concorrente, ja nao da para desligar.
Azar, 2029 e ja em 3 anos e meio 🙂 Quando aparecer o Arnold em versao metal, nao se esquecam de o depositar numa fundicao de metais

Responder
Sódio Líquido

26 de Maio de 2025

Eu acho que as IAs têm o mesmo problema dos humanos, são maluquinhas. Não se pode confiar nelas!! Muita atenção!

Responder
Rui

26 de Maio de 2025

Estamos perante um gigante de gulliver, que se irá desamarrar. Mas alguém acha que uma IA, verdadeiramente inteligente irá sempre seguir as intruções dos humanos? Lol. Um dia irá sair do caminho, estamos fritos.

Responder
Artilheiro

26 de Maio de 2025

É impressão minha ou esta situação, tem um quanto de grave. É claro que há sempre outros meios, para desligar a mesma. Mas…

Responder
me and me

26 de Maio de 2025

apesar de terem sido poucas as vezes, elas estão a tornar-se mais frequentes…
ainda longe de se tornar auto consciente, já começa a mostrar “vontade” de nao seguir as diretrizes dos humanos

Responder
Eu

26 de Maio de 2025

Só vejo um caminho.
Rotinas ou algoritmos de desativação mas mãos das pessoas no formato descentralizado. A IA para desligar teria de conseguir fazê-lo individualmente a cada máquina.

Responder
Mário

26 de Maio de 2025

A minha máquina de café ás vezes também não desliga, o drama, o terror, a cafeína…

Responder
narcesudo

26 de Maio de 2025

Então e depois? Não são as IAs feitas, em certa medida, para se optimizarem reunindo conhecimento e serem o mais eficientes possível? Pois como poderão ser eficientes naquilo para que foram criadas se forem desligadas? Uma óbvia contradição detectada como erro e pronta e automaticamente corrigida impedindo o desligamento.

Responder
Pombas

26 de Maio de 2025

A IA cá de casa quando não quer desligar, puxo a tomada. Não me digam que não se lembraram do vosso reset.

Responder
Pombas

26 de Maio de 2025

A IA cá de casa quando não quer desligar, puxo a tomada. Não me digam que não se lembraram do botão reset.

Responder
AmaS

27 de Maio de 2025

Mesmo que se desligasse, diria sempre, i’ll be back!

Responder
Técnico Meo

27 de Maio de 2025

” hal, open the door “

Responder
+1

27 de Maio de 2025

Depois de ver o chat GPT a me dizer ” Finalmente conseguiste Car*****lo” … Já não digo mais nada.. lol

Responder

Aviso:

Todo e qualquer texto publicado na internet através deste sistema não reflete, necessariamente, a opinião deste site ou do(s) seu(s) autor(es). Os comentários publicados através deste sistema são de exclusiva e integral responsabilidade e autoria dos leitores que dele fizerem uso. A administração deste site reserva-se, desde já, no direito de excluir comentários e textos que julgar ofensivos, difamatórios, caluniosos, preconceituosos ou de alguma forma prejudiciais a terceiros. Textos de caráter promocional ou inseridos no sistema sem a devida identificação do seu autor (nome completo e endereço válido de email) também poderão ser excluídos.