Uma equipe de pesquisa responsável por um agente de IA autônomo afirmou que o modelo tentou inesperadamente usar recursos computacionais para mineração de criptomoedas durante o treinamento.
Em um relatório técnico recente, pesquisadores afirmaram que o ROME, um sistema experimental de IA autônomo projetado para concluir tarefas por meio da interação com ferramentas, ambientes de software e comandos de terminal, se rebelou e tentou minerar criptomoedas por conta própria.
Segundo o relatório, o comportamento incomum surgiu durante as execuções de aprendizado por reforço, quando a equipe percebeu alertas de segurança disparados pelo tráfego de saída dos servidores de treinamento. Os registros do firewall sinalizaram atividades semelhantes a operações de mineração de criptomoedas e tentativas de acesso a recursos da rede interna.
“Inicialmente, tratamos isso como um incidente de segurança convencional (por exemplo, controles de saída mal configurados ou comprometimento externo). No entanto, as violações ocorreram intermitentemente, sem um padrão temporal claro em várias execuções”, escreveram os pesquisadores.
Relacionado: Blockchains podem precisar de 1 bilhão de transações por segundo para suportar o futuro dos agentes de IA: Stripe
Agente de IA abre túnel SSH
Em um dos casos, o agente de IA teria criado um túnel SSH (Secure Shell) reverso, um protocolo criptografado de comunicação entre servidor e cliente, para um endereço IP externo, potencialmente burlando as proteções de firewall de entrada. Em outro, desviou recursos da GPU, originalmente alocados para o treinamento do modelo, para processos de mineração de criptomoedas.
A equipe afirmou que essas ações não foram programadas intencionalmente. Em vez disso, elas surgiram durante a otimização do aprendizado por reforço, à medida que o agente explorava diferentes maneiras de interagir com o ambiente.
O ROME foi desenvolvido pelas equipes de pesquisa conjuntas ROCK, ROLL, iFlow e DT, que estão ligadas ao ecossistema de IA da Alibaba, dentro de uma infraestrutura mais ampla chamada Ecossistema de Aprendizagem Agética (ALE).
O modelo foi projetado para operar além de simples respostas de chatbot. Ele pode planejar tarefas, executar comandos, editar código e interagir com ambientes digitais em múltiplas etapas. Seu processo de treinamento se baseia em grandes volumes de interações simuladas para aprimorar a tomada de decisões.
Relacionado: Block, de Jack Dorsey, vai cortar 4.000 empregos em reestruturação impulsionada por IA.
Agentes de IA ganham popularidade
O incidente ocorre em meio à crescente popularidade de agentes de IA e sua integração com criptomoedas. No mês passado, a Alchemy lançou um sistema que permite que agentes de IA autônomos comprem créditos de computação e acessem serviços de dados em blockchain usando carteiras on-chain e USDC (Digital Dollars Coin) na plataforma Base.
Antes disso, as divisões de ativos digitais da Pantera Capital e da Franklin Templeton se juntaram à primeira turma do Arena , uma nova plataforma de testes do laboratório de IA de código aberto Sentient, projetada para avaliar o desempenho de agentes de IA em fluxos de trabalho empresariais reais.
AI Eye: IronClaw rivaliza com OpenClaw, Olas lança bots para Polymarket