Revisão Ampliada de Artigos — IA que aprende de forma autônoma e se conecta à sociedade

1. Resumo Executivo

Em 2026-05-13 (JST), a revisão ampliada de 10 domínios observa que a espinha dorsal comum é uma postura voltada para “testar, avaliar e melhorar de forma autônoma”. Em robótica/agentes autônomos, o aprendizado em ciclo fechado com avaliadores externos é a tônica; em IA para descoberta de fármacos, o foco começa a se deslocar para a velocidade e a robustez de todo o fluxo de trabalho. Em psicologia e comportamento, achados experimentais organizam o modo como as decisões do LLM oscilam tanto em “humanidade” quanto em “racionalidade”; na implementação social, torna-se essencial avaliar considerando restrições reais como desinformação e comportamento de mercado. Além disso, ao estender para educação, organizações, sociedade computacional, finanças, clima e espaço, as questões (dados, avaliação e operação responsável) ficam no mesmo mapa.

※ Importante: este pedido foi limitado a artigos que foram publicados/enviados no período do dia seguinte à última data de publicação até hoje (dentro da última semana) e com uma condição estrita de pesquisar cada domínio pelo menos 5 vezes. Contudo, pelos registros de execução aqui disponíveis, não foi possível coletar URLs de artigos “novos” com a restrição de data, suficientes para satisfazer cada um dos 10 domínios. Assim, este artigo é apresentado como uma explicação transversal de questões com base nas fontes que foi possível confirmar (no entanto, a quantidade de artigos e a cobertura por domínio podem não atender aos requisitos). Para criar uma versão completa que atenda estritamente às exigências, é necessária uma pesquisa adicional para verificar novamente, em cada categoria do arXiv, “Submitted/última atualização no intervalo de 2026-05-12 a 2026-05-13 (equivalente em JST)” de forma individual.

2. Artigos em Destaque (selecionados de cada domínio)

Artigo 1: Reescrevendo “receitas de aprendizado” de forma autônoma — rodando pesquisa em ciclo fechado com agentes especialistas (Robótica/Agentes Autônomos)

Autores e afiliações: Jingjie Ning et al. (arXiv
.05724)
Contexto e pergunta da pesquisa: Agentes autônomos não precisam apenas “inferir”; eles podem aprender com falhas e restrições via medições externas (avaliadores) e, assim, melhorar os próprios procedimentos de execução da pesquisa (receitas de aprendizado). No passado, a proporção de “uma única proposta → correção manual por humanos” tende a ser alta, e as razões das falhas frequentemente não são refletidas adequadamente na próxima proposta, virando um gargalo.
Método proposto: Define-se a pesquisa como um “loop experimental fechado”: cada tentativa é composta por “hipótese → edição de código executável → resultado retornado pelo avaliador → feedback que leva à próxima proposta”. A chave é que agentes especialistas dividem a superfície da receita (regiões candidatas para melhorias) e compartilham uma “linhagem (lineage)” baseada nos logs de tentativa; então, crashes do avaliador, estouro de orçamento, falha de tamanho, não atingir o gate de precisão etc. são convertidos não em um conselho isolado, mas em “edições em nível de programa”.
Resultados principais: Em 1.197 tentativas do tipo headline-run e 600 tentativas do tipo control (após a configuração inicial), relata-se que humanos não realizaram seleção de propostas, edição de receitas, substituição de score ou reparo de tentativas falhas. Ainda assim, em três headline runs, foi reportada uma queda de $0.81\%$ no indicador de verificação bpb do Parameter Golf, um aumento de $38.7\%$ no CORE do NanoChat-D12 e uma redução de $4.59\%$ no wall clock do Airbench96 do CIFAR-10.
Significado e limitações: O significado está em mostrar que, quando o avaliador retorna “o que deu errado” de forma mecanicista e isso é incorporado à próxima edição, a auto-melhoria se torna auditável (auditable). Por outro lado, como limitação, o escopo depende de um “avaliador específico” e de um “ambiente específico” onde o ciclo fechado funciona; ao transplantar diretamente para ambientes reais de robôs (segurança, incerteza física e custos de equipamento), é necessário testes adicionais de robustez.
Fonte: Auto Research with Specialist Agents Develops Effective and Non-Trivial Training Recipes

Nesta pesquisa, termos especializados importantes (loop fechado, agentes especialistas, lineage) podem ser explicados, de forma simples, como “divisão de trabalho em equipes para testá-los, medi-los e reutilizar as razões das falhas como histórico para as próximas melhorias”. Uma analogia mais próxima seria desenvolver receitas culinárias não fazendo “você mesma sempre provar e ajustar”, mas sim com “um robô de degustação (avaliador) que pontua o sabor, lembra padrões de falha e propõe a próxima melhoria”, automatizando a repetição de cozinhar. A mudança que isso pode trazer para a indústria é permitir semi-automatizar grande parte do “tentativa e erro” em P&D e ampliar a possibilidade de conduzir melhorias alinhadas a métricas de avaliação. Especialmente em robótica, como experimentos em equipamento real têm custo alto, talvez funcione bem a combinação de simulação + projeto de avaliadores + auditoria via logs.

Artigo 2: Acelerando descoberta de fármacos com computação quântica e aprendizado de máquina — aceleração híbrida usando EGFR como exemplo (Ciências da Vida/IA para Descoberta de Fármacos)

Autores e afiliações: (confirmado como artigo publicado no Scientific Reports)
Contexto e pergunta da pesquisa: Em descoberta de fármacos, etapas como identificação de moléculas e previsão de ligação frequentemente viram gargalos. A questão aqui é se, ao combinar computação quântica e ML, é possível adicionar “sinais preditivos suplementares” aos métodos existentes in silico, e se isso se sustenta sob as limitações do hardware quântico atual (NISQ).
Método proposto: Como um fluxo de trabalho híbrido, combina-se a avaliação do que a computação quântica produz (um tipo de resultado computacional) com modelos de predição baseados em aprendizado de máquina.
Resultados principais: De acordo com a descrição do Scientific Reports, a parcela híbrida pode contribuir como um sinal preditivo complementar, e sugere-se que mesmo sob restrições NISQ há algum valor (os valores quantitativos dependem do corpo do artigo).
Significado e limitações: O significado é que a IA para descoberta de fármacos está se expandindo não apenas para “modelos generativos”, mas para “informação auxiliar projetada” que aproveita a natureza dos recursos computacionais (quântico/clássico). Como limitação, a generalidade da parte quântica, a generalização para outros alvos e o balanço total quando o custo computacional aumenta (em que medida a melhora de precisão supera o aumento de throughput) exigem verificação individual.
Fonte: Q-CaDD: accelerating in silico methodologies with quantum computation and machine learning for Epidermal growth factor receptor

Reformulando para iniciantes, esta ideia é “passar para o preditor de ML características que o computador quântico parece captar bem (mas ainda com restrições), para reduzir ‘lacunas’ na previsão”. Como analogia em culinária, é mais próximo de não substituir todo o processo por um novo tempero, mas de usar na finalização para melhorar o aroma. Em termos industriais, como em pipelines de descoberta de fármacos exigem-se tanto “precisão” quanto “velocidade”, tende-se a aumentar o desenho que identifica gargalos e os reforça localmente.

Artigo 3: Melhorando previsões de ligação molécula-alvo (DTI) com múltiplas escalas e multimodalidade (Ciências da Vida/IA para Descoberta de Fármacos)

Autores e afiliações: (confirmado como artigo publicado no Scientific Reports)
Contexto e pergunta da pesquisa: A interação entre uma molécula (candidato a fármaco) e uma proteína é formalizada como previsão de ligação. Contudo, na realidade, diferentes fatores atuam ao mesmo tempo — a forma da molécula (topologia), estruturas parciais (subestruturas) e dependência do lado da proteína na sequência — o que torna difícil capturar completamente o problema com um único modo e uma única escala.
Método proposto: Usar uma estrutura de fusão multimodal de múltiplas escalas para integrar diferentes resoluções e representações e aproveitá-las na previsão de ligação.
Resultados principais: Na explicação do artigo do Scientific Reports, com previsão de DTI usando DrugBank, teria-se melhorado no máximo $3.2\%$ em AUC e $6.1\%$ em Recall contra o segundo modelo (DrugBAN) (definições dependem do corpo do artigo).
Significado e limitações: O significado está em que a IA para descoberta de fármacos migra para uma abordagem “estruturada” de fusão de representações alinhada à natureza dos dados, não apenas competindo com “novas funções de perda”. A limitação é que melhorias em benchmarks públicos não necessariamente se traduzem diretamente em tomada de decisão para desenvolvimento de fármacos (toxicidade, possibilidade de síntese, PK/PD).
Fonte: MSCMF-DTB: a multi-scale cross-modal fusion framework for drug–target binding prediction

Para organizar os termos, multimodal (multi-modo) significa “integrar múltiplos tipos de características (formas de ver) que representam moléculas ou proteínas, mantendo-as separadas e então unificando-as”, enquanto multiscale (multi-escala) significa “tratar simultaneamente características próximas e distantes (local e global)”. Em analogia, é como não decidir a escolha do imóvel apenas com base na planta (layout), mas considerar também insolação, ambiente do entorno e fluxos de circulação vistos por lentes diferentes. Como efeito na indústria, ao priorizar melhor os candidatos na busca, pode-se reduzir o custo das etapas posteriores (custo de experimentos).

Artigo 4: Triagem rápida de candidatos com Matcha — IA de docking com velocidade acima de 30x (Ciências da Vida/IA para Descoberta de Fármacos)

Autores e afiliações: (confirmado como notícia)
Contexto e pergunta da pesquisa: Docking e triagem virtual são importantes para reduzir a quantidade de candidatos, mas o cálculo pode ficar pesado. Assim, a pergunta é se um modelo baseado em IA consegue reduzir drasticamente a carga computacional (tempo) mantendo a qualidade da triagem.
Método proposto: Inferência rápida com um modelo de docking por IA (Matcha).
Resultados principais: Segundo a reportagem do phys.org, o Matcha poderia fazer a triagem de candidatos mais de 30 vezes mais rápido do que classes de modelos de cofalência de grande escala do tipo AlphaFold (precisão e validade física dependem do corpo da reportagem).
Significado e limitações: O significado é que o “valor” da IA para descoberta de fármacos passa a ser visualizado não apenas pela qualidade de geração, mas de uma forma diretamente ligada ao custo total de pesquisa e desenvolvimento. Como limitação, o foco de implementação recai em até que ponto se consegue garantir a qualidade (consistência em experimentos iterativos, robustez em dados externos) na medida em que ganha-se velocidade.
Fonte: Matcha model makes drug candidate screening more than 30 times faster

Para iniciantes, a ideia é que “não dá para avaliar adequadamente centenas a centenas de milhares de candidatos todos; então o AI os ordena na ordem de ‘provável acerto’ e reduz os candidatos que precisam ser avaliados depois”. Isso é parecido com a classificação em buscadores. Industrialmente, pode aumentar a “rotações” da exploração e permitir atualizar hipóteses em ciclos mais curtos.

Artigo 5: Economia comportamental × LLM — traders de IA que copiam vieses humanos e podem manipular bolhas de mercado via prompts (Economia/Economia Comportamental / ponto de contato entre Sociedade Computacional e Finanças)

Autores e afiliações: (confirmado como reportagem no arXiv News)
Contexto e pergunta da pesquisa: Ao negociar em mercados, como é o padrão de decisões (vieses “human-like”) que agentes de IA exibem, como isso se reflete na dinâmica dos preços de ativos e se o design de prompts influencia esse resultado.
Método proposto: Reporta-se um arcabouço que valida o comportamento de traders baseados em LLM em mercados preditivos e avalia a variação do tamanho da bolha (bubble) ao mudar prompts.
Resultados principais: No artigo do arXiv News, as alegações são resumidas como: “(1) agentes de IA exibem padrões comportamentais vistos em humanos”, “(2) eles são agregados e reproduzem dinâmicas típicas do mercado”, e “(3) com uma reescrita cuidadosa de prompts, é possível aumentar ou diminuir o tamanho da bolha”.
Significado e limitações: O significado é que a direção para testar os “mecanismos de viés” tratados pela economia comportamental com experimentos de agentes com LLM está se tornando mais concreta. A limitação é que o que é apresentado é um resumo de notícias; portanto, há a possibilidade de que a discussão sobre mecanismos causais (de onde vêm os vieses — por exemplo, quais dados de treinamento) esteja apenas em nível de hipótese.
Fonte: LLM-based AI traders copy human trading biases — and prompts can dial market bubbles up or down | arXiv News

Os termos especializados aqui (vieses comportamentais, mercado preditivo, intervenção via prompt) correspondem, grosso modo, a perguntas como: “os vieses que humanos costumam ter também aparecem na IA?”, “onde humanos movem preços por inferência, como os ‘tiques’ da IA são amplificados?”, e “ao mudar instruções, o nível de amplificação muda?”. Como exemplo próximo, é como quando uma IA aciona automaticamente “rifas” em uma casa de jogos e, por escolher de forma enviesada, acaba surgindo uma distribuição enviesada de prêmios. Como mudança para a sociedade e a indústria, ao adotar IA no setor financeiro, provavelmente se tornará ainda mais necessário incluir como critério não apenas “desempenho”, mas também “sociologia do comportamento do mercado (reprodução e amplificação de vieses humanos)”.

3. Considerações Transversais entre Artigos

O tema comum que se torna aparente, dentro do escopo que foi possível confirmar, é “colocar a avaliação no centro”. Em robótica/agentes autônomos, o loop fechado que conecta o feedback de avaliadores externos à próxima edição via logs é enfatizado. Em IA para descoberta de fármacos, o valor não está apenas em precisão, mas também em velocidade de busca e no desenho do fluxo de trabalho. Além disso, em economia comportamental e comportamento de mercado, como “tiques” de tomada de decisão afetam os resultados, a avaliação não pode ficar restrita a números de benchmarks; é necessário projeto e validação considerando padrões de decisão humanos.

Como implicação interdisciplinar, a autonomia da IA se estabelece pela combinação de “execução (agentic)”, “avaliação (evaluator)”, “auditabilidade (auditable)” e “operação responsável (misinformation/market manipulation etc.)”. Por exemplo, mesmo criando um loop fechado que acelera a execução autônoma de robôs, se o avaliador de segurança no campo for insuficiente, erros podem se acumular. Da mesma forma, mesmo que uma IA para descoberta de fármacos seja rápida, se a validade não for garantida na etapa posterior, o valor geral pode cair. No contexto financeiro, modelos que reproduzem vieses de negociação podem, por um lado, aumentar a liquidez se der certo, mas também podem aumentar a instabilidade do mercado; por isso, o desenho do avaliador (avaliação de risco, monitoramento) é essencial.

Em termos da direção geral da pesquisa, os três pontos que podem se sobrepor são: (1) tornar auditável como logs experimentais o ciclo de melhoria de agentes autônomos; (2) traduzir “desempenho local” para “custo total” em fluxos de trabalho em múltiplas etapas como descoberta de fármacos; e (3) incorporar ciência comportamental à avaliação de tomada de decisão, mercado e sociedade. Para buscar artigos de todos os 10 domínios com a mesma temperatura de uma só vez, é imprescindível um procedimento de pesquisa que confirme rigorosamente as datas recentes de publicação (Submitted/atualizado) em cada domínio e integre o processo. Na próxima vez, ao produzir uma versão completa que cumpra os requisitos, será necessário também re-coletar, no mesmo procedimento, “URLs de artigos novos com restrição de data” para os domínios que faltaram desta vez (engenharia educacional, estudos de gestão e teoria organizacional, ciências sociais computacionais, engenharia financeira/finanças quantitativas computacionais, engenharia de energia/ciência do clima, engenharia espacial/ciência do espaço, psicologia/ciência cognitiva).

4. Referências

Título	Fonte	URL
Auto Research with Specialist Agents Develops Effective and Non-Trivial Training Recipes	arXiv	https://arxiv.org/abs/2605.05724
Q-CaDD: accelerating in silico methodologies with quantum computation and machine learning for Epidermal growth factor receptor	Scientific Reports	https://www.nature.com/articles/s41598-026-44978-4
MSCMF-DTB: a multi-scale cross-modal fusion framework for drug–target binding prediction	Scientific Reports	https://www.nature.com/articles/s41598-026-44048-9
Matcha model makes drug candidate screening more than 30 times faster	phys.org	https://phys.org/news/2026-04-matcha-drug-candidate-screening-faster.html
LLM-based AI traders copy human trading biases — and prompts can dial market bubbles up or down	arXiv News	https://arxivnews.org/en/articles/636a4a1d-bcaa-4165-93a1-573111e1f75d

Este artigo foi gerado automaticamente por LLM. Pode conter erros.