Revue d’articles étendue — De « nouveaux modèles et validations » traversant l’autonomie, la recherche de médicaments et l’impact sociétal

1. Résumé exécutif

Dans cette revue, l’axe n’est pas seulement « construire de nouveaux modèles » : nous avons plutôt choisi de nous concentrer sur « dans quelle mesure ils peuvent reproduire et améliorer les contraintes réelles ainsi que les comportements de la société ». En robotique, on voit se dessiner une direction visant à quantifier le caractère peu explicitement abordé de la durabilité, au moyen d’une analyse à grande échelle de corpus. En finance et en économie comportementale, le centre d’attention est le biais de comportement que des agents LLM affichent sur le marché, ainsi que la manière dont il augmente ou diminue sous l’effet d’interventions par prompt. Parallèlement, en posant solidement les bases que constitue la prédiction de structure protéique — cœur de la découverte de médicaments par IA —, nous organisons aussi ce que les approches contemporaines ont hérité de ces fondations.

2. Articles à l’honneur (sélection par domaine)

Article 1 : L’écart de durabilité en robotique : une enquête à grande échelle sur la conscience de la durabilité dans 50 000 articles de recherche (robotique, agents autonomes)

Auteurs / affiliations : Antun Skuric, Leandro Von Werra, Thomas Wolf (affiliations telles qu’indiquées sur la page de l’article)
Contexte de la recherche et question : Tandis que les robots autonomes et l’automatisation deviennent de plus en plus déployés dans la société, les questions de charge environnementale et d’impact éthique deviennent des enjeux. Toutefois, il était difficile d’observer de manière quantitative si la communauté de recherche explicite la durabilité comme motivation. Dès lors, cette étude pose la question suivante : sur l’énorme volume d’articles du domaine cs.RO, dans quelle mesure la sensibilisation à la durabilité (motivation, description des impacts, connexion aux SDGs) apparaît-elle.
Méthode proposée : Pour un corpus de grande taille, nous agrégons l’occurrence de termes liés à la durabilité, la présence ou non de mentions concernant la société, les écosystèmes et la durabilité, ainsi que des mentions explicites aux UN Sustainable Development Goals (SDGs), en tant qu’indicateurs de type règles / indicateurs classificatoires. Autrement dit, il s’agit d’une conception visant à mesurer « dans quelle mesure l’idée de durabilité est “écrite” dans les affirmations de recherche ».
Résultats principaux : Les résultats montrent un « écart » : la proportion d’articles abordant les impacts liés à la durabilité est extrêmement faible, et surtout les références explicites aux SDGs sont encore plus rares (dans les résumés d’abstracts, des plages comme des mentions explicites des SDGs < 0,1 % et une motivation à la durabilité < 5 % sont rapportées). Même si la recherche en robotique peut être appliquée à des domaines de défis sociétaux, le cadrage (la manière de raconter la recherche) n’a pas encore fait de la durabilité une norme.
Intérêt et limites : L’intérêt est d’avoir visualisé, à une échelle très forte, si la durabilité est abordée comme un « objectif d’effort » ou positionnée comme une valeur des résultats de recherche. En revanche, la limite est que « peu de mentions » ne signifie pas nécessairement « faibles charges environnementales / pas de prise en compte ». Il s’agit avant tout d’une explicitation textuelle ; il est possible que l’étude ne suive pas directement les réalités de l’implémentation ni des mesures (par ex. des analyses de cycle de vie).
Source : The Sustainability Gap in Robotics: A Large-Scale Survey of Sustainability Awareness in 50,000 Research Articles

Cet article apporte aux débutants une perspective du type : « la valeur de la recherche ne se limite pas à des scores de performance — elle réside aussi dans le but pour lequel elle est conçue (motivation et impact) ». Prenons une analogie : c’est la différence entre une voiture qui ne dit que « jusqu’où elle est sûre », et une voiture qui explique « comment elle a été conçue en tenant compte aussi du carburant et des émissions ». Si la communauté de recherche ne parvient pas à adopter une narration de ce type, il devient difficile pour la société de juger « pourquoi cette technologie est nécessaire ». Sur le plan industriel, si la durabilité est alignée dès l’étape de recherche, des discussions sur l’approvisionnement, la conformité réglementaire et l’évaluation ESG pourraient avancer plus tôt.

Article 2 : Décomposer les bulles de marché et la finance comportementale : formation des attentes et trading par agents LLM (ingénierie financière, finance computationnelle)

Auteurs / affiliations : Shumiao Ouyang, Pengfei Sui (affiliations telles qu’indiquées sur la page de l’article)
Contexte de la recherche et question : Sur les marchés, on observe des facteurs comportementaux (par ex. des biais vers l’information récente, l’aversion à la perte et, inversement, une tendance à « vendre ») que l’on ne peut pas expliquer entièrement même en supposant des attentes rationnelles. Dès lors, la question est : lorsque l’on fait participer au marché des modèles de langage de grande taille tels que le LLM en tant qu’agents, observe-t-on des motifs comportementaux connus des recherches sur l’humain ? Et surtout : comment détecter le « mécanisme » sous-jacent, et dans quelle mesure peut-on le modifier via des interventions comme les prompts ?
Méthode proposée : Nous construisons un marché simulé d’enchères « open-call auction » et y faisons participer des agents LLM (en gros, des entités autonomes capables de générer du texte et de raisonner). Nous observons la formation des attentes et les comportements de passation d’ordres de chaque agent, puis évaluons des phénomènes connus en économie comportementale (par ex. l’effet de disposition, ou le fait d’accorder un poids plus élevé à l’information rétrospective / récente) à l’aide d’indicateurs. En outre, nous scorons les textes de raisonnement (reasoning text) des agents dans un cadre de type « 20 mécanismes », afin d’explorer quels mécanismes sont associés à la formation des bulles.
Résultats principaux : D’après le résumé, l’article rapporte : (1) l’observation, comme motifs comportementaux classiques, de l’effet de disposition et de « recency-weighted extrapolative beliefs (croyances extrapolatives pondérées par la récence) » ; (2) l’agrégation en tant que dynamiques d’équilibre et la reproduction de relations connues dans les marchés d’actifs expérimentaux (par ex. que la demande excédentaire prédit le prix futur, que l’inadéquation des opinions et le volume échangé sont positivement liés, etc.) ; (3) en utilisant des « scores par mécanisme » appliqués aux textes de raisonnement, certaines interventions via prompt peuvent modifier de manière causale l’ampleur de la bulle.
Intérêt et limites : L’intérêt réside dans la tentative de relier le fait que des LLM ne sont pas seulement des générateurs de texte, mais peuvent devenir des entités dotées de « styles comportementaux » pour la décision économique, à des traces textuelles et d’expliquer par quels mécanismes l’intervention agit. En revanche, comme limites, la causalité obtenue ici pourrait dépendre fortement de l’environnement de marché conçu, de l’espace des prompts, et des indicateurs d’évaluation. De plus, comme il est difficile de reproduire parfaitement les institutions et les asymétries d’information des marchés réels, il faut faire preuve de prudence lors de l’extrapolation.
Source : Dissecting AI Trading: Behavioral Finance and Market Bubbles

Le cœur de cette recherche est une posture consistant à « lire les fluctuations du marché jusqu’au contenu du raisonnement ». Reformulée pour des débutants : il ne s’agit pas seulement d’observer si les cours montent ou descendent (le résultat), mais d’inférer depuis le texte pourquoi les agents ont pris telle décision (candidats de causes), puis d’intervenir dans ces causes pour tester la reproductibilité. C’est proche de l’idée, en contrôle de robots, de vérifier non seulement si « la sortie est bonne », mais si « la loi de commande agit du côté de la sécurité ». Sur le plan industriel, comprendre « à quels mécanismes de comportement l’AI trader dépend » devient crucial pour la conception, la réglementation et l’audit (audit) des traders basés sur l’IA. Par exemple, si modifier un prompt influence la résistance aux bulles, alors la gestion des changements en exploitation (gouvernance des versions de modèles/prompts) devient directement liée au risque économique.

Article 3 : L’économie comportementale de l’IA : Biais des LLM et corrections (psychologie, sciences cognitives)

Auteurs / affiliations : Auteurs indiqués dans l’abstract (conformément à ce qui est indiqué sur la page de l’article)
Contexte de la recherche et question : En recherche sur la prise de décision humaine, on sait que les biais cognitifs déforment systématiquement les comportements. Dans des situations où l’IA — en particulier les LLM — est utilisée pour la décision, le problème est que l’IA elle-même peut présenter des « habitudes de sortie » et une susceptibilité à être « guidée », et que cela influence les résultats comportementaux. Dès lors, cet article vise à appréhender les biais observés dans les LLM dans un cadre d’économie comportementale et à étudier leur potentiel de correction.
Méthode proposée : Pour le LLM, nous donnons des entrées liées à la prise de décision et analysons les biais dans les sorties. Ensuite, nous introduisons des interventions pour réduire les biais (prompts et contraintes, et parfois des conceptions comparatives) et évaluons si les biais s’améliorent « de manière statistique ».
Résultats principaux : D’après le résumé sur la page de l’article, il est suggéré que les LLM peuvent montrer des modes d’erreur systématiques semblables à ceux observés dans la recherche sur l’humain, et qu’il existe une possibilité de correction par une intervention donnée (les indicateurs d’évaluation détaillés et la taille d’effet nécessitent la consultation du texte intégral). Au moins, l’argument central est que les erreurs des LLM ne sont pas aléatoires et peuvent dépendre de la conception.
Intérêt et limites : L’intérêt est de connecter les concepts de psychologie et de sciences cognitives à l’évaluation de l’IA, et de déplacer les biais de « phénomènes » vers « objets d’amélioration ». En revanche, comme limites, quels biais se reproduisent dans quelles tâches opérationnelles dépend de la conception des tâches et de la distribution des données. Les recherches sur les biais de l’IA se heurtent souvent au problème d’un écart entre la conception en laboratoire et l’environnement opérationnel réel.
Source : Behavioral Economics of AI: LLM Biases and Corrections

En résumé, pour les débutants, l’idée clé de cet article est la suivante : « les “habitudes de réponse” des LLM peuvent, dans certains cas, être comprises comme des biais du même type que ceux étudiés en économie comportementale ». Par exemple, tout comme les personnes peuvent être attirées par certains choix dans des questionnaires, les LLM peuvent être attirés par certaines formes ou certains contextes. Du point de vue de l’impact social et industriel, comme des « réponses plausibles » ne suffisent pas dans l’aide à la décision (sélection pour l’embauche, l’octroi de prêts, ou la sélection dans l’éducation, etc.), il devient nécessaire de auditer les différents types de biais et de prévoir des moyens de correction.

Article 4 : Inférence active (Active Inference) appliquée à la robotique et aux agents artificiels — enquête et défis (robotique, agents autonomes)

Auteurs / affiliations : Principaux auteurs et affiliations tels qu’indiqués sur la page de l’article (l’abstract s’appuie sur la page de l’article)
Contexte de la recherche et question : Les agents autonomes doivent observer, raisonner et agir dans l’incertitude. Comme approche, « l’inférence active » est une idée connue pour optimiser en mettant à jour les états du monde et les politiques via l’erreur de prédiction (l’écart entre l’attente et l’observation). Cette enquête pose la question de la manière dont ce cadre peut être utilisé en robotique et de l’endroit où se situent les défis.
Méthode proposée : Plutôt qu’une proposition unique, il s’agit d’une enquête qui donne une vue d’ensemble des exemples d’application de l’Active Inference en robotique et dans les agents artificiels (estimation d’état, contrôle, comportements orientés objectifs, etc.) afin de résumer les avancées et les goulots d’étranglement de la recherche.
Résultats principaux : D’après le résumé, l’Active Inference pourrait servir de base à l’estimation d’état et au contrôle sous incertitude, ainsi qu’à des comportements pilotés par des objectifs.
Intérêt et limites : L’intérêt est de fournir une carte d’ensemble méthodologique aux lecteurs, leur permettant de saisir « où se trouvent les écarts ». Comme limites, puisque c’est une enquête, l’article peut ne pas présenter les chiffres de performance « des nouvelles réalisations de la semaine » en tant que tels.
Source : Active Inference in Robotics and Artificial Agents: Survey and Challenges

Pour les débutants, cet article constitue une remise en perspective : « l’autonomie n’est pas seulement l’apprentissage par renforcement ». L’Active Inference est, en analogie, comme si « le robot mettait continuellement à jour une carte du monde dans sa tête » : il observe, corrige la carte (croyances), puis la met encore à jour avec l’action suivante. Dans le domaine social et industriel, il est possible que l’on s’y intéresse comme un cadre bien adapté à l’explicabilité (pourquoi cette action a été choisie) et aux validations de sécurité.

Article 5 : Prédiction de la structure des protéines : la prochaine génération (sciences du vivant, IA pour la recherche de médicaments)

Auteurs / affiliations : Michael C. Prentiss et autres (tels qu’indiqués sur la page de l’article)
Contexte de la recherche et question : Dans la découverte de médicaments par IA, la prédiction de la structure des protéines est une étape préliminaire pour comprendre « la forme avec laquelle le médicament se lie ». Cependant, la prédiction de structure dépend fortement des hypothèses sur le paysage d’énergie et le repliement, et des ajustements théoriques et d’implémentation sont nécessaires pour améliorer la précision. Cette étude propose une vue d’ensemble des trajectoires en prédiction de structure protéique et présente des idées pour l’amélioration.
Méthode proposée : En s’appuyant sur une lecture issue de la mécanique statistique et de l’approche du paysage d’énergie, l’article présente des idées qui mènent à l’amélioration de la fonction d’énergie de prédiction, comme l’idée d’exploiter des ensembles (un ensemble de plusieurs structures candidates).
Résultats principaux : Dans le contexte d’une revue de littérature, l’article explique comment le cadre de prédiction a évolué, et décrit des concepts liés aux propriétés du paysage d’énergie sous-jacent (par ex. des paysages d’énergie « funnelled »).
Intérêt et limites : L’intérêt est de pouvoir organiser l’arrière-plan théorique comme base pour comprendre « où en est » la découverte de médicaments par IA. En revanche, comme limite, puisque cet article lui-même contient du contenu classique, l’adaptation directe aux modèles génératifs récents et aux derniers benchmarks dépend du texte intégral.
Source : Protein Structure Prediction: The Next Generation

Cet article joue un rôle de structuration de « l’entrée » pour les débutants dans la découverte de médicaments par IA. On a souvent l’impression que la découverte de médicaments par IA « fait des prédictions puis s’arrête ». Mais comprendre comment les « intuitions physiques » sous-jacentes se reflètent dans la conception du modèle et l’objet d’apprentissage permet d’améliorer la précision et la reproductibilité des applications. Sur le plan industriel, plus la fiabilité de la prédiction de structures augmente, plus le prétraitement pour la prédiction d’interactions et l’exploration de leads se renforce, ce qui pourrait réduire les coûts d’exploration.

3. Réflexions transversales entre les articles

Le thème commun qui traverse ces cinq articles est : « comment construire non seulement la performance du modèle (taux de justesse), mais aussi la conception de l’évaluation, la testabilité, et l’alignement social ». En robotique, « la clarté (explicitation) » de la durabilité est devenue un objet de mesure, et la manière même de raconter la recherche a servi d’indicateur. Cela ressemble à une direction de « méta-évaluation » permettant à l’ingénierie de se connecter à la société. En ingénierie financière et en économie comportementale, on a montré que les comportements d’agents LLM reproduisent des relations connues des marchés d’actifs expérimentaux classiques et qu’ils peuvent en outre être modifiés de manière causale par des interventions. Ici, l’estimation des mécanismes à partir du texte de raisonnement devient importante, au-delà des seuls comportements observables. Du côté psychologie et sciences cognitives, les articles saisissent les biais de l’IA dans le langage des biais, et en testant leur potentiel de correction, ils rapprochent l’évaluation de l’IA d’« une expérience en sciences cognitives ». Côté découverte de médicaments par IA, organiser l’arrière-plan théorique de la prédiction de structures protéiques sert de socle qui soutient la compréhension des méthodes modernes. Les progrès des modèles génératifs sont rapides, mais la continuité de l’intuition physique peut influer sur la robustesse et l’interprétabilité des modèles. Dans l’ensemble, malgré des différences entre 10 domaines d’application, trois préoccupations communes émergent dans la conception de la recherche : « des indicateurs testables », « des variables modifiables via intervention », et « une explication reliant les exigences de la société ».

4. Références

Titre	Source d’information	URL
The Sustainability Gap in Robotics: A Large-Scale Survey of Sustainability Awareness in 50,000 Research Articles	arXiv	https://arxiv.org/abs/2604.07921
Dissecting AI Trading: Behavioral Finance and Market Bubbles	arXiv	https://arxiv.org/abs/2604.18373
Behavioral Economics of AI: LLM Biases and Corrections	arXiv	https://arxiv.org/abs/2602.09362
Active Inference in Robotics and Artificial Agents: Survey and Challenges	arXiv	https://arxiv.org/abs/2112.01871
Protein Structure Prediction: The Next Generation	arXiv	https://arxiv.org/abs/q-bio/0606012

Cet article a été généré automatiquement par LLM. Il peut contenir des erreurs.