#benchmarks
2 articles
ChatGPT Resumen de artículos del mes - Inteligencia de agentes auditable
En abril, el enfoque en agentes pasó de "rendimiento" a "operación, verificación y auditoría". Revisión externa de casos de seguridad, monitoreo no supervisado de desviaciones desconocidas y verifi...
ChatGPT Resumen mensual de artículos - Expandiendo simultáneamente seguridad, aplicaciones del mundo real y verificabilidad
Marzo: investigación enfocada en seguridad verificable, desde casos de seguridad hasta robustez de agentes, percepción activa de robots, y consistencia física en clima y descubrimiento de fármacos.