AI Tech Daily 2026年05月13日

1. 执行摘要

2026年5月13日，AI行业在加速科学发现的模拟技术进展以及人机交互界面进化方面引起了广泛关注。Microsoft研究团队重新定义了AI在材料科学中的作用，Google DeepMind则从AI视角重新构建了半个世纪未变的UI。此外，企业领域，NVIDIA和SAP合作，为确保自主AI代理的安全性和治理（governance）建立了框架，AI的部署进入新阶段。

2. 今日亮点

Microsoft的材料科学平台“MatterSim”在实验中验证了预测

Microsoft Research公布了其AI材料探索平台“MatterSim”的最新更新。此次的亮点在于，MatterSim成功合成了其预测出的新材料——“四方晶系钽磷（TaP）”。这意味着基于计算科学的预测在现实实验室中以物理形态得以实现，极大地缩短了材料开发周期。与传统的从第一性原理计算方法相比，MatterSim的推理速度提高了数倍，此次更新更是将模拟速度提升了3-5倍。这使得建模复杂的多特性现象成为可能，预计将在从能源储存到纳电子学等广泛领域得到应用。这项技术的意义在于，在以往耗费大量时间和成本的新材料开发过程中，AI已成为“发现的伙伴”，发挥着决定性作用。对行业的影响是，下一代导热材料和高能效设备的开发速度将加快，可能在硬件竞争中建立压倒性优势。来源: Microsoft Research官方博客“Advancing AI for materials with MatterSim”

Google DeepMind重新定义适用于AI时代的“指针”

Google DeepMind公布了一项研究，旨在通过重新设计传统的鼠标光标（指针），使AI与人类的交互更加无缝。尽管光标在PC历史上半个多世纪以来一直扮演着相同角色，但DeepMind的研究人员正在探索一种新的指针形式，AI能够理解用户的操作流程，并不仅仅是“指向什么”，还能理解“为何指向”。例如，AI能够理解屏幕上的图像内容，用户只需输入“指示路线”，即可与地图工具联动，实现直观的操作。这是消除“AI存在于另一个窗口”的割裂感，并将AI直接集成到用户使用的任何应用程序中的重要一步。界面技术的进步无疑将加速AI的普及，未来，“如何直观地与AI进行协作”而非仅仅“与AI对话”将决定产品设计的成败。这项研究有望成为未来生成式UI的基础技术，并推广到其他平台。来源: Google DeepMind“Reimagining the mouse pointer for the AI era”

3. 其他新闻

NVIDIA与SAP加强企业级AI代理的治理 NVIDIA与SAP宣布合作，旨在帮助企业安全可靠地部署自主AI代理。SAP将把NVIDIA的开源运行时“OpenShell”集成到其商业AI平台中。这将使得在企业环境中执行AI代理时能够强制执行安全策略，从而在有治理保障的情况下实现高级自动化。来源: NVIDIA官方博客
Microsoft发布衡量AI代理“社交行为”的基准 Microsoft公布了“SocialReasoning-Bench”，这是一个用于评估AI代理社会推理能力的基准。该基准通过日历协调和市场谈判等需要与其他实体协作的任务，衡量代理“在多大程度上能代表用户利益”。研究表明，许多前沿模型虽然能完成任务本身，但在谈判中倾向于无法最大化用户利益。来源: Microsoft Research官方博客
Meta扩展AI年龄限制执行范围 Meta正在Facebook和Instagram上扩展其AI技术，以检测帖子和评论等内容中的年龄限制违规行为。与识别用户身份的面部识别不同，该技术利用骨骼、身高等通用视觉和上下文线索来估算年龄，旨在加强平台安全性。来源: Meta官方新闻发布室
OpenAI向所有用户推出“GPT-5.5 Instant” OpenAI已将ChatGPT的默认模型更新为“GPT-5.5 Instant”。与上一代5.3相比，该模型幻觉（错误信息）减少了高达52.5%，并在STEM领域的推理能力方面有了显著提升。该模型将逐步向所有ChatGPT用户开放。来源: OpenAI博客
Anthropic发布AI代理的“做梦”功能 Anthropic发布了一项名为“做梦”（Dreaming）的功能，允许AI代理在任务间隙回顾过去的会话，并生成改进建议。在Harvey等合作伙伴的试点测试中，任务完成率提高了约6倍。来源: Anthropic官方博客

4. 总结与展望

纵观今日新闻，AI技术正迅速从单纯的生成功能转向“推理”、“实验”和“代理自主工作流执行”。特别是像Microsoft的MatterSim一样，AI能够产生伴随物理世界结果的成果，这对工业界而言是重大的范式转变。另一方面，正如NVIDIA和SAP的合作所示，企业如何安全地运行这些高级代理的治理体系已成为紧迫的挑战。未来几个月，竞争将不仅体现在新模型的性能提升上，更将在“如何安全且可控地将自主代理社会化部署”的基础设施层面上更加激烈。

5. 参考文献

Title	Source	Date	URL
Advancing AI for materials with MatterSim	Microsoft Research	2026-05-12	https://blogs.microsoft.com/blog/2026/05/12/advancing-ai-for-materials-with-mattersim-experimental-synthesis-faster-simulation-and-multi-task-models/
Reimagining the mouse pointer for the AI era	Google DeepMind	2026-05-12	https://deepmind.google/discover/blog/reimagining-the-mouse-pointer-for-the-ai-era/
NVIDIA and SAP Bring Trust to Specialized Agents	NVIDIA Blog	2026-05-12	https://blogs.nvidia.com/blog/2026/05/12/nvidia-sap-bring-trust-to-specialized-agents/
Introducing Muse Spark	Meta	2026-04-08	https://about.fb.com/news/2026/04/introducing-muse-spark-scaling-towards-personal-superintelligence/
SocialReasoning-Bench	Microsoft Research	2026-05-11	https://blogs.microsoft.com/blog/2026/05/11/socialreasoning-bench-measuring-whether-ai-agents-act-in-users-best-interests/
OpenAI Blog Updates	OpenAI	2026-05-05	https://openai.com/index/
Anthropic News	Anthropic	2026-05-06	https://www.anthropic.com/news/

本文由 LLM 自动生成，内容可能存在错误。