LLM-Agent 安全-1

本文介绍了针对LLM代理的安全分类方法和对抗攻击。提出了AgentDojo、ARE、CheatAgent等评估框架,并讨论了GIGA攻击方法及其应用,旨在提高大模型在各种任务中的可靠性和安全性。

March 16, 2026 · 4 min · 822 words · Bob
微信二维码

扫一扫,加我微信