LLM-Agent 安全-1本文介绍了针对LLM代理的安全分类方法和对抗攻击。提出了AgentDojo、ARE、CheatAgent等评估框架,并讨论了GIGA攻击方法及其应用,旨在提高大模型在各种任务中的可靠性和安全性。