LLM-Agent

本文介绍了针对LLM代理的安全分类方法和对抗攻击。提出了AgentDojo、ARE、CheatAgent等评估框架，并讨论了GIGA攻击方法及其应用，旨在提高大模型在各种任务中的可靠性和安全性。