Posts

使用cloudflared tunnel 进行内网穿透

本文介绍了如何在macOS系统上安装Cloudflare的本地客户端（local client）并设置两种不同方式来实现快速随机通道和自有域名的配置。对于新手来说，第一种免费的方式可能更适合尝试，因为它只需要简单的终端操作。而第二种方法则需要更深入的理解cloudflare的设置，并且涉及一些命令行操作。

LLM驱动的评审员的偏见

本文提出了一种自动检测LLM评审员中偏见的方法，并提出了一个评测基准来不断迭代和更新基础偏见。整个方法分为两个部分：偏见发现和偏见核验。首先，在偏见发现阶段，通过使用Basic Biases Library和Teacher Model构建带有偏见的Target Dataset（如将教师模型随机选择的一个偏见注入到目标数据集中），然后评估目标模型的选择结果，并从错误选项中提取新的偏见。接着进行偏见核验部分：利用去重后的偏见生成Biased Test Dataset，通过测试集验证该偏见的有效性并加入Basic Biases Library。实验结果显示，在Math类数据集上产生的最大错误率为11%，与原错误率有较大差距。结论为：模型越强受偏见影响越小；“简单”任务更容易受到偏见影响；当错误率减少时，说明该任务超出了模型的能力范围。已尝试通过借鉴权威偏见得到0.66的准确率，并计划在不同数据集上测试以选择有利的数据集进行进一步研究。

LLM-MAS-BaseLine

今天做了实验以优化LLM-MAS答题速度。首先进行了少样例测速，通过简化数据结构和只传递prior_feedback而不是完整reviews来减少处理时间。然后，调整了答题方式，所有题目在一轮中完成，并根据当前问题的token数动态划分patch长度上限（12000 token）。

图像对抗攻击-实验

FGSM攻击方法包括无定向攻击和定向攻击。无定向攻击的目标是使模型预测错误，远离正确标签；定向攻击则目标是有意将结果预测为指定的标签。在两种攻击中，通过计算梯度来确定方向，并使用sign函数控制步幅大小以达到攻击效果。 C&W攻击方法则是最小化改动大小与让模型认错损失之和。

可视化moment发布

从命令行到 Web 界面，Moment 发布助手迎来可视化升级。基于 FastAPI + Tailwind CSS，支持 24 小时后台运行与 LLM 智能辅助发贴。

LLM Moment 辅助发贴

本文详细介绍基于本地大模型的 Moment 朋友圈辅助发帖助手的实现原理、提示词工程设计以及完整使用步骤，让你的朋友圈充满诗意与灵感。

post 自动摘要

本文详细介绍如何利用 Python 脚本、Git Hook 和本地 LLM 实现 Hugo 博客文章的自动摘要生成，彻底告别手动编写摘要的繁琐。

新增 Moments 板块

详细记录如何在 Hugo + PaperMod 主题中添加Moments板块，包括内容目录创建、自定义布局编写、首页按钮配置以及发布注意事项。

多智能体通信攻击-3

本文研究了在协作场景中，恶意代理如何利用辩论影响其他智能体的决策。提出了一种评估尺度来衡量恶意代理的有效性，并介绍了基于说服力和推理增强的方法来进行防御。实验结果表明这些方法可以有效减少攻击者的影响。

多智能体通信攻击-2

该文章研究了多智能体协作系统在存在恶意或故障的智能体时的弹性。作者提出了两种方法：AUTOTRANSFORM和AUTOINJECT，以增强系统的安全性并提高其对单节点故障的抵抗能力。通过实验，探究了不同结构（线性、平面和分层）和下游任务对多智能体协作系统弹性和抗干扰的影响。