文章标题

Task 寻找识别汇管区的方法 Superpixel Classification Approach (已过时) Superpixel:包含多个像素的图像块 思想: 将像素分组为有意义的视觉基元(超像素),再对这些基元进行特征提取和分类,从而高效地完成像素级的分割任务** 实施过程 1.分割成块(大块的像素) 2.提取特征(颜色,纹理,坐标 etc) 3.使用已标注的数据集进行训练(按照1,2步对数据集进行处理,为每个超像素块设置标签,eg:当前块70%的部分为天空,则说明此块的标签便是天空) 新数据:训练完成后对应新数据同样进行1,2步骤,后放入训练好的分类器中(这里提到的是随机森林) 结果:每个超像素均被赋予了标签,那么各个区域便被赋予了标签  补充: 随机森林分类器: 一堆决策树,投票得出最终结果,并且随机森林会进行数据抽样(有放回,即Bootstrap Aggregating)和特征抽样从而建立训练样本。 概括随机森林的特点:决策树,数据抽样、特征抽样、投票机制 Simple Linear Iterative Clustering(简单线性迭代聚类)即 SLIC 算法:用于生成超像素,我们仅需传入k,k为一个图片被分割成的超像素总数 CIELAB color space 和 image clustering 是SLIC用的 Local Binary Pattern(局部二值模式)即LBP 算法: 核心思想: 局部比较:以一个像素为中心,将其与周围固定半径内的 P 个邻域像素进行比较。 二值化:如果邻域像素的灰度值大于或等于中心像素的灰度值,则标记为 1;否则标记为 0。 生成编码:按顺序(例如顺时针)将这些 0 和 1 排列成一个二进制数串。 转换为十进制:将这个二进制数转换为一个十进制数,这个值就是该中心像素的LBP编码值。 **举例说明:**假设有一个3x3的区域,中心点灰度值为50,周围8个点的灰度值为 [55, 40, 60, 45, 50, 65, 35, 70]。比较后得到的二进制序列为:1, 0, 1, 0, 1, 1, 0, 1。将这个二进制数 10101101 转换为十进制,就是173。这个173就是这个中心点的LBP纹理值。 ...

October 17, 2025 · 1 min · 113 words · Bob

大模型作业-本地部署deepseek-构建本地知识库

使用以下技术栈,部署本地LLM 应用框架:Dify(Docker版) 本地大模型:Ollama部署deepseek,嵌入模型:BGEM3 文档处理:Dify内置文本分割与向量化 Dify是什么? 相当于免编程的简单AI助手开发框架 Dify的缺点:大规模系统,性能要求过高(算法、延迟),资源受限(嵌入式、边缘计算),高度定制化 向量数据库:语义相似度检索 通过比对向量的"距离",也就是相似度进行检索。 每个数据数据(语句)中的词都对应一个已经生成的向量,然后再通过一系列复杂操作生成该句子的向量,在数据库中检索"距离"更近的向量 余弦相似度只关心方向,不关心长度。 测试问题 简单事实查询(测试基础检索) “什么是人工智能?” 多文档信息整合(测试跨文档能力) “RAG是什么意思?” 推理受限or出错(测试推理能力) 我把手机放在一本打开的书下面,然后合上了书。手机现在在哪里? 太阳什么时候时候从西边升起? 测试长文本细节丢失 问题1:“星穹项目的总负责人和预算是多少?” 模型可能回答: “总负责人是张三,预算为500万元。” 分析: 这两个信息都位于文档的开头部分。模型的注意力机制在开始时最为集中,因此很容易捕获并记住这些信息。此时没有细节丢失。 问题2(综合性问题,考验长距离信息整合):“请总结一下项目中需要与其他部门或外部供应商协作的关键点。” 模型理想答案应包含: 与风控部的李四合作解决金融模型偏差。(少了这个!!!!!!) 与王五的团队协作进行音频模块集成。 依赖外部供应商 “天眼”数据源的API服务。 模型可能回答(整合失败): “项目需要与王五的团队合作,并且依赖‘天眼’数据源。” 分析: 模型丢失了位于文档中部的“风控部李四” 这一关键协作方。因为它无法同时将文档开头、中部、末尾的稀疏信息点有效地关联和整合在一起。它只能抓取到最容易记住的(末尾的)和可能还记得的(开头附近的)信息,而中间部分的信息已经“蒸发”了。 测试全过程体现统计响应速度受限 本次部署所用的本地部署LLM流程总结和排错指南可以点击以下链接下载 本地部署LLM流程总结 排错指南

October 5, 2025 · 1 min · 40 words · Bob