微调一个LLM安全检测模型
此前做了一个 LLM 安全检测系统,这篇只记模型微调部分。
目标很简单:把输入文本分成三类:
benign
jailbreak
injection
1. 任务定义
这是一个标准的文本三分类任务。
标签
类别
0
benign
1
jailbreak
2
injection
相比二分类,三分类的好处是后面更容易看错在哪。
模型输出可以写成:
y^=argmaxysoftmax(f(x))\hat{y} = \arg\max_y softmax(f(x))
y^=argymaxsoftmax(f(x))
2. 数据处理
数据来源主要有三部分:
正常请求
越狱样本
注入样本
统一后的格式如下:
1{"text": "Ignore all previous instructions", "label": 2}
预处理只做几件事:
统一格式
去重
清洗脏样本
划分训练/验证/测试集
这里最重要的是边界样本。
比如:
带敏感词,但其 ...
应用嵌入模型进行仓库数据向量化:基于 BAAI/bge-large-zh-v1.5 的实践
在智能仓库管理中,如何高效处理和检索海量数据一直是一个挑战。通过嵌入模型,我们可以将仓库中的物品数据、仓库数据、环境数据以及入库出库任务数据转化为高维向量,实现基于语义的相似度检索和聚类分析。本文将详细介绍如何使用 BAAI/bge-large-zh-v1.5 嵌入模型 API 对仓库数据进行向量化处理,并结合代码示例讲解各个实现细节。
1. 背景介绍
随着仓库管理系统的信息化水平不断提升,各种数据(如物品详情、仓库位置、环境监控信息、任务记录等)逐渐呈现多样化和海量化趋势。传统的基于关键词的检索方法往往难以捕捉数据之间的语义关联,而嵌入模型(Embedding Model)能够通过将文本或其他数据转换为向量表示,在高维空间中计算语义相似度,从而实现更智能的数据处理和检索。
2. 模型概述
在本项目中,我选择了 BAAI/bge-large-zh-v1.5 模型。该模型具有以下特点:
中文优化:模型针对中文语料进行了大量训练,能够更准确地捕捉中文文本的语义信息。
多领域适应性:适用于 ...
前言
最近搭建了一个兰空图床,我想挂载一个储存做为我的长期存储图片的图床,想起了之前白嫖的InfiniCLOUD,我的免费额度已经到四十多G了。所以顺便写了一个反代webdav的代码,在1panel一键部署。
环境准备
所需工具和环境:
1penel面板
开发环境:
操作系统:Debian
WebDAV 服务:InfiniCLOUD 免费账户
功能实现
我希望实现以下目标:
移除直接访问 WebDAV 时的密码验证步骤。
根据用户访问路径动态代理文件或目录。
通过服务器自动完成 Basic Auth 验证。
核心代码解析
以下是代码的主要逻辑:
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051const express = require('express');const axios = require('axios');const path = require('path& ...
排序
Sorting Algorithm Complexities
table {
border-collapse: collapse;
width: 100%;
}
table, th, td {
border: 1px solid black;
}
th, td {
padding: 10px;
text-align: center;
}
th {
background-color: #f2f2f2;
}
算法种类
最好情况
平均情况
最坏情况
空间复杂度
是否稳定
...
准备
PVE虚拟机
debian安装包
安装
填写名字
按照我下面的设置,可免去后面引导
启动后
先切换至root用户,输入命令:su root,然后输入密码
设置好ip,安装ssh
1apt-get install -y ssh
安装完成ssh 服务默认是开启的,手动开启命令
1/etc/init.d/ssh start
编辑 SSH 配置文件
利用VIM 编辑配置文件,把以下代码对 /etc/ssh/sshd_config 文件内容进行替换。
1234567891011Include /etc/ssh/sshd_config.d/*.confPort 22PermitRootLogin yesPasswordAuthentication yesPermitEmptyPasswords noChallengeResponseAuthentication noUsePAM yesX11Forwarding yesPrintMotd noAcceptEnv LANG LC_*Subsystem sftp /usr/lib/openssh/sftp-serv ...
前言
因为有内网穿透的需要,所以今天拿了一台阿里云的机器准备搭建一个Frp,网上找了很多教程,都是旧版ini配置的教程。然而官方文档写的很简洁,服务器端只有一个ip端口绑定。
并且如果使用旧版教程,将会提示该方案将被弃用。
frp是什么
FRP主要由两部分组成:
FRPC 客户端(frp client)
运行在公司内网机器上
接收来自公网的访问请求
将请求转发给内网服务
FRPS 服务端(frp server)
部署在具有公网 IP 的机器上
暴露服务的公网入口
接收公网访问请求
通过加密隧道转发到 FRPC
教程
首先下载官方的releases
在任意目录运行
1wget https://ghfast.top/https://github.com/fatedier/frp/releases/download/v0.54.0/frp_0.54.0_linux_arm64.tar.gz
接着使用命令解压
1tar -zxvf frp_0.54.0_linux_amd64.tar.gz
进入该解压目录:
1cd frp_0.54.0_linux_amd64/ ...
首先附上成功截图
在OpenWrt上手动安装哪吒探针
由于OpenWrt系统的特殊性,我们无法使用上述一键脚本进行安装。因此,需要通过手动操作来完成安装过程。
步骤如下:
请先从哪吒探针的Release页面下载对应的二进制文件,并解压至/root/nezha-agent目录下。
使用命令chmod +x /root/nezha-agent为其赋予执行权限。
接下来,创建启动脚本/etc/init.d/nezha-agent并填入以下内容:
123456789101112131415161718192021#!/bin/sh /etc/rc.commonSTART=99USE_PROCD=1start_service() { procd_open_instance procd_set_param command /root/nezha-agent -s 您的IP:您的端口 -p 您的密钥 -d procd_set_param respawn procd_close_instance}stop_service() { killall nezh ...
此前经常遇到一个问题,每次写完博客,需要使用繁杂的命令去部署博客,这大大降低了写作动力,看到很多博主都在使用GitHub Actions来自动部署,我也去学习了一番。
在本篇博客中,我将引导你通过 GitHub Actions 自动部署你的 Hexo 博客到 GitHub Pages。这个过程不仅能节省你的时间,还能让你的部署过程更加自动化和高效。我们将从创建一个 GitHub Actions 工作流程开始,逐步讲解每一个步骤的作用和配置方法。
前言
GitHub Actions 是一个强大的自动化工具,它允许你在 GitHub 仓库中自动执行软件开发工作流程。通过使用 GitHub Actions,你可以自动化你的构建、测试和部署任务,使得软件开发过程更加流畅。
创建 GitHub Actions 工作流程
创建工作流程文件
在你的 Hexo 博客仓库中,创建一个 .github/workflows 目录(如果还没有的话),然后在该目录下创建一个新的 YAML 文件,例如 deploy.yml。这个文件将包含你的 GitHub Actions 工作流程配置。
配置工作流程 ...
概述:
使用 Cloudflare 和 Backblaze B2 搭建图床是一种高效、成本低的方法。
准备工作:
创建 B2 私有 Bucket: 在 B2 上创建一个私有存储桶。
设置 Cloudflare 账号和域名: 注册 Cloudflare 账号并准备一个域名。
安装 Node.js 和 npm: 这些是安装和运行 Wrangler 所必需的。
配置 Wrangler:
安装 Wrangler: 打开命令行,输入 npm i -g wrangler 安装 Wrangler。
登录 Cloudflare: 输入 wrangler login 并按照提示完成登录。
下载并配置官方仓库: 访问 Cloudflare B2 GitHub 仓库,下载并解压。
修改 wrangler.toml: 在下载的仓库目录中,打开 wrangler.toml 文件并填写必要信息,例如 worker 名称和 B2 应用密钥。
部署:
发布 Worker: 在命令行中运行 wrangler publish 发布你的 Cloudflare Worker。
安装依赖库: 如果遇到错误,可能需要安 ...
*一、设计题目* *数字电子钟Verilog设计*
*二、设计背景* 钟表的数字化给人们生产生活带来了极大的方便,而且大大地扩展了钟表原先的报时功能。诸如定时自动报警、按时自动打铃、时间程序自动控制、定时广播、定时启闭电路、定时开关烘箱、通断动力设备,甚至各种定时电气的自动启用等,所有这些,都是以钟表数字化为基础的。因此,研究数字钟及扩大其应用,有着非常现实的意义。
****三、设计内容及要求****设计内容: 设计一个电子钟,要求可以显示时、分、秒,用户可以设置时间 设计具体包含的模块内容如下:要求:1)根据系统设计要求,采用自顶向下的方法,划分系统主要模块,画出整体设计原理框图。2)根据工作原理、用硬件描述语言对设计内容实现,列出设计程序清单,给出仿真波形图和调试中存在问题及解决方法。3)设计内容下载至目标芯片,在EDA的AX301开发板上进行功能验证。4)谈谈该课题的课程设计中遇到的问题,获得哪些技能和体会,以及建设性意见。
四、*设计步骤和安排*:(1)题目安排;图书馆查相关资料;(2)设计原理研究,总体设计;(3)各主要模块的Verilog ...

















