郑海山的blog

手机最重要的4个密码

2024-09-18T00:12:33+00:00

以下是手机最重要的4个密码：

① 开机、解锁和关机密码
② SIM卡密码（PIN码）
③ SIM卡PUK码，这个我不认为是密码
④ SIM卡服务密码

接下来我会介绍这几个密码是什么，为什么重要，有哪些被攻击的点和如何预防。

① 为什么手机一定要有开机密码（指纹、人脸等）

手机已经是个人数据中心了。如果按十几年前比喻，你拿着手机就类似你背着台式机、MP3、PDA、数码相机、银行卡、钥匙串、现金、老婆的照片在身上。

所以一定要像电脑一样，设置BIOS密码、开机密码和全盘加密密码。当然，很多手机本来就是全盘加密的，如果你自己再插入存储卡，建议也启用全盘加密。

不建议将已经开机的手机交给陌生人操作，即使眼睛盯着也不行。有一种可能是对方可以往手机Type-C口插入一个无线设备，就有可能在你手机上安装一些应用。如果必须要将手机借给陌生人打电话，可以进入“维修模式”。

开机密码有数字、图案、蓝牙、指纹和人脸等，其中蓝牙、指纹和人脸无法抵抗物理逼迫，可以结合着使用。

关机密码跟开机密码是一样的，只不过你要设置关机时验证。加个验证，不会增加多少麻烦，因为只有锁屏时关机他才会验证密码。他可以防止你手机丢失后有人要恶意关机。或者在你手机做什么操作引起界面异常后通过重启来重置状态以掩盖痕迹。

当然关机密码无法阻止手机被丢进一个法拉第笼包包里。

② SIM卡密码

SIM卡里面有IMSI（国际移动用户识别号，International Mobile Subscriber Identification Number）、ICCID（集成电路卡识别码，Integrate circuit card identity）、Ki、Kc等密码计算需要用到的数据，他唯一没有的就是电话号码。SIM卡被插入手机后，会把IMSI、IMEI（国际移动设备识别码，International Mobile Equipment Identity）、Kc等给远程做类似非对称加密的验证，一旦验证成功后，运营商根据IMSI号在数据库里查找绑定的手机号码，你就算入网了。

SIM密码是为了保护IMSI、Kc等等数据的。

SIM卡密码可以防止在你手机离开你一段时间内有人可以通过拔插SIM卡来放到别的手机上，通过收手机验证码登录某些保护性较低的App；或者用来攻击短信为双因素认证、取回密码的账号；或者用来打电话给你的朋友进行诈骗活动；或者查询你的通话记录或进行各类设置的（比如几年前可以将短信都转发到某个邮箱）；或者发微博类似的（几年前）。

我们手机里面有几类App，一种是类似微信、淘宝的，你经常要打开，开过一次后，就不需要密码了，一种是银行类App，你偶尔打开，所以打开还要验证。一种是中等程度打开的。

一般安全性要求高的App，也会验证原先写到手机里的私钥。比如很多银行的App，或者微信、支付宝，换了手机，初次登录无法单纯使用短信验证码登录，会起双因素挑战。

SIM卡密码=PIN码

SIM卡密码一般只有4位。他是PIN码，叫PIN码的，一般不会在互联网传输。

SIM卡就是非常典型的无密码设计方案。

无密码方案

密码有2个特性，密码输入的次数越多越不安全；密码输入的次数太少也不安全。因为你会忘记这个密码。所以没有密码是最好的。

无密码也不是说没有密码，只不过密码变成一串随机、无比长的字符串，不需要你输入，但是需要你通过某种简便的方式来授权输出，比如PIN码，比如受信任的客户端等等。

一般我们要登录一个网站，输入一个密码后，网站就登录成功了。无密码方案类似，也是输入一个密码后，网站就登录成功了。

虽然看起来一样，但是底层实现机制是不同的。都是输入密码，但是前面一个输入的密码要在互联网上传输到服务端去验证，而无密码方案的，输入的密码只是激活本地的密钥管理器，密钥管理器不会发送自己的密钥到服务器，只会要服务器给一个挑战字符串，密钥管理器加密后传输到服务器，服务器解密看能否恢复原先给的挑战字符串，所以没有密钥在互联网上传输。

更技术一点说明，这是一个经典的非对称密码的应用，只不过App帮我们处理好密钥的分发、存储和使用。

③ PUK码

PUK码是在你SIM卡密码输入错误达到一定次数后用来解锁SIM卡的。

这是因为SIM卡自身带有防止暴力破解PIN码。当然，SIM卡也会防止暴力破解PUK码，一旦PUK码输入超过多少次，他就会自毁。这个不是爆炸自毁，只不过把自己清空而已。

这时候你就必须去营业厅换卡。

这些保护都很弱

虽然你看到好多密码在保护SIM卡，但是有些保护不会非常强。

比如PUK码，你可以从以下几个渠道获得你的PUK码。

买SIM卡时大卡会印刷PUK码，可能会遮盖
某运营商，打电话后会客服会直接报给你本机的PUK码
非本机，用绑定了同一个身份证号码的手机打电话，也可以给你PUK码
输入目标手机的服务密码后，可以给你PUK码
带身份证去营业厅，可以给你PUK码

而且这个PUK码通常不可变更，除非换SIM卡。

SIM卡还有被复制的风险，随着技术的进步，SIM现在已经很难被复制了，或者只是说，我所知道的。即使可以，那应该是非常高级的攻击，你不会遇到，如果你是非常高级的人，你会有其他措施来保证这个。

越高级的制式、越新的SIM卡，抗攻击的能力越强，所以有5G就不要用4G，千万不要用2G，定期去营业厅换个SIM卡，来重置PUK码和升级SIM卡自身。

为什么不推荐用2G，在2G时代，SIM卡是单向校验的，也就是运营商有能力来检验你的SIM卡对应到某个手机号码，但是你没有能力检验这个运营商是不是合法的运营商。所以在2G时代，我们会遇到“伪基站”的攻击。进入3G、4G、5G后，都是双向校验（类似mTLS），SIM卡先确认这个是真的运营商后，才进行入网检验。当然，有时候你还会遇到降级攻击，也就是，通过屏蔽信号，让你进入2G。所以2G网络是必须关闭的，运营商已经慢慢开始关闭2G网络。

几年前还有人拿着假身份证在异地把SIM卡办出来（SIM swap attacks）。现在三大运营商越来越规范了，但是一些小的，虚拟的运营商，可能防护就不会这么好。

④ SIM卡服务密码

SIM卡服务密码，一般是用来你办理各类业务需要使用到的密码。这些渠道可以是电话、自助机或者Web网站，需要验证你的服务密码。

SIM卡服务密码和短信验证码可以构成一个双因素认证。但是，我所知道的某个运营商，可以通过手机编辑短信，输入身份证即可重置服务密码，这是不安全的。

SIM卡服务密码也有防止暴力破解的机制，某运营商，一天输入几次后会被锁定，零点才重置错误次数。

如果你决定设置SIM卡密码后，注意应急预案

如果你看到这里，迫不及待地去设置SIM卡密码，有几个前提你一定要知道。否则你就像我某次一样很尴尬，才催生了这篇文章出来。

以下是应当注意的点：

在设置SIM卡密码之前必须获得SIM卡PUK码和服务密码并记录下来
必须验证服务密码的有效性
必须验证PUK码的有效性，验证很容易，故意输错多次SIM卡密码，看能否通过PUK码解锁
开机密码6-8位。SIM卡密码4位，PUK码8位。在你开机的时候，一定要辨认好界面，让你输入的是哪个密码，通常需要辨认的是开机密码和SIM卡密码
设置后多次重启，演练一下输入的过程
有些手机会将SIM卡密码记录在手机里，帮你输入
尽量在工作日，不是出差，带着身份证，离营业厅近的位置设置和变更这些密码

如何正确对身份证号码进行脱敏公示

2024-08-11T00:34:33+00:00

前段时间《国家网络身份认证公共服务管理办法（征求意见稿）》公开征求意见，我下载安装了尝试了一下，可以申请一个网号。目前我找不到更多公开的技术资料，无法获得准确的技术信息，但是我猜测对接协议可能是OAuth2的一些变种。目前App功能还比较少，我期待能加入更多的功能。我原先写了两千字的内容，从技术角度对问题和未来进行展望，但是很多都是猜测。所以这里我们还是聚焦，如何正确对身份证号码进行脱敏公示。

身份证号码自带信息和不可变更带来的问题

搞信息化的人都知道，我们都编过学工号。

搞技术的，希望编码只是简单的一串流水，最好还能加校验码，也不要有Il10oOq9g等字符，所有的其他信息，必须再通过一次请求获得。

而搞业务的，他希望在学工号上，可以展示入学年份、类别、院系、班级，还要求顺序。他不想要再次请求。

只要看看学校的学工号编写规则，就可以知道到底是技术部门还是业务部门在主导这个事情。

当然，没有说谁对谁错，每个人的出发点不同，各有优缺点。随着技术的发展，不再依赖纸质，转专业、大类招生、停学等情况的出现，未来可能会偏向流水的方案，但是又由于存在旧的规则，很多地方没有改。

第二种编码规则，其实就是承载了太多的信息在某个编码上。

身份证号码也一样。

身份证号码到底有什么信息在啊！

我们以妈祖的身份证号码为例，妈祖林默为北宋时期福建海边的一位女子，公元960年农历3月廿三出生于我们福建莆田湄洲岛，身份证号码是：350321096003237001。

flowchart LR; 35\n省 -.- 03\n市 -.- 21\n区县 -.- 0960\n出生年 -.- 03\n出生月 -.- 23\n出生日 -.- 70\n一般为户籍派出所代码 -.- 0\n性别 -.- 1\n校验码

flowchart LR;
    35\n省 -.- 03\n市 -.- 21\n区县 -.- 0960\n出生年 -.- 03\n出生月 -.- 23\n出生日 -.- 70\n一般为户籍派出所代码 -.- 0\n性别 -.- 1\n校验码

可以看到，满满都是信息。而且它不像密码，泄露后还可以更改。

每个地方都要用到身份证号码，我把我的身份证号码在微信聊天记录里面搜索了一下，有几十条，也就是，我主动将我的身份证号码提供给了几十个人。

国家网络身份认证推出的一个最重要要解决的问题就是超范围采集、留存身份证号码信息。比如一个App要识别青少年，只应当从一个微服务获得是/否青少年的结果，而不应当直接保存用户的身份证信息。一个App要防止一个人注册多个账户水军，只要有个权威机构能颁发一个唯一标识符即可。

当然有些App他就是要保存你的身份证号码，比如航旅纵横，除非未来买机票，不需要使用身份证号码即可购买。

身份证号码里强大的校验码

根据GB 11643-1999 公民身份号码里对校验码的说明，校验码采用ISO 7064:1983,MOD 11-2校验算法，当然ISO 7064:1983这个已经被废弃了，但是他可以抗什么？

单一数字不小心写错，比如4234写成1234，可以找出来
几乎所有的两个单个字符顺序混乱，比如12345不小心写成12354或者12543
几乎所有的整段前后顺序错误，比如350321写成032135
很大概率可以检测到2个数字不小心写错的
很大概率其他错误

又由于身份证号码只是数字组成，检测和复原的概率会变得更大。

公示和个人信息保护的矛盾

东北大学王宇总结了各类公示

信息公示：录取、招聘、转学、退学、推荐免试、转专业、提前毕业、催促返校、新生未报到、授予学位、贫困生认定、处分、补助发放、职称评定、项目申报、二胎生育、提前退休、协议遗失、劳动能力鉴定等各类业务相关的人员信息公示。

信息发布：考试面试测试安排、导师信息发布、新生分班情况、毕业设计展示、比赛赛程和人员安排等网站信息发布。

证书信息展示：各类评奖证书、职称资格证书、技能证书等线上展示。

数据传输/信息填报：应用程序导出或共享的人员信息数据集合，信息填报和上传的人员信息集合。

很多不正确公示的方法

比如只是使用PDF简单遮盖信息，但是如果你用PDF编辑器打开，移除遮盖即可
比如Word隐藏的文字，审阅模式暴露的信息
比如Excel内还有其他Sheet数据，或者使用Excel内置函数来脱敏显示
比如前段时间有个招聘，公示了对前3名不予录取并且递补第4名的理由，有个是没通过体检或者没通过心理素质测试，实际上也暴露了隐私
比如对身份证号码前6位进行打码，但是公示信息包含籍贯
比如对身份证号码出生年进行打码，但是可以从入学年份推算出可能的出生年的。我遇到过，某个中学提前招生，几百人的公示信息带了身份证号码，当然是打码过的。但是，初中，基本上省市数字都知道，出生年也是知道的，所以实际上那个公示，等于泄露了很多明文身份证号码。
性别可以从姓名或者公示的其他信息获得

身份证号码脱敏中规则不一致导致的问题

虽然有一些类似GB/T 37964——2019信息安全技术个人信息去标识化指南，但是我没找到对身份证号码进行脱敏的标准和规范，有些行业比如金融等会有行业标准。没有统一的标准会造成的一个问题是，多个主体脱敏规则不一样，实际上可以合并。

比如，在幼儿园，你评了个奖，在小学，你又评优，在中学，还是你。在这整个过程中，为了公平公正，都对你的姓名和身份证号码进行了公示。优的人，很大概率会一直优，导致他的信息被各种公示。

幼儿园、小学、中学的老师都非常认真负责，至少隐藏6个字符，但是幼儿园隐藏前面6个，小学隐藏中间6个，中学隐藏最后6个。

互联网的信息很难删除掉，然后恶意用户搜索一拿到，合并后，还是可以得到整个身份证号码字符串。

对身份证号码唯一正确的脱敏方法

根据上面分析的结论，我认为，对身份证号码公示进行脱敏的唯一正确的方法就是：那就是不显示，不显示身份证号码的任何一个数字。

你所看到的啥PHP函数、Code Snippets、npm类库脱敏身份证号码的，立刻删除掉，根本就不要讨论这个方案，身份证号码就不应该在任何网上公示。

中小学课程表模板最终版下载和Excel源码

2024-07-24T12:34:33+00:00

去年我发过中小学课程表模板下载，下载量还可以，后台也有人在问一些问题，看来还是不少人需要的，所以今天做了更新，跟我的公文模板一样，应该是最终版了。

为了追求自动化、幂等和精确性，我这个Excel模板是用程序生成的，文后一并把Excel的VBA源代码送给大家。

我是两个孩子的爸，我承包了两个宝所有的课程表更新。

模板下载位置 https://dog.xmu.edu.cn/images/2024/syllabus/中小学课程表模板-公众号-郑海山dump.xlsx

使用流程

打开Excel，有2个Sheet，一个是课程表详细版，一个是课程表简版
查看红色区域编辑并且仔细复查
- 只需更新下面元数据和右边时间，再更新具体课程内容。
- 根据右边时间“分钟/行高”数字更新行高。建议小于15分钟就15，超过45分钟就45。
- 只需更新详细版，简版会相应更新
- 为了解决有些6节有些7节，还有些“眼操”在不同节间，所以所有大节前后都预留了空行，如果不需要某行，在L列写入“隐藏”文字并且筛选一下即可，不要删除，不要删除。
生成PDF，注意所有Sheet都生成
打开PDF，放大到最大，截图分享在班级群里

小说明

PDF方便家长直接打印
截图方便家长保存到手机
简版包括1 全简版，方便放在文具盒或者贴在课本上
和2 淡化或高亮某些课程的简版，方便整理第二天的书包，因为语数课本每天都要带的，而美术可能要带美术袋。

一些实现细节

引入版本机制，方便家长对照
学校、季节、学期等等元数据进行了剥离，免得不小心改错了，公式是类似 =CONCATENATE(J4, J5, “课程表”)
课程开始时间和结束时间也剥离了，自动统计课程时间
设定行高跟课时时间一致。比如45分钟，行高就是45，15分钟行高就是15
打印区域，设置了打印区域，辅助的数据不打印
SSOT，课程表简版数据来源于详细版，只需要维护详细版即可，简版会自动更新
做了底色区分，不使用彩色
淡化语数的简版使用了条件格式，如果文本包括“语文”、“数学”则颜色变淡，淡化哪些课程目前可自定义。

Excel截图

Excel详细版

Excel简版

课程表真实截图

详细版

简版

源代码

大部分人不用关注下面这个。

Option Explicit

Private COLOR_GRAY1 As Long, COLOR_GRAY2 As Long, COLOR_GRAY3 As Long, COLOR_GRAY4 As Long
Private i As Integer, j As Integer, h As Integer

Sub Main()
    Call InitGlobalVars

    Call EnsureTwoSheets

    Sheets(1).Select
    Call UISetTitle
    Call SetMainTimeTable
    Call SetClassDurationTable
    Call SetHideSplitColumn
    Call SetHintMsg
    Call SetMetadata
    Range("D24").Select
   
    Sheets(2).Select
    Call SetSheet2BriefTimeTable
    Range("A1").Select
    
    Sheets(1).Select
End Sub

Sub DataValueMainTimeTable()
    i = 3

    i = i + 1: SetTimeTableClassNameDetail i, "节次   星期一 星期二   星期三  星期四  星期五"
    i = i + 2: SetTimeTableClassNameDetail i, "1      语文    数学    数学    生物    生物"
    i = i + 2: SetTimeTableClassNameDetail i, "2      语文    数学    语文    语文    语文"
    i = i + 2: SetTimeTableClassNameDetail i, "3      数学    音乐    音乐    科学    语文"
    i = i + 2: SetTimeTableClassNameDetail i, "4      音乐    语文    体育    劳动    语文"
    i = i + 2: SetTimeTableClassNameDetail i, "5      美术    体育    英语    美术    设计"
    i = i + 2: SetTimeTableClassNameDetail i, "6      体育    写字    计算机  体育    美术"
    i = i + 2: SetTimeTableClassNameDetail i, "7      掼蛋    跳绳    游泳    写字    舞蹈"
    
    Range("C5").Value = "大课间体育活动"
    Range("C7").Value = "眼操": Range("L7").Value = "隐藏"
    Range("C9").Value = "眼操"
    Range("C11").Value = "眼操": Range("L11").Value = "隐藏"
    Range("C13").Value = "午餐、午间延时服务"
    Range("C15").Value = "眼操": Range("L15").Value = "隐藏"
    Range("C17").Value = "眼操": Range("L17").Value = "隐藏"
    Range("C19").Value = "作业、校本、社团等"
End Sub

Sub DataValueClassDurationTable()
    i = 4

    i = i + 1: SetClassDurationDetail i, "08:20 08:50"
    i = i + 1: SetClassDurationDetail i, "08:50 09:30"
    i = i + 1: SetClassDurationDetail i, "09:30 09:40"
    i = i + 1: SetClassDurationDetail i, "09:40 10:20"
    i = i + 1: SetClassDurationDetail i, "10:20 10:25"
    i = i + 1: SetClassDurationDetail i, "10:30 11:10"
    i = i + 1: SetClassDurationDetail i, "11:10 11:20"
    i = i + 1: SetClassDurationDetail i, "11:20 12:00"

    i = i + 1: SetClassDurationDetail i, "12:00 14:00"
    i = i + 1: SetClassDurationDetail i, "14:30 15:10"
    i = i + 1: SetClassDurationDetail i, "15:10 15:20"
    i = i + 1: SetClassDurationDetail i, "15:30 16:10"
    i = i + 1: SetClassDurationDetail i, "16:10 16:20"
    i = i + 1: SetClassDurationDetail i, "16:20 17:05"
    i = i + 1: SetClassDurationDetail i, "17:05 17:50"
End Sub

Sub DataValueHint()
    Range("C20").Value = "周一升旗仪式开始时间7:30。" & vbCrLf & "当天无体育课的班级，应在下午活动时间组织学生进行30分钟体育锻炼。" & vbCrLf & "全面落实大课间体育活动制度，每天上午统一安排30分钟大课间体育活动。"
    Rows(20).RowHeight = 46
End Sub

Sub DataValueMetadata()
    Range("D24").Value = """郑海山dump""中学"
    Range("D25").Value = "冬令时"
    Range("D26").Value = "2023"
    Range("D27").Value = "2024"
    Range("D28").Value = "一"
    Range("D29").Value = "到5.31"
    Range("D30").Value = "初一(1)班"
    Range("D31").Value = "v" & Format(Date, "YYYYMMDD")
End Sub

Sub DataValueSheet2BriefTimeTableIgnoreHighlight()
    Range("O10").Value = "忽略课程"
    Range("O11").Value = "语文"
    Range("O12").Value = "数学"
    Range("O13").Value = "英语"
    Range("O14").Value = "写字"
    
    Range("P10").Value = "高亮课程"
    Range("P11").Value = "体育"
    Range("P12").Value = "美术"
End Sub

' Ignore all down
Function TrimAndSplit(strLine As String)
    Do While (InStr(strLine, "  "))
        strLine = Replace(strLine, "  ", " ")
    Loop
    TrimAndSplit = Split(strLine, " ")
End Function

Sub SetTimeTableClassNameDetail(i As Integer, strLine As String)
    Dim arrResult() As String
    arrResult = TrimAndSplit(strLine)

    For j = 0 To 6 - 1
        Range(Choose(j + 1, "A", "C", "D", "E", "F", "G") & i).Value = arrResult(j)
    Next j
End Sub

Sub SetClassDurationDetail(i As Integer, str As String)
    Dim arr() As String
    arr = TrimAndSplit(str)
    Range("I" & i).Value = arr(0)
    Range("J" & i).Value = arr(1)
End Sub

Sub EnsureTwoSheets()
    Sheets(1).Name = "课程表"
    Sheets(1).PageSetup.Orientation = xlLandscape
    Sheets(1).PageSetup.PrintArea = "$A$2:$G$20"

    If Worksheets.Count < 2 Then
        Sheets.Add After:=ActiveSheet
    End If
    Sheets(2).Name = "课程表简版"
    Sheets(2).PageSetup.Orientation = xlLandscape
    Sheets(2).PageSetup.PrintArea = "$A$1:$M$34"
End Sub

Sub UISetTitle()
    Range("A2:G2").Merge
    Range("A2").Value = "=CONCATENATE(D24, D25, ""课程表"" )"
    Range("A3:G3").Merge
    Range("A3").Value = "=CONCATENATE("""", D26, ""～"", D27, ""年度第"", D28, ""学期"", D29, ""   "", D30, "" "", D31)"

    With Range("A2:G2").Font
        .Name = "黑体"
        .Size = 24
    End With
    With Range("A3:G3").Font
        .Name = "楷体"
        .Size = 11
    End With
    With Range("A2:G3")
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
    End With
End Sub

Sub SetMainTimeTable()
    Call DataValueMainTimeTable
    
    Range("B4").Value = "时间"
    
    Columns("A:A").ColumnWidth = 6.2
    Columns("B:B").ColumnWidth = 8.4
    Columns("C:G").ColumnWidth = 20
    Rows(4).RowHeight = 31

    Range("A3:G3").HorizontalAlignment = xlRight

    Range("A4:G4").Interior.Color = COLOR_GRAY1
    Range("C5:G18").Interior.Color = COLOR_GRAY4
    Range("A5:A19").Interior.Color = COLOR_GRAY1
    Range("A14:A19").Interior.Pattern = xlGray16
    
    ' Split Bar
    For j = 5 To 19 Step 2
        Range("C" & j & ":G" & j).Select
        Selection.Merge
        Selection.Interior.Color = COLOR_GRAY3
    Next j

    AddCellBordersToRange Range("A4:G19")

    With Range("A4:G19")
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
        .Font.Name = "楷体"
        .Font.Size = 24
    End With
    
    Columns("B:B").NumberFormatLocal = "G/通用格式"
    With Range("B5:B19")
        .Value = "=CONCATENATE(I5, "" "",J5)"
        .WrapText = True
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
        .Interior.Color = COLOR_GRAY2
        With .Font
            .Name = "楷体"
            .Size = 11
        End With
    End With
End Sub

Sub SetClassDurationTable()
    Range("I4").Value = "开始"
    Range("J4").Value = "结束"
    Range("K4").Value = "分钟/行高"

    Columns("I:K").ColumnWidth = 8.4
    With Range("I4:K4")
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
        .Interior.Color = vbRed
        .Font.Color = vbWhite
        .Font.Size = 18
    End With
    Range("K4").Font.Size = 12

    Columns("I:J").NumberFormatLocal = "@"
    Call DataValueClassDurationTable
    
    Columns("K:K").NumberFormatLocal = "G/通用格式"
    Range("K5:K19").Value = "=HOUR(TIMEVALUE(RC[-1]) - TIMEVALUE(RC[-2])) * 60 + MINUTE(TIMEVALUE(RC[-1]) - TIMEVALUE(RC[-2]))"
    
    AddCellBordersToRange Range("I4:K19")
   
    On Error Resume Next
    
    For j = 5 To 19
        h = WorksheetFunction.IfError(Range("K" & j).Value, 15)
        If h < 15 Then
            h = 15
        End If
        If h > 60 Then
            h = 45
        End If
        
        Rows(j & ":" & j).RowHeight = h
        If h <= 15 Then
            With Range("B" & j)
                .Font.Size = 8
                .WrapText = False
            End With
            Range("C" & j).Font.Size = 14
        End If
    Next j
   
    Call SetClassDurationBarColor
End Sub

Sub SetClassDurationBarColor()
    Range("K5:K20").Select
    Selection.FormatConditions.AddDatabar
    Selection.FormatConditions(Selection.FormatConditions.Count).ShowValue = True
    Selection.FormatConditions(Selection.FormatConditions.Count).SetFirstPriority
    With Selection.FormatConditions(1)
        .MinPoint.Modify newtype:=xlConditionValueAutomaticMin
        .MaxPoint.Modify newtype:=xlConditionValueAutomaticMax
    End With
    With Selection.FormatConditions(1).BarColor
        .Color = COLOR_GRAY3
        .TintAndShade = 0
    End With
    Selection.FormatConditions(1).BarFillType = xlDataBarFillGradient
    Selection.FormatConditions(1).Direction = xlContext
    Selection.FormatConditions(1).NegativeBarFormat.ColorType = xlDataBarColor
    Selection.FormatConditions(1).BarBorder.Type = xlDataBarBorderSolid
    Selection.FormatConditions(1).NegativeBarFormat.BorderColorType = _
        xlDataBarColor
    With Selection.FormatConditions(1).BarBorder.Color
        .Color = COLOR_GRAY4
        .TintAndShade = 0
    End With
    Selection.FormatConditions(1).AxisPosition = xlDataBarAxisAutomatic
    With Selection.FormatConditions(1).AxisColor
        .Color = 0
        .TintAndShade = 0
    End With
    With Selection.FormatConditions(1).NegativeBarFormat.Color
        .Color = 255
        .TintAndShade = 0
    End With
    With Selection.FormatConditions(1).NegativeBarFormat.BorderColor
        .Color = 255
        .TintAndShade = 0
    End With
End Sub

Sub SetHideSplitColumn()
    Columns("L").ColumnWidth = 10
    
    Range("L1").Value = "是否隐藏"
    
    With Range("L1")
        .Interior.Color = vbRed
        .Font.Color = vbWhite
        .Font.Bold = True
    End With

    Columns("L").AutoFilter
    ' ActiveSheet.Range("$L$2:$L$26").AutoFilter Field:=1, Criteria1:="="
End Sub

Sub SetHintMsg()
    Range("C20:F20").Merge
    Call DataValueHint
End Sub

Sub SetMetadata()
    Range("C24").Value = "学校"
    Range("C25").Value = "季节"
    Range("C26").Value = "学年开始"
    Range("C27").Value = "学年结束"
    Range("C28").Value = "学期"
    Range("C29").Value = "结束"
    Range("C30").Value = "班级"
    Range("C31").Value = "最后更新"
    
    Call DataValueMetadata
    
    With Range("C24:C31")
        .Interior.Color = vbRed
        .Font.Color = vbWhite
        .Font.Bold = True
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
    End With
    
    With Range("D24:D31")
        .HorizontalAlignment = xlRight
        .VerticalAlignment = xlCenter
    End With

    AddCellBordersToRange Range("C24:D31")
End Sub

Sub AddCellBordersToRange(rng As Range)
    rng.Borders(xlDiagonalDown).LineStyle = xlNone
    rng.Borders(xlDiagonalUp).LineStyle = xlNone
    Dim x As Variant
    For Each x In Array(xlEdgeLeft, xlEdgeTop, xlEdgeBottom, xlEdgeRight, xlInsideVertical, xlInsideHorizontal)
        With rng.Borders(x)
            .LineStyle = xlContinuous
            .ColorIndex = 0
            .TintAndShade = 0
            .Weight = xlThin
        End With
    Next
End Sub

Sub SetSheet2BriefTimeTableOne(rng As Range)
    With rng
        .Range(Cells(1, 2), Cells(1, 6)).Value = "=课程表!C$4"
        .Range(Cells(2, 2), Cells(2, 6)).Value = "=课程表!C$6"
        .Range(Cells(3, 2), Cells(3, 6)).Value = "=课程表!C$8"
        .Range(Cells(4, 2), Cells(4, 6)).Value = "=课程表!C$10"
        .Range(Cells(5, 2), Cells(5, 6)).Value = "=课程表!C$12"
        .Rows().RowHeight = 16
        .Rows(6).RowHeight = 5
        .Range(Cells(7, 2), Cells(7, 6)).Value = "=课程表!C$14"
        .Range(Cells(8, 2), Cells(8, 6)).Value = "=课程表!C$16"
        .Range(Cells(9, 2), Cells(9, 6)).Value = "=课程表!C$18"
    
        For h = 2 To 9
            .Cells(h, 1).Value = "第" & Choose(h - 1, "一", "二", "三", "四", "", "五", "六", "七") & "节"
        Next h
        .Cells(6, 1).Value = ""
        
        .Cells(10, 6).Value = "=课程表!D31"
    
        AddCellBordersToRange .Range(Cells(1, 1), Cells(9, 6))
        
        With .Range(Cells(1, 2), Cells(1, 6))
            .Font.Bold = True
            .Interior.Color = COLOR_GRAY4
        End With
    
        With .Range(Cells(2, 1), Cells(5, 1))
            .Font.Bold = True
            .Interior.Color = COLOR_GRAY3
        End With
    
        With .Range(Cells(7, 1), Cells(9, 1))
            .Font.Bold = True
            .Interior.Color = COLOR_GRAY2
        End With
    End With

End Sub

Sub SetSheet2BriefTimeTableFormatConditions(strStart As String)
    Selection.FormatConditions.Delete
    Selection.FormatConditions.Add Type:=xlExpression, Formula1:="=COUNTIF($O$10:$O$17," & strStart & ")"
    Selection.FormatConditions(1).Font.Color = COLOR_GRAY3
    Selection.FormatConditions.Add Type:=xlExpression, Formula1:="=COUNTIF($P$10:$P$17," & strStart & ")"
    Selection.FormatConditions(2).Font.Bold = True
    Selection.FormatConditions(2).Interior.Color = COLOR_GRAY4
End Sub

Sub SetSheet2BriefTimeTable()
    For i = 1 To 25 Step 12
        For j = 1 To 8 Step 7
            SetSheet2BriefTimeTableOne ActiveSheet.Range(Cells(i, j), Cells(i + 9, j + 5))
        Next j
    Next i
    
    With Range("A1:P34")
        .Font.Name = "宋体"
        .Font.Size = 11
        .HorizontalAlignment = xlCenter
        .VerticalAlignment = xlCenter
    End With
    
    Columns("A").ColumnWidth = 8
    Columns("B:F").ColumnWidth = 9
    Columns("H").ColumnWidth = 8
    Columns("I:M").ColumnWidth = 9
    
    With Range("O10:P10")
        .Interior.Color = vbRed
        .Font.Color = vbWhite
        .Font.Size = 12
    End With
    
    Call DataValueSheet2BriefTimeTableIgnoreHighlight
    AddCellBordersToRange Range("O10:P17")

    Range("B26:F33").Select
    SetSheet2BriefTimeTableFormatConditions "B26"
    Range("I26:M33").Select
    SetSheet2BriefTimeTableFormatConditions " I26"
End Sub

Sub InitGlobalVars()
    COLOR_GRAY1 = RGB(166, 166, 166)
    COLOR_GRAY2 = RGB(191, 191, 191)
    COLOR_GRAY3 = RGB(217, 217, 217)
    COLOR_GRAY4 = RGB(242, 242, 242)
End Sub

Word的信息泄露

2024-05-28T03:20:15+00:00

特大号昨天发了一篇“串标翻车”的文章，里面有一段‘四、文件属性”出卖了”你’

两家公司应答文件文档属性中作者一致，存在串标行为

两家公司应答文件部分内容高度雷同，存在串标行为

两家公司应答文件的最后一次保存者一致，存在串标行为

两家公司报价文件标题均为“附件一：”，作者均为“王者”，存在串标行为

三家公司的采购文件格式、排版及服务方案内容存在高度异常一致，存在串标行为

两家公司报价表中格式、附图完全一致，存在串标行为

如果标书用Word来编辑，确实会泄露很多信息，而且很多人不知道。这个问题最大的其实是因为Word所见即所得的特性，隐藏了很多细节。

如果你默认安装Word后，不做任何设置，你很多信息会看不到。而且Word不像LaTex，或者Markdown，可以让你控制源代码编辑，你的文档有可能被塞入一些奇怪的东西。

如果你提交是打印后的版本，所见即所得可能不会泄露什么内容，但是如果你提交的是电子版就会。

Docx实际上是个压缩包

如果你把docx后缀名改成zip，你就可以解压并且看到很多文档，以我做的论文模板为例：

目录很清晰，你所有的文本内容都在document.xml这个格式化文件里面，footer和header是页眉页脚设置，图片在word/media里，比如里面image1.png是校徽，image2.png是例子的图，这经常被我用来直接拷贝一个大文件里面的图片，或者PowerPoint文档里的图片。

因为是压缩包，就有可能有很多奇怪的东西。

我就打开Docx，打印一下，关闭，没有任何其他操作，Word为什么要提示我保存？

这个步骤看起来没有任何“变化”，对文档没有更新的操作，但是Word底层实际上做了很多其他工作。Word的页码是动态生成的，在Docx文档里面可以看到，他不会保存页码（可能会保存最后一次页码的缓存），所以有时候打开一个大文档，感觉会很慢，因为Word可能在重排整个文档的页码。

所以在你打开Word后，选择打印，因为你的打印机的设置，Word要重新计算很多值，打印完成后，整个文档实际上在底层已经变化了，所以他会提示你保存。

然而你一旦选择了保存，cp:lastPrinted这个值就会变化，并且最后保存着就会变成你。

这就是为什么打印店小妹要来背锅的原因。

隐写术

我们经常在影视作品里看到隐写术，古老的隐写术是使用特殊的墨水或染料。这些特殊墨水可以在某些条件下显示出来，例如在紫外线照射、加热导致温度影响、接触水分或其他特定的化学反应下显现。

现在是数字化时代，花样更多了。

利用Word对用户进行画像

你敢在简历里写，精通Office，只要给我一个你写的大文档，我可以全方位对你进行画像，给你打分。一般人分数不会高。

文件名都起不好的：标题一定要长，要在标题把信息写清楚，比如“论文标题-学号-作者.docx”。比如一个项目申请表，“项目名-学校名称-作者-日期.docx”，但是有些人他就是不注意，你给他“XX项目申请表.docx”，他会还给你一个“xx项目申请表.docx”。你下载下来再也无法分清到底是空表还是填写了内容的表。但是标题也不能太长，我们经常在微信里面看到一个文件，由于标题太长，微信显示不了太多信息，导致关键内容被隐藏的。比如“论文标题-学号-作者-v20240528(2)(3).docx”，这种的，“(2)(3)”是微信自动加的，但是最关键的版本信息v可能就看不到的。
内容：内容是最直观的，这也是大部分人都可以识别的。比如错别字，比如Word已经波浪线提示你语法不对，拼写不对还是不改的，比如专有名词大小写不规范的。
AIGC痕迹未消除：把AIGC的内容不做任何修改，直接拷贝到文档。AI会写得很全面，也会有一些固定句式。
其他诸如不正确引用、抄袭。这个一般得通过查重工具才能查到。
内嵌Excel透视图，未删除原始数据。
审阅、批注没有清理的。你可以试着去办公自动化OA系统去下载一些文档来看看，可能就有很多过程审阅数据没有消除。

反推Word设置的：通过图片的清晰度反推出你的Word的设置，通过OOXML查看使用的Word的版本信息等。如果还在用doc文件，那Word版本一定非常非常老。
从互联网或者别的文档拷贝的：有些明显是从互联网拷贝的，Word会帮你加上“普通(网站)”样式。所以拷贝，一定要记得，永远使用纯文本黏贴。
查看文档属性：创建者，保存者，使用的模板。这个在我 OA模板里面有提到 Word样式的使用和公文模板下载（最终版），会泄露模板目录位置。
直接格式：直接格式（Direct formatting）是指不使用样式，而是直接对单独的段落、单词、甚至字符应用格式。Word会自动收集整篇文档的所有格式，并且帮你显示出来，方便你对这些直接格式进行命名并在未来重用。一篇文档如果编辑得好，应该没有任何直接格式，只有命名样式。要查看是否有直接格式，可首先将样式窗格选项设置为“段落级别格式”“字体格式”均显示为样式，然后在样式窗格内观察样式名称为“xxx + xxx”的。下面这个图是一篇不规范的例子。

是否正确使用样式、大纲、多级列表的。排版很乱的，这也是大部分人丢分的地方。

怎么最大限度地解决Word信息泄露的问题

除了前面提到的一些可能泄露信息的问题外，可以用新版Word自带的文档检查器来检查，可以解决很大一部分问题。

文档检查器、Document Inspector

Word 文档可以包含以下类型的隐藏数据和个人信息：

批注、修订中的修订标记、版本和墨迹注释如果已与其他人协作创建文档，文档可能包含修订、批注、墨迹批注或版本的修订标记等项。此信息可以让其他人查看处理文档的人员的姓名、审阅者的评论和对文档所做的更改，以及你可能不希望在团队外部共享的内容。

文档属性和个人信息文档属性或元数据包括有关文档的详细信息，例如作者、主题和标题。文档属性还包括由 Microsoft 365 程序自动维护的信息，例如最近保存文档的人员的姓名和文档的创建日期。如果使用了特定的功能，您的文档还可能包括其他类型的个人身份信息 (PII)，例如电子邮件标题、请求审阅信息、传送名单和模板名称。

页眉、页脚和水印 Word 文档可以包含页眉和页脚中的信息。此外，你可能已向 Word 文档添加了水印。

隐藏文本 Word 文档可以包含格式化为隐藏文本的文本。如果不知道文档是否包含隐藏文本，可以使用文档检查器进行搜索。

文档服务器属性如果文档已保存到文档管理服务器上的某个位置，例如文档工作区网站或基于 Windows SharePoint Services 的库，则该文档可能包含与此服务器位置相关的其他文档属性或信息。

自定义 XML 数据文档可能包含在文档本身中不可见的自定义 XML 数据。文档检查器可以找到并删除此 XML 数据。

图中的“上次修改者”guest是我，为了避免麻烦，我的Word配置我的名字就是guest。

但是要注意下面：

注意: 此检查器不能检测使用其他方法隐藏的文字（例如，白色背景上的白色文本）。

注意: 该检查器无法检测被其他对象覆盖的对象。

样式名的清理

以我OA的模板为例，我就加了一个没用的样式名“v20230409-样式版本”。

前几年我在阅读一个厂商输出的报告，在样式里面发现了另外一个厂商的名字，一问，才知道，这个厂商创始人是从另外那个厂商毕业的，沿用了人家的模板。

信息化系统的后顾之优

2024-05-01T04:20:15+00:00

我最近遇到一个系统，这是一个比较基础的系统，如果是高度定制的业务系统，一般不会存在这个问题。

问题是，这个系统原先是v1.0，后面升级到v2.0，我们用了2年才发现，v2.0比v1.0多了十几个模块，我们居然都没用。

为了补充原先v1.0的一些功能缺陷，我们在外围做了一些开发，实际上v2.0都已经有了。

当然，在意识到这个问题后，双方一起对齐梳理了没在使用的模块，问题很快就解决了。有些开始用了，有些就是没用。

为什么一直没有发现这个问题？我们就开始反思。信息化推进进度的影响因素中，一定不是单方面的原因，甲方乙方都是有责任的。

AI的回答

一个产品有大升级，他一定是解决了很多旧版本的痛点的，但是我们为什么一直还在用v1.0的思维使用着v2.0的系统？我请AI帮忙回答这个问题。

我的Prompt：你是一个信息化专家，你负责某个公司的信息化推进工作。你原先在负责运维某个业务系统的旧版本，后期这个业务系统进行升级到了新版本，但是过了很长时间你才发现你们还在用旧版本的思维在使用新版本，新版本的很多功能都没有启用，这是为什么？请从你作为用户和提供这个业务系统的厂商等角度进行一步步分析。你认为未来应当如何避免？

AI的回答：

作为信息化专家和负责运维业务系统的人员，发现公司仍在使用旧版本的思维来操作新版本的系统是一个常见的情况。这可能涉及到以下几个方面的因素：

缺乏培训和教育：在系统升级后，如果没有进行足够的培训和教育，员工可能会继续使用他们熟悉的旧版本操作方法。他们可能不清楚新版本的功能和优势，也不知道如何最好地利用这些功能来提高工作效率。升级到新版本可能需要用户重新学习系统的操作方法和功能。如果这需要投入大量的时间和精力，用户可能会选择继续使用他们熟悉的旧版本，而不愿意花费额外的精力去适应新版本。

文化和组织惯性：企业文化和组织惯性可能会导致员工更倾向于坚持现有的工作方式，而不愿意接受新的变化。如果公司的文化不支持创新和变革，员工可能会更难接受新版本系统的改变。人们往往会习惯于某种方式的操作或使用，即使新版本提供了更好的功能和体验，他们也可能会坚持使用旧版本的方式。这种惯性可能需要一段时间才能被打破。

信息不对称：提供业务系统的厂商可能没有充分地向用户传达新版本的改进和优势，或者没有提供足够的支持和培训来帮助用户顺利过渡到新版本，或者用户没有花时间去了解新版本的特性。这可能会导致用户对新版本系统的认知不足，以及对新功能的了解不够。

缺乏动力和激励：员工可能缺乏足够的动力和激励来学习和利用新版本系统的功能。如果他们觉得旧版本的工作方式已经能够满足需求，或者他们没有意识到新版本系统可以带来的好处，他们可能会选择继续使用旧版本的操作方法。

解决这些问题可能需要采取以下措施：

提供全面的培训和教育，帮助员工了解新版本系统的功能和优势，并学习如何最有效地利用这些功能。

建立积极的变革文化，鼓励员工接受新的工作方式和技术，以及与之相关的培训和学习机会。

与厂商密切合作，确保他们提供充分的支持和培训，以帮助用户顺利过渡到新版本系统。

设立激励机制，鼓励员工积极参与到新版本系统的学习和应用中，并充分认识到新系统带来的好处和提升。

通过这些措施，可以帮助公司更好地推进新版本系统的使用和应用，提高员工的工作效率和企业的信息化水平。

回答得非常好，我再提供一些新的思路。

这确实是一个常见的情况

Change is a constant。

年初我在准备将连接了北通手柄的戴尔笔记本接到我的Sony电视机的时候，我翻箱倒柜到处找HDMI线，终于在一个角落里找到一个全新未拆封的HDMI包装盒，然而当我看了一眼盒子，我立刻就把他原封扔了。

这根HDMI线大品牌，线径很粗，接头镀金，有多个屏蔽层，但是他的协议支持是1.4的。1.4协议是2009年出现的，现在最新版都已经是2.1了。

物理外观你看不到任何变化，但是其实软件上协议上早已经升级迭代很多个版本了。

为什么我推荐手机每年都要换新，很多时候你感觉你平时就用下微信，打打电话，好像不换也没关系。实际上不是的。有很多底层的焕新你是肉眼看不到的，更重要的还有安全，它没有功能上的更新，不会让你体验升级，但是在抵抗攻击方面默默在守护你。

我们在用的开源软件Ubuntu、Zabbix、Gophish等，我经常就要去看下版本升级的changelog，生怕有什么新功能没有使用到。

老的经验和思维有时候无伤大雅，有时候会带来大问题。比如RAID5，在我们以前的印象里，RAID5平衡了容量、速度和数据冗余多个因素，是我们首选的磁盘阵列选择。但是在单个硬盘容量不断变大后，RAID5已经不再适用。

因为在大硬盘模式下，在你RAID5发生故障时，重建时间增加，而且在重建期间，由于会大量执行读取操作，如果这个期间再次出现另外一次磁盘故障，数据就会丢失。而且bit rot风险也会增加。

信息领域跟科学、时尚界一样，它会不停地否定自己，用新的东西来替代旧的，但是他也有周期性，可能过段时间，又会使用到旧的某些经典的模式。

比如对于数据库自增ID的选择，以往我们都推荐使用数据库自带的自增ID，不要自己去实现跟数据库自身无关的任何的自增算法。但是在现在分布式环境下，我发现越来越多应用使用UUID作为ID了。以往UUID无法排序、不可读的缺点都得到了修正，UUID自身也有5个版本，从基于时间、命名空间、时间戳优先等等都有。

能怎么解决

从甲方层面，AI都说够了。

从乙方层面，厂商可以有什么作为？

一般的厂商，在持续运维一个产品时，通常会有巡检，很多巡检只是看看CPU内存，巡了等于没有巡。

也会有大小版本升级，可能升级停机几个小时，就完成了，怎么用就不管了。

收集用户的习惯

其实我们在用的所有软件，都会在收集用户的使用习惯，并最终为新功能的开发排期和改进提供公司内部的建议，但是很多都不会向用户开放。

软件开发出来后，就脱离产品经理的控制了，用户什么花样都会玩出来，很多产品经理到用户现场调研时，有时候会发现用户独辟蹊径，就是不按他们的想法使用软件。这是允许的，有些药的副作用后面就被开发成另外一种药出来。

当然，如果这个用户高级一点，可能就会挖出一些安全问题出来。Never Trust User Input，搜索和网站内容的Injection

互联网上还有专门一些教别人怎么“不按出厂设置使用物品”的，把一些原先设计在工业用途的东西拿来家用，比如买个病房的床头柜放家里，把矿渣拿来当NAS，解锁不一样的技能。

不要依赖产品经理的现场调研，通过收集用户的使用习惯，给出问题或者其他最佳实践建议，不要出现80%的用户只使用了20%的功能。

举个网站群的例子

比如网站群来说，一般网站群都会提供一个能力，如果你要在不同网站发送相同内容的文章，他会有个“投递”的功能，就是不需要你在每个网站都发同样的内容，而是发一次，投递到各个网站，并且在投递时可以选择是断开连接还是持续保持内容更新。

有些用户不知道，还是会每个站点去重复发送，最后还要怪你好麻烦。

如果有后端分析，可以发现多篇内容相同的文章，回溯发布的路径，再剔除是其他人转载的数据，最后就可以分析出来，某个人，可能不知道有“投递”的这个功能。

这时候，就可以弹出，告诉用户，我发现你是这么用的，其实我们有这个功能，或者现在我们有这个新功能替代了，但是我发现你都没用，是因为不喜欢吗？

当然，大家都怕数据被提交给远程。

数据被提交到远程的问题

在应对软件供应链风险时，面对版本不一致，公司不掌握各个部署环境情况，我曾经提了个建议，语义化版本，每次更新发布版本，建立用户部署版本数据库等。

但是，这样也会有一些风险。

我有一个朋友，他有天跟我聊起。某B2B公司，有天过来给他介绍PPT，里面统计了他公司使用该2B公司的数据，并且希望跟公司做深度合作。当然，愿景非常好，通过分析，发现你们公司底下人已经用脚投票在零星使用我们产品了，如果能合作，这些人成本可以下降，通过推广，让更多的人可以用到更好的服务，2B公司收益也会更高，双赢。

刚看到数据他是震惊，一个是被分析结果震惊了，一个是，PPT里甚至有Top使用者姓名和使用场景。

他都能想到在2B公司早会，销售们分到一个个PPT，是Top几使用率的客户，领导要求一个个拿下。但是他不知道到底有多少人可以掌握到这些明细或者汇总数据？是研发？公司高管？还是销售经理还是普通的销售人员？他也不知道这些销售离职后这些文件会在哪里。

我笑他想得太黑暗了。但是仔细再一想想，确实是，现在大家平台用得越来越多，这些平台掌握的数据，会以各种脑洞，被挖掘出有价值的信息出来，侧信道攻击的例子实在太多了。

这个2B公司分析得非常好。而我们私有化部署的系统，能否在我们本地分析？能否控制知悉范围？在用户建设和维保费用全部交完后也可以持续分析？

结论

信息化系统，除了实现需求，安全外，可以再加入对本身系统使用分析的功能。

因为数据库数据都在，如果研发发现新加了几个表，但是这些表内数据都是空的，这就有问题了。

或者通过辛苦埋点收集使用数据再给出结论。

而且要，后顾一下那些长期使用，各个版本一步步爬梯升级上来从思想和习惯都僵化的老客户，而不是新购用户。

Never Trust User Input，搜索和网站内容的Injection

2024-03-19T08:20:15+00:00

昨天参加了由CERNET组织的，和清华大学网络研究院网络和系统安全研究室老师们的一个视频会议，他们介绍了一种新的内容注入的问题：

这次发现的主要问题：站内搜索功能可以高效的帮助网站用户搜索特定站点内的资源，已经被广泛应用于不同类型的网站上，包括政府网站、学校站点等。然而，一部分重要网站的站内搜索功能实现不当，成为互联网地下黑灰产的推广途径。研究发现，攻击者可以在短时间内，借助重要网站的站内搜索服务生成大量含有非法产业内容的搜索链接，进一步通过将这些链接分发至搜索引擎，进一步污染搜索引擎的页面。攻击者滥用重要网站在搜索引擎中的声誉，将非法内容展示给用户，甚至可以在2个小时内实现非法内容对搜索引擎首页的霸屏效果。

然后他们还开发了一些工具来找到受到这些影响的高校的网站。

这个问题确实是存在的。

Pharma Hack

Pharma Hack是一种黑客攻击手法，针对网站CMS平台。这种攻击的目的是通过操纵网站的内容，将非法内容嵌入到网站页面中，以提高这些非法内容包括的链接在搜索引擎中的排名。

这个我们就比较常见了，以往有些CMS存在漏洞，或者内容管理员密码泄露，会在某个隐蔽的目录里，有上万个页面，页面里面是各种链接。

但是上面说的这个跟Pharma Hack有些区别。Pharma Hack是攻陷了你的网站，所以他的内容会有大量的链接，主要是利用你的高Rank来抬高他们那些链接的Rank。而这种攻击，因为注入的只能是文本，不能是链接，所以他的目的主要是利用你的高Rank，在搜索引擎里面把他内容展示出来。

所以说这种比Pharma Hack稍微轻微一点，但是由于现在URL重写技术大量利用，导致你很难一下子就可以从链接来确认人家是Pharma Hack还是上面这个攻击。比如上面截图的“做某些奇怪的事情请联系QQ号XXX”，监管部门看到就会以为你这个站点已经被攻陷，被恶意用户植入了恶意代码，但是这个其实只是浏览器URL里面的某个字符转换而成输出的内容。

这会带来什么后果？如果用户在搜索引擎搜索“奇怪的事情”，你的网站Rank比较高，则会出现在搜索页面。因为直接提供“奇怪的事情”的网站可能自身已经被搜索引擎降权了。

如果搜索引擎自身有一些算法，他会看到他所收录的你的网站都是些什么鬼，会将你降权，导致仿冒网站可能比你排名还高。也就是，搞仿冒网站的人可以利用这个方法把你的Rank打下来。

而且搜索一般资源消耗比较大，如果恶意用户构造了很多搜索链接，可能对你的网站造成DDoS攻击。

一两年前，我们在一个访问量比较大的WordPress网站上发现了这个问题，后面没有去研究如何改POST，就直接将搜索禁用了事。

目前已知的修复方法有

robots.txt禁止

Disallow: /search?query=*

这个可以禁止一些搜索引擎，但是清华老师也提到，这个无法阻止直接诱骗搜索引擎访问链接，如果搜索引擎不遵守robots.txt的规则的话。

对部分搜索关键字进行过滤

对某些搜索关键字进行过滤，但是这个过滤名单可能很长。

改成POST请求

POST请求应该可以一劳永逸解决这个问题，但是在实现上存在一些问题，比如某网站群，首次是POST的，但是在下一页的位置，又是简单构造了GET的请求。某网站群，搜索后会生成一个Token from Search Results，URL不带BASE64编码或者明文搜索关键字，这个Token from Search Results会保留在数据库里，主要是为了搜索加速，方便进行分页，这个Token from Search Results如果有效期有问题，也会导致问题还会继续。

将结果返回改成404

这个是，如果搜索结果不存在，将HTTP的状态码改成404，但是页面还是原先不变，这样子对用户比较友好。即使通过诱骗搜索引擎发现这个假的链接，搜索引擎也会忽略内容。但是监管部门或者一些扫描设备不一定会忽略。

将不存在的结果文本删除

这个是在搜索结果时，如果搜索结果不存在，则不显示“XXX”不存在，而是直接说“你所搜索的内容不存在”，但是这个对用户不够友好，因为很多时候搜索，我们可能只是写错了某个字，需要根据搜索结果调整关键字，如果不显示，则还需要重复输入整个搜索关键字。

可能是一个更大的问题

我后面意识到，这个其实不只是搜索的问题，有可能存在更大的范围，也就是，如果你的网站存在用户输入的内容并且会回显给用户，如果这个可以使用GET请求或者说没有屏蔽GET请求，如果这个不需要登录验证，那就会存在这个问题。而我们知道，很多后端编程语言实际上是不会去区分GET还是POST。我们以某大家都在使用的邮件系统为例，在用户名里输入“我是某个奇怪的词”，并且以GET请求，因为这个邮件系统的Form是没有CSRF保护的，所以会正常请求并且返回值会包括

 placeholder="用户名" value="我是某个奇怪的词" class="u-input" type="text" name="uid" autocomplete="off" id="uid" tabindex="1"/>

这就非常麻烦了，在Web安全编程里，在所有编程里，我们都被教育“Never Trust User Input”，这导致需要对网站的所有输入输出进行审查，以往我们从技术上更加关注反射型XSS问题，现在，我们还需要关注，除了对XSS攻击进行HTML编码外，还需要关注回显给用户的内容的安全问题。

开始整改吧！

业务系统不止要有安全中心，还要有反制中心

2024-02-15T10:10:33+00:00

2020年，我写过每个业务系统都应当有一个安全中心，在里面，我提倡整合业务相关的安全设置，在一级菜单位置给安全留一个入口，就是安全中心。

我看的业务系统不多，我去年真的在某个网站群系统看到了安全中心，非常实用。

在这篇文章里，我将会又乱建议某些业务系统，在攻防演练或者日常检测预警中，不要一直把自己处于被动挨打的状态，是时候，起来反抗了。

想法的由来

我曾经分享过高校网络安全攻防演练应试解析，姚政茂写了篇解析。

在这次分享里，因为我认为攻防演练是大考，所以我模仿中小学等第制瞎编了一个ABCD的评价体系，接着基于这个评价体系捏造了3个维度进行了分析。为了怕时间不够，我又从另外一个角度拼凑了篇幅。

在谈到“一个系统攻防演练的时候被扣分，是否就一定比其他没被扣分的系统更不安全？”，我举了个例子。因为我发现，有些系统，普通用户的账号密码被攻击队拿下了，然后攻击队穷尽一切办法，用标准渗透测试手法从SQL注入、文件上传、平行权限、越权所有手段都试过了一遍，还是找不到任何漏洞，而且拉到的数据，也就是这个用户自己的数据，攻击队浪费了好多时间，最后提交账号分悻悻走人，系统被扣了账号分。

比较典型的就是邮件系统。这种系统，是经过攻击队认证过的，无比安全的系统。这时候你如果根据考核体系对这个系统的责任单位进行通报，实际上是非常不公平的。其他没被摸到的系统，问题可能更多。

对这种系统，应当通报表扬而不是批评。

这种系统一般都是账户量比较大，系统自身可能已经做了密码防止暴力破解，双因素认证等等防护，然而因为用户自身的问题，导致密码被泄露出去。典型的还有VPN、统一身份认证等等。这些系统也是攻击队撕开防线的关键一步。然则攻击队一般只在于拿到账户，不会对系统自身做什么攻击尝试，只要这个系统不要太弱智。

优秀，但是独善其身就够了么？能不能走得再远一点？为什么我一直都被打，从来没有想过反抗呢？

蜜罐类账号

攻击队这么喜欢拿账号，那就慷慨地送他们一堆吧！

我对蜜罐类账户的定义是，由前面提到的入口账号类的系统，比如VPN、邮件、统一身份认证系统提供的一类虚假，用来定位的账号。

这些入口账号类的系统，可以有个模块，生成一些假的账号，对这些虚假账号进行全生命周期管理，生成，标记，投递，回收，销毁。这些虚假账号，密码是什么无所谓，但是在验证请求时，如果有人提交这个账户和密码来验证，立刻记录并报警。

或者是真实的账号，引入胁迫密码。胁迫密码是什么，就是你在家门口，被人用Q指着头，向你家密码锁输入的一段密码，他可以让你进门，也会自动悄悄报警。

投递有几个方法。

扔到GitHub这类公开的平台
“不小心”写到培训手册里
投递到成员邮箱，桌面去
写到出错后出现的错误信息里
在你收到钓鱼邮件后，不要删除它，不要忽略它，大胆地从蜜罐类账号挑选一个，提交过去，主动中招，然后就等着攻击者来验证，以此来获得攻击者的IP或者其他溯源信息

这样你未来就会有一个表，谁，从哪个渠道转化过来了，用了什么IP或者指纹信息来验证。

这种蜜罐类账号非常隐蔽，因为他跟业务系统足够紧密。如果你起个蜜罐邮件系统，孤零零一个邮件系统部署在那，没有任何意义，没人会去玩。而这个够真实，没有能力，怕被监管部门通报，你就返回密码错误给攻击者好了，有能力，你还可以再把攻击队往某些地方引。

以往蜜罐会混到安全域里，会寄生在服务器、HTTP、数据库蜜标等等，而这个，实际上是业务系统自己做了蜜罐功能。

检测到自身正在被攻击

要不要识别到自身正在被攻击？

这个确实不是业务系统应该考虑的。网络的分布式和分层的架构，很多事情可以在不同位置、不同层级来做。比如安全，因为成本，你可能只在某个地方集中做；为了纵深防御，你可能多个层都做；因为在扯皮，你可能偶尔这边做，偶尔那边做。

让业务不要识别被攻击，可以让业务更简单，专业的事情交由专业的类似外层WAF内层SIEM都可以做。但是有些地方，还不得不业务系统自己才能感知到。

举些例子。

有哪些是开发者更容易能感知到的攻击

有些程序员无法正确区分错误和异常。就算对于异常，他们也无法分清，不知道该失败重启还是清理环境继续。

很多业务系统对出错不处理，一个错误，只会在access.log或者error.log留下一条记录。只要系统不出现故障，不会有人主动去分析错误日志。

我以前遇到一个业务系统，每次遇到500错误，他都会将错误记录下来，写入数据库，并且在前端有个界面可以看到，由哪个用户引起的这个错误。

就这个事情其实很多业务系统都做不到。那个业务系统，借由这个功能，识别到了一次普通用户密码泄露引发的攻击尝试。每次成功的攻击背后，都可能伴随着大量导致程序出错的尝试。

而如果你的业务系统已经引入RASP了，那能漏到RASP的，应该是非常严重级别的告警了，应当直接触发“强制报告”。

还有一种非常常见的场景，比如项目管理系统，你输入合作者的学工号，或者只是姓名的一部分进去模糊搜索，业务系统就会非常贴心地将这个合作者的相关信息（姓名、身份证号、联系方式、院系、银行卡）啥的都帮你代填了。

这个功能你又去不掉，用户很喜欢这个功能。攻击者也很喜欢，写个程序，就可以把全部人信息都枚举下来。

为了防护，你可以部分打码、取得合作者授权同意、控制阈值等等方法。你就很烦，本来我给你设计的路线是这么走的，但是偏偏一些旁门左道的人，脑洞比谁都大，在你这里乱搞，让你加班多写了好多代码。

那就再多写一些，抓出来好了！

希望未来我能遇到这种带刺的业务系统。

我所使用的29种或开源、或免费、或正版化软件

2024-01-18T07:11:33+00:00

我一般会定期将操作系统进行重装，重装系统的意义。寒假到了，正好重装了操作系统，所有软件都重新安装了一遍，分享出一些我还保留下来的软件。

软件的变化是永恒的，我的博客推荐过不少软件，但是很多都消失在时间的长河里。在我推荐的时候，看它啥都是好的，没有缺点，非它不可，在它消失的时候，我不得不手工或者编程来将它的数据转出到另外一个它。但是我相信，在那个时间点，确实它是最合适的。正如现在下面推荐的这些软件一样。

如果你有更好的也可以推荐给我。

我去年也写过，高校正版化软件实施过程中的一些问题。一个软件即使付费，也不能保证他一定可以活下来，而且还可能阻挠你迁移到另外一个软件。还有就是手机端买软件或买次时代游戏时，如果这个软件或游戏不是多平台的，会导致你迁移到另外一个平台的成本很高，你很难抵抗供应链断裂的风险。

在我推荐的软件里，很多都采用了插件的架构，比如Edge、Obsidian、Anki、VSC、KeePass等等。插件使得软件的扩展性更高，软件的可配置项可玩性增加，但是也带来了更多的安全风险，就像开源软件一样，由于底层依赖复杂，你必须信任很多人，有了插件体系，你要信任更多的人。所以插件的选择也是很重要的，使用尽量少的插件，并且永远保持一个可能已经被黑的“底线思维”。

选择的理由

我选软件一般会遵循以下几条原则：

销量高，一直有活跃更新的。历史悠久的。
或后起之秀。
AIO和独立都会考虑，但是会尽量选择体量小的，体量越小，越专，一般会在那个垂直赛道跑到第一。
优先从下面顺序选择：开源、免费、收费的免费版。
供应链安全，尽量选择有跨平台能力的软件。未来可能得从x86、ARM架构转出，或者更换操作系统，如果能有源代码在，转换会比较容易一点，或者至少对数据的导入导出会有代码可参考。
如果有数据存储的，应当格式简单，方便迁移的，牺牲一点功能性，提高自主可控能力。

笔记类软件

Obsidian

双向链接笔记类软件，底层是Markdown文件格式存储，迁移方便。我用Obsidian替换了用了十几年的OneNote。OnoNote它是全平台免费的，但是体量太大，客户端2016年后不再更新，否则OneNote是一个非常合适的选择，一个分区就是一个文件，一个笔记本就是一个目录，可导出Word。

同类的还有Logseq、Notion、Foam等等。

有道云笔记

和Obsidian组合，只用来记录不敏感，需要跟手机同步的笔记。

Zetero

文献和网页收集整理。以前我用NoteFirst。如果有印象，我在2004年还推荐过网博士。

Anki

记忆卡片，可用来背单词、题库等任何需要记忆的内容。算法参考自Hermann Ebbinghaus的遗忘曲线，十几年前我用SuperMemo。现在也有专门给学生使用的实体的电子纸学习卡，比如喵喵机等等。

Freeplane

思维导图。同类的很多，比如FreeMind、Obsidian Canvas、VSC插件、Mermaid等等。内容和格式分离，说说写论文、写文档、画框图的事。

draw.io

拓扑图工具。可看等保的定级网络拓扑图怎么画？用什么画？

PDF Arranger

PDF应当是一个输出格式而不是一个编辑格式，任何时候要更改一个PDF内容，理论上应该是编辑源头，并重复输出。PDF就类似已经打印出来的A4纸，你可以在上面描描画画形成花脸稿，最终还是要重新在Word里编辑后输出。

一般人会遇到以下几个PDF场景。

阅读：Chromium内核的浏览器比如Edge、Chrome已经可以直接打开PDF，做标注等等。笔记类软件一般也可打开PDF标注。
生成PDF：LibreOffice、Word可以生成PDF。
简单编辑：比如修改元数据、对页面进行调整、抽取页面、合并等等。我用PDF Arranger。
复杂编辑：我用得不多。因为PDF是输出格式，所以编辑还是比较麻烦的。

多媒体类

EV录屏

对屏幕进行录制很方便。

Potplayer

看电影。

foobar2000

听些本地的音乐文件很适合。没有广告，不会分析你的习惯，扔一些文件，建几个播放列表，随机播放即可。

ShareX

截图工具。

ScreenToGif

制作GIF动画。

GIMP

Photoshop平替。

系统类软件

7-Zip

虽然Windows11已经支持Zip和RAR等压缩格式，但是对RAR的支持还不是太完善。用了蛮久。

Everything

快速定位全盘文件和文件夹，由于建立了索引，速度非常快，比系统自带的快，特别是现在微信文件夹很大的情况下，用它来找文件速度非常快。

FileZilla

FTP下载工具。FTP服务器已经较少了，部分人还是需要的。

KeePass

密码管理软件。关于密码的一些事

TreeSizeFree

分析磁盘空间占用的工具，扫描全盘非常快，可以定位占用比较大的目录。

CurrPorts

分析程序开的端口的工具。

开发类

Visual Studio Code

Visual Studio Code是我的主力文本编辑和开发工具。推荐好用的编辑器Visual Studio Code

DBeaver

数据库管理工具，支持MySQL等等多个数据库产品。支持SSH隧道连接。

XShell

远程SSH连接工具。推荐中过木马的SSH客户端工具Xshell

Putty

老牌的远程SSH连接工具，只有一个EXE文件，很小，一个很好的补充。

Tortoisegit

Git的GUI工具，可结合资源浏览器右键菜单，虽然VSC也支持操作Git，但是一个独立的GUI有时候也很方便。

备份类软件

Macrium Reflect Free

备份是非常重要的，如果数据没有2份以上的备份，可以认为这个数据是不存在的。MRF支持对整盘在线进行备份。就把备份做好有多难

FreeFileSync

FreeFileSync我用在离线备份，定期接上移动硬盘，打开同步方案，同步一下。

FreeFileSync可以保持2个文件夹同步，支持本地文件夹、网上邻居、FTP。文件比较根据文件更新时间、大小（1T几分钟就可以检查完）或者内容（很慢，没试过）比较。可以后台自动同步。带简单的版本管理。可以建立配置文件，保存多个同步方案。使用非常简单，选择2个目录，检查不同，同步即可。

所以FreeFileSync就是一个copy的功能，你可以认为他就是一个增强型的copy。为什么不用copy？拷贝黏贴也很简单，但是对于大量文件拷贝黏贴不靠谱，无法断点续传，遇到锁定文件可能出错。拷贝黏贴只适合小量文件，习惯好的人一般会拷贝完检查一下源和目的文件夹的文件数量和大小。

免费个人数据备份软件介绍：FreeFileSync、Syncthing

Syncthing

Syncthing我用在在线远程备份。Syncthing也是同步2个文件夹的，类似私有云的Dropbox，支持多台客户端实时双向同步，但是他不支持本地文件夹，只支持远程。

群辉类NAS

NAS类的建议家里一定要有一个。

邮件系统配置检查

2023-11-20T06:21:43+00:00

引子

2023高校网络安全研讨会上，马云龙老师介绍了清华邮件系统的“电子邮件系统结构-新架构-2023年”，经过多次的部署，清华使用负载均衡，前后端分离，文件分离等方法将邮件系统完全展开部署。我在2018年写过高校邮件系统配置相关，在里面，我也更推荐将整个邮件系统所有组件展开部署，于是我很好奇，目前大家是到什么程度了？

顺便提下，我在2021年写过为什么我不建议用WebMail收发信件。里面提到的部分内容Isaac系统目前已经修复了。

其实AIO的部署方式没有任何问题，简单有效，但是将所有组件分开部署，一旦分模块部署后，你可以对各个不同模块应用不同的防护方法，具体好处我以前有写，现在流行微服务的架构，分开部署，一定是未来的方向。

由于邮件系统的很多信息都在DNS上，都是对外公开的。所以我从教育系统IPv6发展态势监测平台 https://ipv6c.cngi.edu.cn/2021.do 上获得了147个双一流单位的学校名称和URL地址，新建了一个Jupyter Notebook，开始观察了。

怎么判断是不是分开部署了

我初步的想法是，在我以前提到的，最重要的MX的A记录，Web/SMTP/POP/IMAP A记录，SPF里面带的A记录，这3个代表了MTA、MRA、MDA等等多个功能，理论上如果展开部署，这3个的IP应当不同。

当然有些单位可能分开部署后，又通过某种发布机制将IP统一到同一个，很少。

随着我程序运行的过程中，我发现了很多好玩的事情。

SPF

部分单位无法正确地编写SPF字段。可能厂商让写什么就写什么。

在所有的147个单位的SPF字段里，只有包括清华在内的3个单位使用了redirect的指令来重定向SPF。很高级的做法。

有50个单位都include了某个邮件厂商的SPF字段，在这个厂商的SPF里面，使用了SoftFail，我对SoftFail的机制不是太了解，如果是我，我更希望是HardFail。但是这个厂商的SPF A记录里面包括了他自己在云平台的托管服务器IP和某些区域代发服务器IP，我曾经建议将这2个分开，目前看起来可能是还没有。

有42个单位的SPF以SoftFail ~all结尾而不是-all。这里面又大部分是include另外一个邮件厂商的SPF字段，推测这个邮件厂商建议这么配置。

某些单位使用的一家邮件厂商只有简单的A记录，估计没有某些区域代发功能。

有14个单位有ip6记录，很高级。但是有部分单位IPv6记录是/48，不知道是啥情况。还有个单位错误地使用了fe80::开头的IPv6 IP。

只有十几个SPF记录不是硬编码IP地址的方式进行。当然，过多的DNS查询可能导致错误，一般不超过10个，而很多单位普遍在用的某个厂商的include已经会引起9次DNS查询了，另外一家是8次，所以你一般include后，很难不硬编码了。

有一个单位比较神奇的是，只要访问不在他们列表的域名，就会返回 “v=spf1 a ~all” 的记录。可能是为了安全防护吧还是配置错误。

你可以通过 PowerDMARC 网站来对你的域名进行测试得分。

DMARC和其他

有十几个单位有自己的DMARC记录。

有DMARC的单位72个，但是有52个是p=none，我不确定是否为了兼容性而降级了。

还有更多的DKIM、BIMI、MTA-STS（2018年我的文章说没有这种机制，现在看起来是错了）、TLS-RPT没有继续测试。

STARTLS应用整体如何未测试。

IPv6

有13个单位的MX记录有IPv6地址。

有76个单位Web有IPv6地址。以上均未测试服务是否正常。

因为Web/SMTP/POP/IMAP是面向用户的，所以上v6会简单一点，而MX虽然也是SMTP，但是它涉及到跟其他服务器的交互，有些单位会有顾虑。

Web和MX是否同一个IP

在判断Web Mail的IP上，我构造了mail.xxx.edu.cn和email.xxx.edu.cn，再通过HTTP协议去获取是否真的有网站，最终得出WebMail的IP地址。并开始比较，最终得出结论是：以下省略部分字。

管理员界面和API

如果分开部署做得好的话，管理员界面和API应当跟Web Mail进行分离，但是我所知道的某家邮件厂商没有。一般的纵深防御是，对admin这个目录在HTTP层（不是应用层）进行IP限制，在我的检查的结果里，有很多没有做，也就是全世界任意地方都可以访问这个后台管理员界面。如果管理员有比较固定的IP地址，建议加上。

某家邮件厂商的API功能非常强大，具有上帝视角，但是他的API只有IP限制，我曾经建议加上密码限制，在我所知的版本里，可能还没有，于是我对API URL进行了检查，有些没有API，有些是直接暴露在互联网的，估计后端有IP限制，但是IP太容易被抢，可能会在多次升级后对IP白名单列表的失控，或者攻击队进入同网段进行尝试，也是一个隐患。

可以通过连接SMTP端口后拿到banner，有部分是

Anti-spam XXX (mispb-GUID-xxx.edu.cn[20230810])

目前不知道时间戳是啥，应该不是版本号，可能是安装时间。我记得去年banner还会暴露版本号和编译时间2个时间戳，目前看起来是没有了。

有些没有反垃圾网关。

有2家使用****对banner进行了隐藏。

某家厂商邮件首页的seo-link

在我对某个厂商Web Mail首页进行观察时，发现了一个height和line-height为0并且隐藏的seo-link，这个class名字取得挺诚实，但是用height为0，不会被SEO惩罚么？

然后我继续检查了下，部分高校被放了SEO链接，我没有继续查有多少个。

     class="seo-link">
         href="XXX" target="_blank">邮件系统
         href="XXX" target="_blank">邮件服务器
         href="XXX" target="_blank">企业邮箱
         href="XXX" target="_blank">企业邮箱
    

自动配置

在我以前提到的自动配置里，暂时没有任何一家实现了 _autodiscover._tcp.xxx.edu.cn 的DNS记录 / autoconfig.xxx.edu.cn。有个位数单位有 autodiscover.xxx.edu.cn CNAME，一般都是指向outlook。自动配置对用户更友好，用户可以傻到不需要去知道SMTP/POP等的域名和端口。由于这个是给机器或者说程序读的，各个客户端支持也不同，估计大家都还没意识到。

我用 matplotlib 画了一些图，但是贴图实在麻烦并且没有意义，省略。

攻防演练中的蜜罐，不在于他有多蜜，而在于他有多密

2023-09-20T23:30:33+00:00

在电影《达芬奇密码里》，馆长在临死前透露Keystone在巴黎圣苏比教堂里的玫瑰经线下，实际上这就是一个蜜罐，通过圣杯守护者投递，一旦有人去取，就会触发反制。

蜜罐出现比较老了，以前没什么用，但是现在又开始火了。

如果攻防演练的时候你没有蜜罐，那你可能一开始就输了。

虽然你可能在各个区域都部署了全流量探针，但是你还是需要一个蜜罐。

一个独立的系统，作为全流量分析的补充，防止你全流量探针挂掉的时候他还是工作的，而且这个系统是简单的
成本远低于全流量探针，在树莓派上安装个免费开源的分布式蜜罐，就可以二级单位乱放

蜜和密

攻防演练中的蜜罐，不在于他有多蜜，而在于他有多密！！！

而这个密，也包含两重意思。

蜜我们可以认为是仿真度，但是仿真度意义不大。

为什么甜蜜的“蜜”没有意义

攻防中，我们部署蜜罐的目的在于

消耗攻击队资源
发现攻击队《ATT&CK网络攻击入侵分类说明指南》里面说到的Discovery，也就是内网扫描
溯源反制

只有最长的那条才是最重要的。蜜罐仿真的成本很高，定制类的仿真不亚于一个系统建设的成本，但是不管怎么样，还是很容易被攻击队识别到。所以，有钱也不要投入在这里。

“密”所包含的两重意思：密集和秘密

能有多密集？？？

蜜罐的形态有高交互蜜罐、低交互蜜罐和无交互蜜罐，部署位置或者说入口可以是外网、内网、主机、域名子目录、邮件账户、GitHub、服务器或者终端桌面、数据库或配置文件中。

所以可以密集到排列组合上面的所有组合。

高交互蜜罐

高交互蜜罐只是用来消耗攻击队时间，不处置，因为扫描导致的误报率太高了，所以布了就算了，可以部署在外网，内网。

部署在外网的，需要考虑监管部门的通报，部署使用的域名可以使用历史上有出过问题，在网络空间资产搜索引擎里被记录存在问题的域名。

一旦攻击队在网络空间资产搜索引擎里查到问题域名，他就会陷入。

高交互蜜罐从系统二级目录引流

比如把门户网站的/admin目录导向蜜罐，如果你是使用反向代理，这个事情做起来比较容易。

低交互蜜罐分布式部署到各个安全域

使用分布式蜜罐，每个二级单位放一个，每个网段放一个，把所有空余IP全部利用起来，如果一个C段有10个IP是业务IP，那蜜罐就监听255-10吧！

主机EDR类起端口型蜜罐

如果你蜜罐部得多，攻击队会变得小心，他只会扫描他所控制的服务器历史上连接过的IP，这时候主机EDR监测就起到很大的作用了。

邮件诱饵发到每个账户

发送类似“VPN账户信息”到部分账户。

文件诱饵放到每个服务器、每个终端

不嫌麻烦，你投递诱饵的同时，实际上也是在向终端用户宣贯，不要把明文密码放在邮件系统和电脑里。

蜜标放在数据库内

比如把蜜标放到用户表里，一旦有人拖库，从审计平台可能可以感知到。

需要多秘密？？？

不要告诉别人你布了蜜罐（我是违反了这条规则了。。。），采购蜜罐的招投标项目名字换个吧，提醒蜜罐厂商从他的官网和PPT案例库里把你删除掉
蜜罐监听的端口最好不要有任何回应，黑暗森林法则，有回应，就会被识别。退化到只检测
邮件诱饵不要放跟踪代码，太容易被识别，Word、PDF还可。
可以经常变换IP，业务和蜜罐IP都可以变

这么多蜜罐，看起来好乱

蜜罐部得太多，特别是起了很多IP、网站和二级目录，会对你的网络环境有很大的干扰，但是这个没关系，互联网上从来就是垃圾比有用的多得多，你需要使用一个系统管理起来。

在前面说到的投递、变更和回收，如果你有反代，有EDR，这些事情会比较容易做。比如反代有API，你一秒可以部署很多个二级目录的蜜罐入口出来。

比如邮件诱饵的投递，如果你只是群发邮件，那邮件发送的时间太接近攻防演练时间，邮件的内容变更麻烦，回收麻烦。如果邮件系统天然支持邮件诱饵的投递，那一切会变得简单，比如可以任意伪造发送时间，打开邮件跟踪，就放在系统直接做掉。