针对现代网络钓鱼攻击的高频与隐蔽特性,本文提出了一种基于高斯朴素贝叶斯(Gaussian Naive Bayes)的自动化识别模型,并引入特征标准化流水线(Standardization Pipeline)解决了多量纲数值特征导致的预测偏差问题。实验采用包含 23.5 万样本的 PhiUSIIL 数据集,通过对 54 项 URL 维度特征的深度挖掘与预处理优化,模型在测试集上表现卓越。结果显示,优化后的流水线模型召回率(Recall)保持在 99.96%,误报数(False Positives)从原始数据的 687 例锐减至 17 例,ROC-AUC 达到 0.9998。该研究证明了轻量级生成式模型在经过严格特征工程处理后,能够在大规模实时检测场景中兼顾高精度与低延迟。
传统DCT水印在面对噪声、压缩、滤波等常见图像处理操作时,鲁棒性往往不够理想。这篇文章记录了我在优化一个开源DCT水印工具时的完整过程,通过多系数对投票和位重复编码,将算法的鲁棒性从14.3%提升到了52.4%。
本文系统阐述了基于离散余弦变换(DCT)的数字水印算法的理论基础与实现优化。文章首先介绍了DCT变换的数学原理,分析了频率系数的物理意义及其在图像处理中的能量分布特性。随后详细描述了水印算法的核心流程,包括图像分块、DCT变换、差分能量修改法的嵌入策略以及盲提取协议。
arp-scan 是一款基于 ARP 协议的局域网主机发现工具,工作在 OSI 模型的数据链路层。其原理是向指定网段发送 ARP 请求包,强制目标主机返回其 MAC 地址,从而绕过防火墙对 ICMP(Ping)的拦截。该工具具备极强的穿透性和厂商识别能力,是网络管理员进行资产盘点、识别隐身设备及安全审计的高效利器。