用虚拟货币挖矿已被我国正式列为整治类产业的背景下,基于用电数据对挖矿用户相关行为分析成为国 家电网公司重点研究方向 。针对国内现有挖矿行为用户检测识别技术的准确性不高、挖矿行为特征不全等问题, 提出了一种融合 SMOTE 过采样、OSS 欠采样与贝叶斯优化调参,基于 LightBGM 的挖矿用户识别模型 。该模型首先 提取一定区域内用户用电数据的时间序列和相似度特征,将月度用电特征、日用电特征和用户信息特征合并,形成 70 个特征;其次通过 SMOTE 过采样办法,使得正负样本数量平衡,运用 OSS 欠采样,去除正负样本中的重叠边界样 本;最后运用贝叶斯优化办法进行模型参数调优,LightBGM 模型对数据训练分类 。结果表明,该挖矿用户识别模型 F1 值为 0.952,准确率比一般模型提高 11%,证明该挖矿用户识别模型可以提升挖矿用户识别准确度,助力政府部 门对虚拟货币挖矿行为的监管效率。
[1] 史博轩,林绅文,毛洪亮 . 基于网络流量的挖矿行为检测识 别技术研究[J]. 计算机应用研究,2022,39(7)∶1956-1960.
[2] 秦玉海,刘禄源,高浩航,等 . 网页恶意挖矿行为的检测及 防范[J]. 网络安全技术与应用,2018( 12)∶51-53.
[3] Rauchberger J,Schrittwieser S,Dam T,et al. The other side of the coin: a framework for detecting and analyzing Web- based cryptocurrency mining cam paigns[C]//Proc of the 13th International Conf-erence on Availability,Reliability and Se- curity.New York: ACM Press,2018 ∶1-10 .
[4] Jie Hao. Analysis of whether cryptocurrency like bit coin is real money from the perspective of state the- ory of money [C]//Advances in Social Science,Edu- cation and Humanities Research.2018∶1725-1729 .
[5] 胡聪,徐敏,洪德华,等 . 基于改进 K-medoids 聚类和 SVM 的异常用电模式在线检测方法[J]. 国外电子测量技术 , 2022,41(2)∶53-59.
[6] 王威,王兰君 . 基于用电行为特征大数据的异常用户识别 模型研究与应用[J]. 电力大数据,2021,24( 12)∶19-26.
[7] 刘月峰,赵潇潇 . 基于时间卷积网络的用户用电异常检测 方法[J]. 科技创新与应用,2021,11(27)∶145- 147.
[8] 万磊,陈成,黄文杰,等 . 基于 BRB和 LSTM网 络的电力大 数据用电异常检测方法[J]. 电力建设,2021,42(8)∶38-45.
[9] 何昆,何子昂,范杏元 . 基于 PCA孤立森林的用电异常识别 研究[J]. 计算技术与自动化,2021,40(02)∶76 -80.
[10] 刘中强 . 基于机器学习的用电异常分析模型的研究与应 用[D]. 北京:中国科学院大学(中国科学院沈阳计算技术 研究所),2021.