DGA深度学习相关论文

2023-10-27

一、基于 word-hashing 的 DGA 僵尸网络深度检测模型（2017）

主要贡献：基于word-hashing 将所有域名转用二元语法字符串表示，利用词袋模型把域名映射到高维向量空间．然后利用5 层深度神经网络对转换为高维向量的域名进行训练分类检测。通过深度模型，能够从训练数据中发现不同层次抽象的隐藏模式和特征，而这些模式和特征使用传统的统计方法大多是无法发现的．

自然语言处理中将字符串或者词汇转换为向量最常用的方式是one-hot Encoding 技术，但是 one-hot Encoding 技术并不适合这里的应用场景．在自然语言处理中，one-hot Encoding 生成的向量非常稀疏，需要通过上下文关系使用 word embedding 技术降维．而在本文中域名之间并不存在上下文关系，因此使用 word embedding 技术降维方法生成的向量也就无法体现出域名该有的特征信息。

word-hashing技术，将所有域名字符串使用二元语法( bigram) 表示，然后将生成的 bigram 字符串利用词袋模型( Bag-of-words model) 表示，把域名映射到高维向量空间．向量空间的维度就是不同 bigram 字符串的个数，每一个维度对应一个bigram 字符串，域名向量中每个维度的数值就是域名在该维度对应 bigram 字符串出现的个数．使用 bigram 的好处是可以保存很多域名语义相关的信息，例如相连的辅音元音前后关系，双元音都可以包含在一个 bigram 中，同时域名 bigram 的个数也反映了域名的长度．

模型分析：这是一个典型 DNN 结构，输入为域名的二级域名标签( 后面如无特殊说明，域名将特指域名的二级域名标签) ，如域名“www． taobao． com ”， “taobao”是二级域名标签．第 1 个隐藏层用于 word-hashing 处理，将域名转换成高维稀疏向量，这是一个线性变换．由于词袋模型生成向量空间维度由 bigram 字符串个数决定，因此该层节点个数会根据训练集的大小变化．第 2 ～ 4 隐藏层分别包含 512，128，128 个神经元，隐藏层采用 ReLU 激活函数．最后一层，一个 sigmoid 激活函数负责输出分类．该深度检测模型包含大量的神经元和参数，所以本文使用了 Dropout 正则化技术来提高模型的泛化能力．

结果：准确率有较小的提升。

二、A LSTM based framework for handlingmulticlass imbalance in DGA botnet detection

解决的问题：

LSTM容易出现多类不平衡问题，这在DGA恶意软件检测中变得更加重要。这是由于许多DGA类在训练数据集中只有很少的支持。提出了一种新颖的LSTM.MI算法来组合二元和多类分类模型，其中原始LSTM适合对成本敏感。将成本项目引入反向传播学习过程，以考虑类别之间的识别重要性。直接引入反向传播学习机制，成本比由γ参数控制。我们表明，改变γ会导致决策边界的变化。这些现象可以解释为重新采样训练数据集。

一大堆以前的DGA分类的介绍之后，讲述其分类都是回溯性的，需要几个小时才能使域集群达到最低阈值以获得良好的性能。本文使用两类语言属性的实时DGA检测。即有意义的字符比例和n-gram正态分数。、

(a) LSTM memory block with onlyone cell; (b) the LSTM.MI algorithm.

LSTM旨在最小化网络相对于k输出神经元和目标tk的实际输出yk的成本函数（我们假设softmax）：

实验表明，对成本敏感的LSTM更适合替代成本不敏感的LSTM，提取表征给定域名的各种功能。这些功能不是手工制作的，因此难以绕开对手。据观察，它优于RUSBoost，过采样和阈值移动方法。这些观察结果为分析LSTM.MI算法的各种特性提供了有价值的见解，LSTM.MI算法能够实现更高的HMM，C5.0，LSTM，成本敏感的SVM，成本敏感的更高的宏观平均F1分数C4.5和加权极限学习机在多类失衡数据集上。这种技术与LSTM共享一些重要特性，使其适用于直接应用。

在LSTM.MI中，二元和多类成本敏感的LSTM一起工作。其基本动机是保持流行的非DGA类的高准确性，同时增加其他DGA类的宏观平均F1分数。LSTM.MI对于多类不平衡问题是最有效的。它还能够保持Alexa（非DGA）类的高精度（0.9816）和回忆（0.9881）。 CS-NN，CS-SVMCS-C4.5，WELM和C5.0都不如原来的LSTM和LSTM.MI.

对成本敏感的LSTM：cost-sensitive LSTM

原LSTM平等对待所有样品（见方程（1）

）。因此，它对于阶级失衡问题（class imbalance problem）自然很敏感。这种算法偏向于流行的类别，限制了其在训练数据中以非常小的代表性检测DGA家族的能力。成本敏感的学习在现实世界的数据挖掘应用中起着至关重要的作用，并提供了处理类不平衡问题的手段。受成本敏感C4.5 的成功启发，Jiang等人介绍了实例加权方法来诱导成本敏感的贝叶斯网络分类器，试图最小化整体错误分类成本。

在文献中，可以设计一个将成本不敏感LSTM转换为成本敏感的“包装器”。实现这一目标的最常见方法是使用过采样或欠采样来重新平衡训练数据。过采样复制小类中的样本。这是耗时的，可能导致模型建筑过度配合。欠采样需要较短的训练时间。它可能会丢失关键信息，涉及流行的类别。 Zhou和Liu观察到重采样对于处理多类任务的类不平衡是没有帮助的。阈值移动操作LSTM输出通过对给予小分类学习的相对较高的影响。决策超平面是使用原始训练数据构建的，而成本本身仅在测试阶段引入。另一方面，AdaBoost.M1是一种方法，它能够提高任何分类器的性能，只要分类器比随机猜测更好。该算法是以准确性为导向的，并且与其他技术的结合解决了多种处理多类不平衡的提议。特别是，RUSBoost 基于这样的想法，其中欠采样被整合到AdaBoost.M1中。RUSBoost被证明是比AdaC2，SMOTEBoost，MSMOTEBoost，UnderBagging，EasyEnsemble，BalanceCascade更好，更快，更简单的替代方案，因此成为从偏斜训练数据中学习的可行选择。

通过调整误差最小化函数来解释预期成本，引入了对神经网络的成本敏感性。尽管作者没有针对阶级失衡问题，但他们的方法不仅保持了原有的网络结构，而且加强了对重要分类的学习。受到这种开创性工作的启发，本文开发了一种算法方法，将错误分类成本直接纳入LSTM的落后过程（ directly include themisclassification costs into the LSTM's backward pass. ）。每个样本p与成本项目C [class(p), k],相关联，其中class（p）和k分别是实际和预测的类别。成本项表示分类的重要性，因此较低的值被分配给属于流行类别的样本。

从反向传播中可以看出，这样的成本项在E（t）的偏导数中是一个常数。强调训练错误较大的样本，使学习故意偏向小类。成本敏感的LSTM能够解决多类不平衡问题而无需分类解决。

其中γ∈[0,1]是一个折衷参数。γ= 1意味着C [i，i]与类别大小ni成反比。小型和流行类别的数量重新平衡为1：1：...：1的比例[35]。另一方面，γ= 0意味着成本敏感的LSTM降低到原始的LSTM，这对成本不敏感。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

DGA

DGA深度学习相关论文的相关文章

openGauss学习笔记-22 openGauss 简单数据管理-HAVING子句

文章目录 openGauss学习笔记 22 openGauss 简单数据管理 HAVING子句 22 1 语法格式 22 2 参数说明 22 3 示例 openGauss学习笔记 22 openGauss 简单数据管理 HAVING子句 H
小程序接入微信支付V3接口开发教程

前言最近做了一个小程序对接微信支付的需求查看微信支付文档还是感觉有点凌乱所以做一个统一整理供大家参考 API参考官方文档 https pay weixin qq com wiki doc apiv3 open pay chapte
EF Core 7.0 使用教程 (VSCode命令)

第一步安装EF Core 安装指令 dotnet tool install global dotnet ef 卸载指令 dotnet tool uninstall global dotnet ef 不可以重复安装会出现问题我这里是日语

随机推荐

用ChatGPT 处理复杂 Excel 数据并进行数据分析

用ChatGPT 处理复杂 Excel 数据的方法由于目前 ChatGPT 还不支持上传文件以及对大数据量的处理所以我们只能换一种思路结合 Excel 和 ChatGPT 的协作整体思路我们告诉 ChatGTP 我们想要实现什么样的
linux：通过端口查对应的服务/应用的位置

1 根据端口查看对应的进程 lsof i port 2 根据进程号PID查看对应的应用 ps axu grep PID 3 根据应用名称查所在位置 find name 应用名称 4 根据进程号PID查看对应的端口 netstat anp g
c盘中可以删除的文件有哪些？

win7系统很占用空间所以说如果你的c盘空间不够强大的话是无法承载win7系统的但是即便是安装了win7系统我们也可以对c盘的空间进行优化下面小编就来告诉大家 c盘中可以删除的文件有哪些打开c盘我们可以看到里面的组织构架里
GW1NSR-LV4CQN48GC6/I5 FPGA呼吸灯

环境 pwm v cat pwm v module Pwm input clk input 31 0 period input 31 0 duty output pwmout reg 31 0 counter reg r pwmout al
iframe+ajaxSubmit结合--续篇(判断图片(文件)大小，上传图片，验证码刷新）

人们似乎慢慢遗忘了iframe 毕竟在ajax未诞生前都是用iframe来实现无刷新的效果当请教iframe实现无刷新知识时他们说从来没用过 iframe是什么无奈只有自己摸索毕竟我属入门级别下面的方法从效率上好不好我也说不
傻瓜式学习webpack（五）——css的抽离和html的自动引入js/css

一以前面四篇文章为基础我们接下来利用webpack进行css的抽离这里需要安装一个插件在安装之前首先要说明一下如果没有第四篇文章为前提也就是图片没有进行处理的话在抽离css的时候它将无法解析css中的url 所以在抽离之前
Linux svn server 给指定文件夹设置相应的读写权限

简介在使用Linux搭建SVN服务器的时候需要给仓库中不同的文件夹设置不同的权限 1 在svn目录中有Dan和Mango两个文件夹 2 进入svn conf目录下使用vim命令 vi authz配置的authz权限 3 输入相应的指令
第七课旋转物体

类似于平移在内容编辑器中的transform rotation更改即可这样精确
JWT 创建Token 提示:secret key byte array cannot be null or empty.

使用JWT生成Token提示 java lang IllegalArgumentException secret key byte array cannot be null or empty 详细错误信息 java lang Illegal
Java面试题（十九个模块）面试必备

关注我带了熟悉Java趣事 Java进阶攻略等着你本文分为十九个模块分别是 Java 基础容器多线程反射对象拷贝 Java Web 异常网络设计模式 Spring Spring MVC Spring Boot Spring
Batch Gradient Descent(python)

import numpy as np import tensorflow as tf def GradientDescent x y theta m n x shape m is training example while n is fe
金蝶牵手IBM也许是个灾难

从去年6月开始金蝶用友与微软 IBM SAP ORACLE 等等陷入了n方收购传闻前几天终于有了消息金蝶接受ibm与雷曼兄弟的投资因本人对金蝶和用友的公司与产品比较的熟悉所以我认为对金蝶也许不是一件好事大家都知道ibm的核心是j
关于APP弱网测试

一网络测试的一般流程 step1 首先要考虑网络正常的情况各个模块的功能正常可用页面元素数据显示正常 step2 其次要考虑无网络的情况 APP各个功能在无网络情况下是否可用 APP各个页面之间切换是否正常发送网络请求时是否会导致
Base64 —— 编码/解码

Base64是基于64个字符来表示二进制数据的方法由于2的6次方等于64 所以每6位为一个字符对应某个字符在Base64中的表示字符包括A Z a z 0 9 这样共有62个字符从左往右依次代表0 61 剩下两个字符代表62 代表
做期货的阶段(做期货的几个阶段)

如何自己做好期货学习交易大致有三阶段直观直觉阶段看到涨就做多看到跌就做空结果半赢半输学习积累的阶段看到涨跌不觉涨跌想得很多结果赢少赔多领悟后再次直观直觉的阶段看到涨还是涨于是做多看到跌还是跌于是做空终于赢比输多这
ae在哪里直接复制合成_AE如何复制同一合成下图层的效果到另一个图层上

如何把一个图层的动画效果等属性比如缩放位移动画模糊斜面阴影径向擦除等复制到同一合成下的另一个图层上呢 1 合成里面有一个素材01和素材02 素材01上面有效果控件和缩放位移动画而02上面没有任何效果和动画现在想把01里面的效
Linux 内核编译报错及解决办法记录

Linux 内核编译报错及解决办法记录 Can t use defined array Maybe you should just omit the defined at kernel timeconst pl line 373 根据错误的
UCGUI做汉字显示

1 弄个包含中文的字体在这里我借用大多数例子里的 C windows Font simhei ttf 文件把这个文件拷贝到Datafiles文件夹的Font文件夹里 2 随便照着一个 Font文件自己写一个simhei font文件
java/poi 调整Excel 列宽支持自适应中文字符宽度

apache poi是apache旗下用于读写Microsoft Office 二进制文件和OOXML 格式文件的开源库用它来进行excel文件的导出是很趁手的一般来说可以直接使用 Sheet autoSizeColumn方法自动调整每
DGA深度学习相关论文

一基于 word hashing 的 DGA 僵尸网络深度检测模型 2017 主要贡献基于word hashing 将所有域名转用二元语法字符串表示利用词袋模型把域名映射到高维向量空间然后利用5 层深度神经网络对转换为高维向量的

DGA深度学习相关论文

DGA深度学习相关论文 的相关文章

随机推荐

热门标签

DGA深度学习相关论文的相关文章