查看原文
其他

使用深度神经网络对 Twitter进行威胁检测 | 网络科学论文速递16篇

ComplexLY 集智俱乐部 2019-09-14



心速递


  • 使用深度神经网络对 Twitter 进行威胁检测;

  • 亲和力:一种用于短信数据的潜在用户相似性比较系统;

  • 纠缠引发的网络分岔的涌现;

  • 美国城市在线约会市场结构;

  • 半监督图标记显示美国国会的党派关系日益增长;

  • 重复囚徒困境博弈中有观察错误时强制线性回报关系的策略;

  • arXiv 与物理预印本和期刊评论文章的共生:一个模型;

  • 代表委员会集体选择的网络社会算法分析;

  • 关于可再生能源互补性的评论:概念,指标,应用和未来研究方向;

  • 耦合 Stuart-Landau 振子的新型跃迁和 Bellerophon态;

  • 疏散中的哭狼效应:一种博弈论方法;

  • 无监督的 Twitter 用户立场检测;

  • 多路网络和时间网络中基于特征向量的可调中心性;

  • 稀疏 Twitter-Sphere 中药物滥用检测的集成深度学习模型;

  • 层级可导航小世界图的比较研究;

  • 根据国家消费数据估算国家特定的空间加热阈值温度;



使用深度神经网络

对Twitter进行威胁检测


原文标题: 

Cyberthreat Detection from Twitter using Deep Neural Networks

地址: 

http://arxiv.org/abs/1904.01127

作者: 

Nuno Dionísio, Fernando Alves, Pedro M. Ferreira, Alysson Bessani


摘要: 为了做好应对网络攻击的准备,大多数组织都采用安全信息和事件管理系统来监控其基础设施。这些系统取决于网络威胁情报源提供的最新更新,补丁和威胁的及时性和相关性。开源智能平台,即 Twitter 等社交媒体网络,能够汇集大量与网络安全相关的资源。为了处理此类信息流,我们需要可扩展且高效的工具,能够识别和汇总指定资产的相关信息。


本文介绍了一种新工具的处理流程,该工具使用深度神经网络处理从 Twitter 收到的网络安全信息。卷积神经网络识别包含与IT基础设施中的资产相关的安全相关信息的推文。然后,双向长短期内存网络从这些推文中提取命名实体以形成安全警报或填写折衷指示符。在三个案例研究基础设施中,拟议的管道实现了分类任务的平均94%真实阳性率和91%真实阴性率以及命名实体识别任务的平均 F1 分数92%。


亲和力:一种用于短信数

据的潜在用户相似性比较系统


原文标题: 

affinity: A System for Latent User Similarity Comparison on Texting Data

地址: 

http://arxiv.org/abs/1904.01897

作者: 

Tobias Eichinger, Felix Beierle, Sumsam Ullah Khan, Robin Middelanis, Veeraraghavan Sekar, Sam Tabibzadeh



摘要: 在社会网络服务领域,基于简档数据寻找类似用户是常见的做法。智能手机包含可用于用户分析的传感器和个人上下文数据。然而,一个巨大的个人数据来源,即短信数据,几乎没有被用于用户分析的研究。我们认为有三个原因:首先,私人短信数据由于其亲密的特点而不能共享。其次,适当保护隐私的相似性度量的定义是非平凡的。第三,评估表示潜在无限主题集的文本消息数据的相似性度量的质量是非平凡的。



为了克服这些障碍,我们提出了亲和力,这是一种以隐私保护的方式可靠且有效地评估用户的文本消息历史之间的相似性的系统。私人短信数据保留在用户设备上,并且用于比较的数据以潜在格式进行比较,该潜在格式既不允许重建比较单词也不允许重建任何原始私有纯文本。我们通过计算60位美国参议员的Twitter历史之间的相似性来评估我们的方法。由此产生的相似性网络在政党分类任务中达到平均85.0%的准确率。



由纠缠引发的网络分岔涌现


原文标题: 

Emergence of Network Bifurcation Triggered by Entanglement

地址: 

http://arxiv.org/abs/1609.03299

作者: 

Xi Yong, Man-Hong Yung, Xue-Ke Song, Xun Gao, Angsheng Li


摘要: 在许多非线性系统中,如等离子体振荡,玻色子凝聚,化学反应,甚至是捕食 - 猎物振荡,粗粒度动力学由含有反对称跃迁的方程控制,称为反对称Lotka-Volterra (ALV)方程式。在这项工作中,我们证明了 ALV 方程的新分叉机制的存在,其中通过翻转一对固定点的稳定性可以极大地改变平衡状态。作为一种应用,我们关注分叉机制对演化网络的影响;我们发现分叉点可以通过微观量子纠缠来定量确定。


平衡状态可以从一种类型的全球人口凝聚转变为支持同质网络全球合作的另一种状态。换句话说,我们的结果表明存在一类多体系统,其中宏观性质与一定量的微观缠结不变,但是一旦缠结超过临界值,它们就会突然改变。此外,我们提供的数值证据表明,分岔的出现对网络拓扑的变化具有鲁棒性,并且临界值与我们的理论预测非常一致。这些结果表明,除了演化网络之外,分叉机制在许多物理系统中无处不在。



美国城市在线约会市场结构


原文标题: 

Structure of online dating markets in US cities

地址: 

http://arxiv.org/abs/1904.01050

作者: 

Elizabeth E. Bruch, M. E. J. Newman


摘要: 我们通过分析大型在线约会网站的数百万用户的交互,将最近开发的网络分析方法应用于用户之间交换的消息模式,研究了美国异性恋约会市场的结构。我们的分析表明,在国家层面上浪漫互动的最强驱动力是简单的地理邻近,但在地方层面,其他人口因素也起到了作用。


我们发现每个城市的约会市场都按照年龄和种族划分为子市场。不同子市场之间的性别比例差别很大,年轻的子市场男性比老年人更多,女性更少。少数群体,特别是女性,也比年龄较大的子市场中的平均水平更年轻,我们的分析揭示了这种种族分层是如何通过男性和女性的信息传递决定产生的。我们的研究说明了网络技术如何应用于在线互动可以揭示个人行为对社会结构的总体影响。



半监督图标记显示美国

国会的党派关系日益增长


原文标题: 

Semi-supervised graph labelling reveals increasing partisanship in the United States Congress

地址: 

http://arxiv.org/abs/1904.01153

作者: 

Max Glonek, Jonathan Tuke, Lewis Mitchell, Nigel Bean


摘要: 图标记是网络科学的一项关键活动,具有广泛的实际应用,并与其他网络科学任务密切相关,如社区检测和聚类。虽然无监督和监督标记算法都存在大量工作,但是基于随机游走的监督算法需要进一步探索,特别是考虑到它们与社会和政治网络的相关性。


这项工作改进并扩展了一种新的半监督图标记方法,GLaSS 方法,精确计算连通图上随机游走的吸收概率。该方法将图精确地描绘为离散时间马尔可夫链,将标记节点视为吸收状态。该方法适用于1935年至2019年美国众议院和参议院42次会议的唱名表决数据。对84个结果政治网络的分析表明,在估算图中未标记节点的标签时,GLaSS 具有强大而一致的性能,并揭示了美国国会中日益增加的党派关系的重要趋势。



重复囚徒困境博弈中有观察

错误时强制线性回报关系的策略


原文标题: 

Strategies that enforce linear payoff relationships under observation errors in Repeated Prisoner’s Dilemma game

地址: 

http://arxiv.org/abs/1904.01208

作者: 

Azumi Mamiya, Genki Ichinose


摘要: 重复博弈理论分析了互动玩家的长期关系,并在数学上揭示了合作如何实现的条件,这在一次性博弈中是不可能实现的。在没有错误的重复囚徒困境(RPD)博弈中,零决定因素(ZD)策略允许玩家单方面设置玩家自己的收益与对手的收益之间的线性关系,而不管对手实施的策略如何。相比之下,ALLD 和    ALLC 等无条件策略也单方面设定线性支付关系。


现实世界中的玩家之间经常会发生错误。然而,对 RPD 博弈中存在错误的此类策略的存在知之甚少。在这里,我们分析性地搜索在 RPD 博弈中的观察错误下强制执行线性支付关系的策略。结果,我们发现,即使在观察错误的情况下,强制执行线性支付关系的唯一策略集是 ZD 策略或无条件策略,这些策略在数字上得到确认。此外,我们推导出无条件策略的预期收益的可行范围。



arXiv与物理预印本和期

刊评论文章的共生:一个模型


原文标题: 

arXiv and the Symbiosis of Physics Preprints and Journal Review Articles: A Model

地址: 

http://arxiv.org/abs/1904.01470

作者: 

Brian Simboli


摘要: 本文推荐了一种有助于实现物理出版改革目标的出版模型。它区分了学术交流中的两个互补需求。预印本在科学中越来越重要,它恰当地成为声称优先发现和引出有助于版本控制的反馈的工具。然而,传统期刊出版应侧重于以覆盖期刊的形式提供综合,这些期刊与评论文章起着相同的作用。



代表委员会集体选择

的网络社会算法分析


原文标题: 

Analysis of a networked social algorithm for collective selection of a committee of representatives

地址: 

http://arxiv.org/abs/1904.01602

作者: 

Alexis R. Hernandez, Carlos Gracia-Lazaro, Edgardo Brigatti, Yamir Moreno


摘要: Hern andez 等人最近的一项工作。引入了由基于信任的社会网络支持的网络投票规则,其中可能的代表的指示基于个人意见。个人捐款不仅仅是简单的计票,而是基于主体投票。这些机制产生了所选委员会的高度代表性,削弱了赞助关系的可能性。通过结合个人的完整性及其感知,我们在此处讨论了由此产生的委员会的可信性问题。我们的结果表明,该投票规则为具有高度完整性的小型委员会提供了很高的代表性。此外,投票系统显示对投票算法的战略和不真实应用的鲁棒性。



关于可再生能源互补性评论:概

念,指标,应用和未来研究方向



原文标题: 

A review on the complementarity of renewable energy sources: concept, metrics, application and future research directions

地址: 

http://arxiv.org/abs/1904.01667

作者: 

J. Jurasz, F.A. Canales, A. Kies, M. Guezgouz, A. Beluco


摘要: 预计并且在区域内观察到,可再生能源的广泛部署将很快涵盖能源需求。然而,天气和气候驱动的能源的特征在于显著的空间和时间变化。克服可再生能源提供的供需之间不匹配的常用解决方案之一是在单个发电站(如风能 - 太阳能,太阳能 - 水能或太阳能 - 风能 - 水力发电站)中两个或多个能源的混合。混合能源的运作基于可再生能源的互补性质。


考虑到此类系统日益增长的重要性以及该领域越来越多的研究活动,本文对研究,分析,量化和利用可再生能源之间时空,空间和时空互补效应的研究进行了全面回顾。审查首先简要概述了现有的研究论文,制定了主要概念的详细定义,总结了当前的研究方向,并结束了未来的未来研究活动。该评价提供了关于互补概念研究的时间和空间信息。



耦合Stuart-Landau振子

的新型跃迁和Bellerophon态


原文标题: 

Novel transition and Bellerophon state in coupled Stuart-Landau oscillators

地址: 

http://arxiv.org/abs/1904.01776

作者:

Jiameng Zhang, Xue Li, Yong Zou, Shuguang Guan


摘要: 我们研究了具有频率加权耦合的 Stuart-Landau 振荡器系统中的同步。对于三个典型的单峰频率分布,即洛伦兹,三角和均匀,我们发现当频率分布相对紧凑时发生一阶跃迁,而当相对宽度时同步跃迁是连续的。在这两种情况下,在非相干状态和同步状态之间存在贝勒罗芬状态。


值得注意的是,我们揭示了具有振幅的这种耦合振荡器的新型过渡行为,即,Bellerophon 状态的状态实际上包含两个阶段。在第一阶段,振荡器实现混沌相位同步;而在第二阶段,振荡器形成周期性的相位同步。我们的结果表明,Bellerophon 状态也存在于具有振幅动力学的耦合振荡器中。



疏散中的哭狼效应

:一种博弈论方法


原文标题: 

The Cry Wolf Effect in Evacuation: a Game-Theoretic Approach

地址: 

http://arxiv.org/abs/1904.01963

作者: 

Alexandros Rigos, Enrico Ronchi, Erik Mohlin


摘要: 在今天的恐怖主义和以安全为中心的世界中,疏散紧急情况,演习和误报正变得越来越普遍。在紧急情况下,当局对撤离令的遵守情况可以在紧急情况的结果中发挥关键作用。如果撤离人员经历重复的紧急情况,可能是误报(例如,疏散演习,假炸弹威胁等)或实际威胁,伊索的哭狼效应(重复误报警减少订单合规性)会严重影响他/她撤离的可能性。为了分析这个关键的未解决的疏散研究问题,提出了一种博弈论方法。


博弈论用于探索撤离者和权威的相互最佳反应。在提议的模型中,当局获得是否存在威胁的信号,并决定是否下令疏散。撤离人员在收到撤离令后,随后根据后来的信念决定是留下还是离开,这些信念是根据当局的行动而更新的。推导出最佳响应,并使用顺序均衡和完美贝叶斯均衡作为解决方案概念(用直觉标准精炼均衡)。模型结果突出了宣布的疏散演习的好处,并表明提高威胁检测的准确性可以防止与狼狼效应相关的大量低效率。



无监督的Twitter用户立场检测


原文标题: 

Unsupervised User Stance Detection on Twitter

地址: 

http://arxiv.org/abs/1904.02000

作者: 

Kareem Darwish, Peter Stefanov, Michaël J. Aupetit, Preslav Nakov


摘要: 我们提出了一种非常有效的无监督方法,用于检测 Twitter 用户对有争议话题的立场。特别是,我们使用降维来将用户投影到低维空间,然后进行聚类,这使我们能够找到代表不同立场的核心用户。我们的方法与目前最先进的方法相比具有三个主要优点,这些方法基于监督或半监督分类。


首先,我们不需要事先对用户进行任何标记:相反,我们创建群集,之后手动标记更容易,例如,在几秒或几分钟而不是几小时。其次,不需要域或主题级知识来指定相关的立场(标签)或进行实际标签。第三,我们的方法在面对数据偏斜时是稳健的,例如,当某些用户或某些站点在数据中具有更大的表示时。


我们尝试了用户相似度特征,数据集大小,降维方法和聚类算法的不同组合,以确定跨三个不同数据集(英语和土耳其语)的最有效和计算效率最高的组合。我们在有效性和效率方面的最佳组合使用转发的帐户作为功能,UMAP 用于降维,以及用于群集的 Mean Shift ,并产生少量高质量用户群,通常只有2-3个,超过98%纯度。此外,我们的方法对于参数值的变化以及随机初始化也是鲁棒的。



多路网络和时间网络中

基于特征向量的可调中心性


原文标题: 

Tunable Eigenvector-Based Centralities for Multiplex and Temporal Networks

地址: 

http://arxiv.org/abs/1904.02059

作者: 

Dane Taylor, Mason A. Porter, Peter J. Mucha


摘要: 表征社会,生物,信息和技术网络中节点的重要性是网络科学和数据科学界的核心主题。我们提出了一个线性代数框架,它推广了基于特征向量的中心 - 包括 PageRank  —-为两个流行的多层网络类提供了一个通用框架:具有编码不同类型关系的层的多路网络和其中关系的时间网络时间的变化。


我们的方法涉及研究联合,边际和条件超中心性,这些超中心性可以从超中心矩阵的主要特征向量中获得[Taylor et al。,2017],其耦合与各个网络层相关联的中心矩阵。我们通过允许层通过(可能是不对称的)层间邻接矩阵耦合来扩展这个先前的工作(限于具有通过无向,时间相邻耦合的层的时间网络)  tilde  bf A ,其中每个条目给出层 t 和 t’之间的耦合。我们的框架为多重和/或时间网络的中心性分析提供了统一的基础,并揭示了超中心性对层间耦合拓扑的复杂依赖性。


我们通过耦合强度  omega  ge0 来扩展  tilde  bf A ,并针对弱(  omega  to0 ^ + )和强耦合(  omega)的极限开发奇异摄动理论 to  infty ),揭示了对  tilde  bf A 的主要特征向量的有趣依赖。我们将该框架应用于两个经验数据集:欧洲航空运输的多重网络表示,以及编码美国大学和数学院数学家毕业和雇用的时间网络。



稀疏Twitter-Sphere中药物

滥用检测的集成深度学习模型


原文标题: 

An Ensemble Deep Learning Model for Drug Abuse Detection in Sparse Twitter-Sphere

地址: 

http://arxiv.org/abs/1904.02062

作者: 

Han Hu, NhatHai Phan, James Geller, Stephen Iezzi, Huy Vo, Dejing Dou, Soon Ae Chun


摘要: 随着美国药物滥用问题的加剧,许多主要利用社交媒体数据(如 Twitter 上的帖子)研究药物滥用相关活动的研究将机器学习作为文本分类和过滤的有力工具。然而,鉴于 Twitter 用户的广泛主题,与大多数数据集中的药物滥用相关的推文很少见。这种不平衡的数据仍然是构建有效的推文分类器的主要问题,对于包含与滥用相关的俚语术语的研究尤其明显。


在本研究中,我们通过设计一个集合深度学习模型来解决这个问题,该模型利用单词级和字符级功能来对与滥用相关的推文进行分类。在 Twitter 数据集上报告实验,我们可以在其中配置两个类别(滥用与非滥用)的百分比,以模拟具有不同幅度的数据不平衡。结果表明,我们的集成深度学习模型比传统机器学习模型的集合表现出更好的性能,特别是在严重不平衡的数据集上。


层级可导航小世界图比较研究


原文标题: 

A Comparative Study on Hierarchical Navigable Small World Graphs

地址: 

http://arxiv.org/abs/1904.02077

作者: 

Peng-Cheng Lin, Wan-Lei Zhao


摘要: 自两年前发布源代码以来,分层可导航小世界(HNSW)图在大规模最近邻搜索任务中越来越受欢迎。这种方法的吸引力在于其优于大多数最近邻搜索方法的性能以及其对各种距离测量的通用性。


在本文中,对这种搜索方法进行了几项比较研究。研究了层次结构在 HNSW 中的作用以及 HNSW 图本身的作用。我们发现 HNSW 中的层次结构无法实现本文所声称的“更好的对数复杂度尺度”,特别是在高维数据上。此外,我们发现在图多样化之后,在平面 k-NN 图的支持下,可以实现与 HNSW 类似的高搜索速度效率。最后,我们指出大多数基于图的搜索方法所面临的困难与“维度的诅咒”直接相关。与其他基于图表的方法一样,HNSW 无法解决这种困难。



根据国家消费数据估算国

家特定的空间加热阈值温度


原文标题: 

Estimating country-specific space heating threshold temperatures from national consumption data

地址: 

http://arxiv.org/abs/1904.02080

作者: 

Smail Kozarcanin, Gorm Bruun Andresen, Iain Staffell


摘要: 建筑物中的空间加热正在成为部门耦合能源系统研究的关键要素。数据可用性限制了建筑行业建模的努力,因为大多数国家没有直接计量热量消耗。空间加热通常与使用特定加热阈值温度的加热度 - 天数代表天气有关,但研究之间的方法不同。该研究使用广泛和公开的消费和天气数据估算国家特定的加热阈值温度。这允许在能源系统建模中捕获国家气候和文化特定的人类行为。


国家电力和天然气消费数据通过线性模型与度日相关,Akaike 的信息标准用于定义每个国家的夏季,当不需要空间供暖时。我们发现使用每日,每周和每月汇总消费数据计算的加热阈值温度在统计上无关紧要。一般来说,燃气加热的临界温度约为15.0 +/- 1.7摄氏度(日平均温度),而电加热平均温度为13.4 +/- 2.4摄氏度。我们发现6月,7月和8月期间没有空间供暖的迹象即使存在加热度日。



来源:网络科学研究速递

编辑:孟婕

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。



近期网络科学论文速递


解开狗行为中的语言模式等9篇

对科学的消极态度源于过度自信 等17篇

社区检测的精确“没有免费午餐”定理 等14篇

用于维基百科研究的图结构数据集 等10篇

新型异构图注意网络 等24篇

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存