共享汽车匹配算法如何导致司收入的巨大差异 | 网络科学论文速递12篇

集智俱乐部 2019-09-14

核心速递

共享乘车匹配算法会产生收入不平等;
Airbnb、酒店和食品行业的饱和：多尺度 GWR 方法;
社交卡片可能提供对 Web 存档集合的更好理解;
巴西城市枪械凶杀案的尺度率特征;
电动汽车及其对网络负荷的影响;
近视反馈的自适应影响最大化;
HyperBagGraph DataEdron：多媒体数据集的丰富浏览体验;
超越个性化：创造者平等和消费者满意的社会内容推荐;
使用子图计数的网络样本的统计推断;
他们不想要什么：对英国脱欧第一轮指示性投票的分析;
理解公共交通网络中数据约简的有效性;
自动清除在线约会欺诈;

共享乘车匹配算
法会产生收入不平等

原文标题：

Ride-share matching algorithms generate income inequality

地址：

http://arxiv.org/abs/1905.12535

作者：

Eszter Bokányi, Anikó Hannák

摘要： 尽管 Uber，Lyft 或 Foodora 等在线共享经济平台有可能使劳动力市场民主化，但这些服务往往被指责助长了不公平的工作条件和低工资。研究人员和监管机构已经认识到这些问题，但这些社会技术系统的规模和复杂性加上缺乏算法实践的透明度，使得难以理解系统动力学和大规模行为。本文结合复杂系统和算法公平的方法，研究算法设计决策对乘车市场中工资不平等的影响。

我们首先提出一个计算模型，其中包括有关驾驶员和乘客位置，交通，城市布局以及与驾驶员匹配请求的算法的条件。我们使用来自经验数据的参数校准模型。我们的模拟显示，系统参数的微小变化可能导致驾驶员收入分配的巨大偏差，从而导致高度不可预测的系统，该系统通常将相当不同的收入分配给同样执行的驾驶员。正如最近关于算法系统中反馈回路的研究所表明的那样，这些初始收入差异可能导致强制性和长期工资差距。

Airbnb，酒店和食品行
业的饱和：多维 GWR 方法

原文标题：

Airbnb, hotels, and saturation of the food industry: A multi-scale GWR approach

地址：

http://arxiv.org/abs/1905.12543

作者：

Zahratu Shabrina, Boyana Buyuklieva, Matthew Ng Kok Ming

摘要： 本文评估了食品行业与当地临时住宿差异（缩写为 TAs，包括酒店和短期租赁）之间的关系。目的是捕捉当地统计数据的差异，并精确定位伦敦的食品和饮料（F＆B）存在与 TA 高度相关的区域。我们使用 OLS 解释现象，并将结果与本地模型 - 地理加权回归（GWR）和多尺度 GWR（Fotheringham等，2017）进行比较，允许使用不同的最佳带宽，而不是假设关系在同一时间变化空间尺度。

给出了比较结果，结果表明 GWR 模型比普通最小二乘（OLS）显著改善，将R平方从0.28增加到0.75。 MGWR 进一步改进模型估计，将 R 平方增加到0.77，表明关系发生在不同的空间尺度。最后，作为对餐饮业的估计，酒店似乎在高度集中的商业和交通联系功能方面表现更好，而 Airbnb 似乎在靠近主流旅游景点的高度住宅区表现更好。总的来说，本文描述了 MGWR 方法在地方是空间分析过程的一个重要方面的情况下的使用。

社交名片可能提供对
网络文档集的更好理解

原文标题：

Social Cards Probably Provide For Better Understanding Of Web Archive Collections

地址：

http://arxiv.org/abs/1905.11342

作者：

Shawn M. Jones, Michele C. Weigle, Michael L. Nelson

摘要： 由各种研究人员使用，网络档案馆藏已成为宝贵的证据来源。如果研究人员看到他们没有创建的网络档案馆藏，他们如何知道什么是内部的，以便他们可以将其用于自己的研究？搜索引擎结果和社交媒体链接表示为代理，底层页面的易于消化的小摘要。搜索引擎和社交媒体具有不同的焦点，因此产生与网络档案不同的代理。搜索引擎代理帮助用户回答“这个链接是否满足我的信息需求？”社交媒体代理人帮助用户决定“我应该点击这个吗？”我们的用例略有不同。

我们假设一组代理人一起用于总结一个集合。我们希望帮助用户回答“基础集合包含什么？”的问题。但是我们应该使用哪种代理？通过 Mechanical Turk 参与者，我们可以相互评估六种不同的代理类型。我们发现代理的类型不影响完成我们向参与者呈现的任务的时间。特有用的是社交名片，通常在社交媒体上找到的代理人，以及浏览器缩略图，在浏览器中呈现的网页的屏幕截图。

分别为 p = 0.0569 和 p = 0.0770 ，我们发现与浏览器缩略图并排配对的社交名片和社交名片可能比流行的 Archive-It 网站目前使用的代理提供更好的收藏理解归档平台。我们衡量用户与每个代理人的互动，并发现用户与社交名片的互动少于其他类型。这项研究的结果对我们的 Web 档案摘要工作，实时网络策划平台，社交媒体等有影响。

巴西城市枪械凶
杀案的尺度率特征

原文标题：

Scaling properties of firearm homicides in Brazilian cities

地址：

http://arxiv.org/abs/1905.11483

作者：

Airton Deppman

摘要： 最近研究城市生活和基础设施若干方面的定量方法表明，规模属性可以让人们了解城市基础设施和城市人类活动的许多特征。我们在这项工作中，针对巴西城市枪械凶杀案的数据进行了基于城市网络复杂性的分析。由于巴西人口和城市的多样性，这是对最近提出的理论的有趣测试。我们获得了作为城市人口函数的凶杀案数量的超线性幂律行为，其指数为 β = 1.15 。测试了分形结构可以在城市以及大型网络中形成的假设，表明在连接多个城市的网络中确实可以发现自相似性。

电动汽车及其对网络负荷的影响

原文标题：

Electric Vehicles and their Effect on Network Load

地址：

http://arxiv.org/abs/1905.11654

作者：

Victor L. Knoop

摘要： 公路车队的组成正在从燃料动力车转变为插电式混合动力车（PHEV）和电动车（EV）。这些车辆的（电气）范围是有限的，导致所谓的“范围焦虑”。首先，这导致了较短路线的偏好。其次，（PH）EV 具有从制动再生能量的能力，这使得具有许多加速和减速的路线对于（PH）EV 的驾驶员而言不如对于具有内燃机（ICE）的车辆的驾驶员那样不具吸引力。

本文结合了这一点，并且由于能耗较低，增加驾驶员可能更喜欢较低的速度限制。将这些元素与道路特征进行比较。结果发现，与ICE车辆驾驶员相比，高速公路通常不太适合（PH）EV 的驾驶员，他们更喜欢二级公路或城镇的较短路线。这将影响基础道路网络的使用，从而影响拥堵，排放和安全。在网络设计中需要考虑向基础道路网络的转变。

近视反馈的自适应影响最大化

原文标题：

Adaptive Influence Maximization with Myopic Feedback

地址：

http://arxiv.org/abs/1905.11663

作者：

Binghui Peng, Wei Chen

摘要： 我们在独立级联模型下研究具有近视反馈的自适应影响最大化问题：从社会网络逐个顺序地选择k个节点作为种子，并且每个选择的种子返回它激活的直接邻居作为可用于以后选择的反馈，并且目标是最大化预期的激活节点总数，称为影响范围。我们证明了自适应差距，即最优自适应影响扩散与最优非自适应影响扩散之间的比率，最多为4且至少为 e /（e-1），并且相对于最佳自适应影响的近似比率非自适应贪婪和自适应贪心算法的传播至少是，最多是。此外，当考虑所有图时，非自适应贪婪算法的近似比率不比自适应贪婪算法的近似比率差。我们的结果证实了 Golovin 和 Krause（2011）关于自适应贪婪与近视反馈的恒定近似比率的长期开放猜想，并且它还表明适应性贪婪可能不会在近视反馈下带来太多益处。

HyperBagGraph DataEdron：
多媒体数据集的丰富浏览体验

原文标题：

The HyperBagGraph DataEdron: An Enriched Browsing Experience of Multimedia Datasets

地址：

http://arxiv.org/abs/1905.11695

作者：

Xavier Ouvrard, Jean-Marie Le Goff, Stéphane Marchand-Maillet

摘要： 传统的逐字浏览器根据搜索引擎执行的排名以线性方式返回信息，该排名对于网迷可能不是最佳的。后者可能需要评估所检索信息的相关性，特别是当他想要探索多方面信息空间的其他方面时。例如，在多媒体数据集中，诸如关键词，作者，出版物类别，组织和图的不同方面可能是有意义的。方面同步可视化有助于深入了解检索到的信息并呼吁进一步搜索。

Facets 是共生网络，由 HyperBag-Graphs 建模 - 多个集合的系列，实际上不仅与出版物本身相关，而且与任何选择的参考相关联。这些引用允许在数据集内导航并执行可视查询。我们在此探讨基于 Arxiv 搜索的科学出版物的案例。

超越个性化：创造者平等
和消费者满意的社会内容推荐

原文标题：

Beyond Personalization: Social Content Recommendation for Creator Equality and Consumer Satisfaction

地址：

http://arxiv.org/abs/1905.11900

作者：

Wenyi Xiao, Huan Zhao, Haojie Pan, Yangqiu Song, Vincent W. Zheng, Qiang Yang

摘要： 现代社交媒体平台中的有效内容推荐应该有利于创作者为他们和消费者带来真正的好处，以帮助他们获得真正有趣的内容。在本文中，我们提出了一个称为社交探索注意网络（SEAN）的模型用于内容推荐。 SEAN 使用个性化内容推荐模型来鼓励个人兴趣驱动推荐。此外，SEAN 允许个性化因素在社会网络上关注用户的高阶朋友，以提高推荐结果的准确性和多样性。从流行的分散式内容分发平台 Steemit 构建两个数据集，我们将 SEAN 与最先进的 CF 和基于内容的推荐方法进行比较。实验结果证明了 SEAN 在推荐平等的基尼系数和推荐性能的 F1 得分方面的有效性。

使用子图计数的
网络样本的统计推断

原文标题：

Statistical inference for network samples using subgraph counts

地址：

http://arxiv.org/abs/1701.00505

作者：

P-A. G. Maugis, Carey E. Priebe, S. C. Olhede, P. J. Wolfe

摘要： 我们认为网络是一种观察，并且观察到的网络的集合形成了一个样本。在此设置中，我们提供了测试网络样本中的所有观察是否都是从指定模型中提取的方法。我们通过在图模型的零点下导出平均子图计数的联合渐近性质来实现这一点，因为观察到的网络数量增加但每个网络中的节点数量仍然是有限的。

在这样做时，我们不要求每个观察到的网络包含相同数量的节点，或者从同一分布中提取。我们的结果产生了子图计数的联合置信区域，因此测试网络样本中的观察是否来自指定分布，指定模型或来自与另一网络样本相同的模型的方法。我们提出模拟实验和一个关于脑网络样本的说明性例子，我们发现高度创造性的个体大脑表现出明显更短的周期。

他们不想要什么：对英国脱
欧第一轮指示性投票的分析

原文标题：

What They Don’t Want: An Analysis of Brexit’s First Round of Indicative Votes

地址：

http://arxiv.org/abs/1905.12109

作者：

Thomas Sayer

摘要： 自2016年全民公决结果以来，英国脱欧一直是一场不可预测的民主冒险，其结局仍不明朗。今年，在3月的最后几天，议员们从政府手中夺取了对命令文件的控制权，并举行了自己的指示性投票，试图打破僵局。在本文中，我们分析了这一不寻常的主要选票的结果。我们根据他们提供的“多少英国退欧”表达了各种动议，并采用蒙特卡罗试图从数据中确定这一点。

我们找到了能够重现我们对辩论的直观理解的解决方案。最后，我们使用三种不同的过程为各种 Brexit 场景构建假设的序数选票。结果表明政府会更加成功地采取更为温和的立场，我们会对此进行量化。此外，还有一些关于战术投票如何在这种情况下表现出来的讨论。

理解公共交通网络
中数据约简的有效性

原文标题：

Understanding the Effectiveness of Data Reduction in Public Transportation Networks

地址：

http://arxiv.org/abs/1905.12477

作者：

Thomas Bläsius, Philipp Fischbeck, Tobias Friedrich, Martin Schirneck

摘要： 给定站点和连接的公共交通网络，我们希望找到最小的站点子集，使得每个连接都通过选定的站点。虽然这个问题一般都是 NP 难的，但实际的实例几乎完全由一组简单的约简规则解决。为了解释这种行为，我们将交通网络视为击中集合实例并识别两个特征属性，局部性和异质性。然后，我们设计一个随机模型来生成具有可调属性的命中集实例。虽然异质性确实影响了约简规则的有效性，但生成的实例表明局部性是重要因素。除此之外，我们证明了约简规则的有效性与底层图结构无关。最后，我们证明了高位置在其他领域的实例中也很普遍，有助于快速计算最小命中集。

自动清除在线约会欺诈

原文标题：

Automatically Dismantling Online Dating Fraud

地址：

http://arxiv.org/abs/1905.12593

作者：

Guillermo Suarez-Tangil, Matthew Edwards, Claudia Peersman, Gianluca Stringhini, Awais Rashid, Monica Whitty

摘要： 在线约会诈骗是西方大众营销欺诈的一种流行形式，但很少有研究涉及技术或数据驱动的对这一问题的反应。在这种类型的骗局中，欺诈者制作虚假的个人资料并手动与受害者互动。由于这种类型的欺诈的特征以及约会网站如何运作，传统的检测方法（例如，在垃圾邮件过滤中使用的那些）是无效的。

在本文中，我们展示了对这种欺诈形式中使用的在线约会配置文件原型的多管齐下的调查结果，包括他们对人口统计，个人资料描述和图像的使用，揭示了诈骗者所采用的策略。呼吁受害者和受害者自己的特征。此外，为了应对约会欺诈造成的严重财务和心理伤害，我们开发了一个系统来检测在线约会平台上的诈骗者。我们的工作提出了第一个自动检测此欺诈的系统。我们的目标是提供一个早期检测系统，以阻止浪漫诈骗者创建欺诈性的个人资料或在他们与潜在的受害者接触之前。

之前的研究表明，浪漫骗局的受害者在理想化的浪漫信仰的尺度上得分很高。我们结合了一系列结构化，非结构化和深度学习的功能来捕捉这些信念。之前的工作没有充分分析这些浪漫概念是否会引入可用于构建检测系统的特征。我们的整体机器学习方法对于省略轮廓细节非常稳健，并且具有高精度（97％）。该系统可以为约会网站提供商和个人用户开发自动化工具。