人们可以预测你的推文 - 即使你不在Twitter上

你的朋友在Twitter上写的内容可以揭示有关你的大量信息。

iStock.com/tomass2015
人们可以预测你的推文 - 即使你不在Twitter上

公司通过将我们所说的,做的和在线看到的所有内容转化为消费者分析的实验,赚了数十亿美元。 最近,一些用户已经受够了,减少了他们对社交媒体的使用或完全删除他们的帐户。 但根据一项新的研究,这并不能保证隐私。 如果您可以链接到其他用户,他们的活动也会让您感到暴露。 现在,计算机科学家已经证明,您最近的10个联系人的Twitter流可以比您自己的流更好地预测您未来的推文。

维多利亚医科大学的计算社会科学家戴维加西亚说,“这比看起来要容易得多”,他从这种二手监视中找出了一个人的角色,他没有参与这项研究。

而不是预测任何人的实际推文,伯灵顿佛蒙特大学的研究人员使用称为熵的测量来估计一个人未来的话语是多么可预测。 更多的熵意味着更多的随机性和更少的重复。 他们查看了927个用户的Twitter流,每个用户拥有50到500个粉丝,以及每个用户最多发布推文的15个用户。 在每个人的流中,他们计算了包含的单词序列的熵。 (平均而言,推特的熵比欧内斯特·海明威的熵更多,比詹姆斯·乔伊斯少。)然后,他们将这个数字插入一个名为Fano不等式的信息理论工具,以计算一个人的流可以预测他或她下一条推文中第一个单词的效果。 。 准确度的上限平均为53%。 但预测每个连续的单词有点不太准确。

接下来,他们根据用户的流加上他们最近的15个联系人的流来计算预测的上限。 准确率上升至60%。 当他们从等式中删除用户的流时,该数字下降到大约57%。 研究人员今天在“ 自然人类行为”杂志上报告 ,这意味着,观察用户联系人的流程几乎与包括用户在内一样好 - 。 只有10个联系人的流量超过了个人自己的Twitter流的预测准确性。 为了进行比较,根据随机分类的陌生人的推文预测某人会写什么,最高准确率为51%。 (使用该人自己的推文几乎可以预测53%,因为英语和人们发推文的内容很多。)

“我们从信息理论中使用了一些非常有趣的数学来说:如果你有完美的方法,你能做得多好吗?”佛蒙特大学的数据科学家詹姆斯·巴格罗说。 英国巴斯大学的心理学家Joanne Hinds对此表示赞同。 她表示,新方法是“一种独特的方法,超越了该领域现有的大部分工作”。

Bagrow说,结果显示,原则上,人们可以大致预测甚至不在推特上的人会发推文。 实际上,这意味着找出一个人的朋友离线,然后在Twitter上找到这些朋友的信息。 但许多应用程序要求访问联系人列表 - 有些人已经知道要共享它们。 例如,Facebook已经使用用户的联系人列表来创建甚至不在网络上的人的“ ”。 研究人员已经使用人们自己的推文来预测 。 基于朋友推文的假设推文可能会有相同的推论。

Bagrow说,这项工作的一个实际限制是,它将所有单词视为同等信息,但有些人可能会比其他人更多地说出你的看法。 如果你的朋友发布了很多关于同性恋权利的信息,或者只关注共和党政客,那么这可能会特别揭示你的性取向或政治倾向。 加西亚发现,Friendster上的联系人可以预测一个人的 ,Twitter上的联系人可以预测一个人的 。 “我们几乎没有抓住以这种方式揭示何种类型信息的表面,”海因斯说。

“在隐私方面我关注的是什么,”Bagrow说,“这些大平台有很多方法可以获得我认为人们都没有意识到的数据。”人们可能不会考虑另一件事,他说:“当他们放弃自己的数据时,他们也会放弃他们朋友的数据。 我们认为社交网络中的个人选择并不是真的。“

发表评论

电子邮件地址不会被公开。 必填项已用*标注