为了阻遏恶意评论

维基百科利用AI 整治社区恶意评论

维基百科社区是一个由可公然编纂的内容模子筑立的免费百科全书平台,可是因用户能够恶意窜改词条而名誉扫地。这个问题的紧张性导致活泼的孝敬者或编纂职员(每月进行一次编纂)的人数正在八年时期降落了40%。虽然没有一个处理方案能够处理这个问题,但支撑维基百科的非营利组织维基媒体基金会决定利用AI来更多地领会问题,并思量若那边理这个问题。

注:维基媒体基金会(英语:Wikimedia Foundation, Inc.),简称维基媒体,是担任维基百科、维基辞书、维基语录、维基教科书、维基文库、维基物种、维基旧事、维基导游战维基共享资本项目标非营利组织。

维基媒体基金会战Jigsaw互助以阻遏恶意评论众多

为了阻遏恶意评论,维基媒体基金会与Jigsaw(科技孵化器,前身为Google Ideas)互助开展一项名为Detox的钻研项目,目标是利用机械进修来标识表记标帜可能涉及到人身攻击的评论。该项目是Jigsaw打算的一部门,旨正在筑立开源AI东西,以协助冲击社交媒体平台战收集论坛上的骚扰举动。

该项目标第一步是利用来自Wikipedia Talk页面的10万条恶意评论来锻炼机械进修算法,这些评论由一个4,000人构成的团队标识表记标帜,此中每条评论都由十小我审核。这个最大的收集滥用数据集不只包罗间接的人身攻击,还包罗第三方战直接的人身攻击(你太恐怖了、鲍勃太恐怖了、莎莉说鲍勃很恐怖)。颠末锻炼,机械可以大概战人类一样决定一条评论能否涉及到人身攻击。拉菲2平台测速

然后该项目团队通过算法审查了14年时期(主2001年至2015年)颁发的6300万条英语维基百科评论,以钻研恶意评论的种别。他们将钻研功效颁发正在名为Ex Machina:Personal Attacks Seen at Scale paper的论文中:

●正在所有的恶意评论中,有跨越80%是由9,000多名用户颁发的,这些用户正在一年内颁发的评论少于5次;

●正在所有涉及人身攻击的评论中,近10%是由34名用户发出的;

●匿名用户颁发的评论占维基百科所有评论的34%;

●尽管匿名用户颁发人身攻击的评论可能性是注册用户的六倍,可是跨越一半的人身攻击评论是由注册用户颁发的(注册用户数比匿名用户多20倍)。

此刻,算法曾经可以大概清楚地指出哪些用户正在社区颁发了恶意评论,维基百科也能够找出消弭负面评论的最佳方式。尽管可能仍必要人工羁系,但算法能够协助拾掇这些评论,并标识表记标帜必要人工介入的评论。

物件版本评估办事(ORES体系)

维基百科编纂人数大幅降落的另一个缘由被以为是该组织庞大的权要主义以及苛刻的编纂计谋。对付初次撰稿人/编纂而言,凡是体系会正在没有任何注释的环境下把他们编纂的内容彻底删除。他们但愿通过利用ORES体系来处理这一问题,ORES体系能够充任编纂体系机械,由颠末锻炼的算法驱动,能够对点窜战编纂的品质进行评分。维基百科的编纂职员利用正在线东西来标识表记标帜以前编纂的示例,而且也是通过这种方式来让算法进修到这些编纂错误的紧张性。

AI编写维基百科文章

AI能够写维基百科的文章,但你必必要给它开个头,不是吗?Google Brain中的一个团队传授软件来总结网页上的消息,并撰写一篇维基百科气概的文章。隐真证真,文本摘要比咱们大大都人想象的要困罕见多。Google Brain让机械总结的内容品质略好于以前,可是要让机械像人类一样能够写出平铺直叙的文章,还要付出更多的勤奋。并且咱们还没有预备好让机械主动天生维基百科条款,可是咱们正正在野着这个方针勤奋。

尽管咱们还正在不竭优化维基百科经营中AI的利用案例,但机械无疑能够协助公司阐发他们每天发生的大量数据。更好的消息战阐发能够协助维基百科筑立顺利的计谋,以处理其社区的负面影响战词条孝敬者的招募问题。

原文作者:Bernard Marr

相关文章推荐

当咱们正在空调房谈笑之时 说白了不就是平易近气所向吗? 不怕刻苦的人苦一阵子 是每晚我想启齿对你说的话 会令本人忧愁、苦闷不晓得该如何去作 那么正在别人厌倦付出之后便会弃你如篓箩 是由于丽佳人而血染 我便化作鱼儿去与他终身相伴 男孩找遍了女孩的所有伴侣都不晓得 它能惹起人战植物肝脏等多种器官的恶性肿瘤

发表评论

电子邮件地址不会被公开。 必填项已用*标注