爱范儿对话马蜂窝爆料方乎睿数据:被起诉是意料之外
旅游攻略网站马蜂窝近日被爆商业数据造假,马蜂窝表示起诉爆料的自媒体人和乎睿数据,并已立案。
马蜂窝在声明中承认部分点评造假,同时认为这次事件是「歪曲事实的言论,和已被查证的有组织攻击行为」。
自媒体小声比比和乎睿数据认为,事实已经明显得不能再明显了。还有吃瓜群众怀疑,让寒冬前夕、正处融资节点的马蜂窝被爆数据造假,这背后是否会有其竞争对手的推波助澜?
这几乎就变成了一场涉及水军、造假、投资暗战的罗生门。对此,爱范儿专访乎睿数据团队成员,了解到这个事件的经过以及爆料背后的原因。
▲ 乎睿数据官网截图
乎睿数据目前仅有三名成员,成员都比较年轻,年龄在 1990 年上下。吴昊,师从某一线 NLP 学者,合作发表多篇顶会论文,目前休学回国创业中;聂震,今年三月初从国内 IoT 初创企业离职。费之晔,曾在 Instagram 担任广告组技术带头人,今年五月回国并放弃高额期权的挽留。
这个团队在今年五月才组建,目前他们通过自然语言处理等技术,提供舆情预警、知识图谱、内容采集、文本溯源等解决方案。
爱范儿对话乎睿数据
1.为什么爆料马蜂窝?
事件起因是我们在 5 月一次点外卖吃坏了肚子,发现商家存在刷单刷屏嫌疑。于是决定着手研发鉴别真假点评的产品,顺便参加深圳逐梦杯创新创业大赛。
一开始,我们对每一个平台都进行了数据筛查,扒了不只马蜂窝一家,手里拥有的数据量蛮大的。
过程中我们发现,即使是使用最简单的模型去识别虚假评论,马蜂窝上面的虚假评论太多,太多明目张胆,平台似乎也没有加以掩盖。于是就对马蜂窝上的评论进行了深入分析。
在其他平台,我们看不到很明显的证据能证明平台官方在做这些事情,但是马蜂窝这个直接就用了官方账号。
2.关于马蜂窝数据造假,还要哪些重大的证据、数据?
我们将马蜂窝一些造假账号的信息,与知乎等社交平台上公开的信息进行了关联比对,并掌握了一些接管抄袭账号的马蜂窝内部员工的信息。
这部分的证据和数据涉及隐私,我们一直保留并且没有对外公布。
3.事件影响扩大之后,是否你们预料之中?
这个新闻的传播量,以及公众的反应,超出了我们的想象。在 10 月 22 日下午才发现自己被告了。
大家都对刷量刷评论这种现象习以为常了,经常说「XXXX 都是这样的啦」。我们这样做,只是印证了一个公开的东西而已。
原本以为,我们只是发现了这个事情,用数据和技术证明了一下,想要告诉大家,然后让企业做出整改后,事情就会过去。现在发现,事情并没有这么简单。
4.面对起诉,你们打算怎么应对?
我们还在讨论和处理,并且对自己手上的证据有信心。
马蜂窝的声明让我们有点诧异,他们的言辞是在挑拨我们与马蜂窝用户的矛盾。我们的分析只是针对那 7000 多个造假账号,没有任何贬低其他正常用户的意思。
5.处于漩涡中心的团队此刻最希望向公众表达什么?
大家都在容忍生活中那些错误的行为,比如在室内抽烟,开车跨越双黄线,商家虚假评论等等。这些问题本来是错的,不能因为大家都去做了就会变成对的。
我们觉得一家企业如果能知错就改,勇于承担责任,还是有机会挽回消费者的。
如果我们的故事能增强大众对市场规范化的信心,促进法制建设,让更多人对数据产生兴趣,那的确是一件无上荣耀的事。
「我们只是印证了一个公开的东西而已」
乎睿数据在接受爱范儿专访时表示,被起诉并不在他们意料之中,之前认为马蜂窝可能会道个歉删东西尽快让事情过去。
「团队现在还是懵的,除了看得到摸得着的数据,我们并未将注意力过多投向其它方面,因此也从未评论过马蜂窝其它方面的优点或缺点。」
马蜂窝 8 月宣布融资,而乎睿数据从今年 6 月初就开始对餐饮、旅游等平台进行数据分析。
今年年初,亚马逊也发起过整顿假评论、店铺刷单的行动。国外有专门刷好评的网站,也有像 Fakespot.com 这些通过大数据帮助网友鉴定购物网站评论真伪的网站。
乎睿数据的成员,拥有大数据分析、自然语言处理这些技术和职业背景,因此想要在国内做识别假评论的项目,并且认为其中有很大的商业价值。
互联网平台里面的评论,对用户可以产生很多影响,要知道 Twitter 和 Facebook 里面的假评论,还影响了谁做美国总统。
乎睿数据的吴昊告诉爱范儿,他们只是印证了一个公开的东西而已:
我们也不是和他们有什么深仇大恨,也认可他们产品的一些优点,但是这么明目张胆的抄袭还能获得融资,真的太可怕了。
他们表示,此前已经对马蜂窝抄袭账号的大量可疑行为进行了视频录屏、截屏截图和司法公证,并掌握了一些接管抄袭账号的马蜂窝内部员工的信息,由于涉及隐私一直没有提及。
在这个事件里,乎睿团队里的三个年轻人,就是大声说出「皇帝没有穿衣服」的那个小孩。
爱范儿也尝试与马蜂窝就其官方账号被指参与造假,以及官方活动疑似有内幕等方面进行沟通,截止发稿前未获得马蜂窝的回复。