(网经社讯)摘要:近日,电子商务研究中心生活服务电商分析师陈礼腾在接受《新农村商报》采访时表示,互联网行业“爬虫”抓取、抄袭、造假现象其实屡见不鲜。从其他平台抓数据的目的,就是为了制造流量很大的假象,既给用户看、商家看,更是给投资人看。
陈礼腾坦言,从其他网站或APP上抓取页面商家内容和用户点评数据非常简单,由于不涉及到数据库门槛,在技术上没有任何难度,随便一个爬虫工程师就可以做到,既可以批量处理,通常是“机器抓取+人工编辑”。
陈礼腾表示,爬虫抓取、抄袭和造假在互联网行业并不少见,甚至已经成为很多平台屡试不爽的一大“捷径”,但对于像马蜂窝这样的企业而言,或许入驻马蜂窝平台的商家为吸引人气和流量所为的可能性更大。
陈礼腾指出,如该事件属实,虽然对于消费者的日常使用不会造成多大的影响,但消费者对于平台的信任度将大打折扣,造成用户流失,品牌形象、未来经营都将受到一定影响。
但从估值影响上看,陈礼腾认为,对于投资者言这些数据仅仅是一些参考指标,并非其核心内容,最终还是要看马蜂窝的转化率及盈利能力如何。如此看来,该事件对于马蜂窝的投资人信任与核心估值是否会产生较大影响尚难定论。
以下是报道原文全文:《数据遭质疑“马蜂窝”被捅了》
凭借用户原创内容而成为后起之秀的在线旅游平台“马蜂窝”被捅了。
10月20日~21日,有自媒体连续发布两篇文章,直指“马蜂窝旅行网”涉嫌评论抄袭和造假。随着舆论的迅速发酵,马蜂窝于22日上午发布公开声明表示,针对该文中歪曲事实的言论,和已被查证的有组织攻击行为,马蜂窝将采取法律手段维护自身权益。10月22日晚间,马蜂窝起诉深圳乎睿数据有限公司、丁子奎名誉侵权案获立案。
马蜂窝起诉的乎睿数据公司正是上述自媒体作者引用的数据和报告的监测方与撰写方。乎睿数据团队在其报告中表示,经初步探索马蜂窝UGC和用户数据并与竞品比照发现,马蜂窝上有7454个抄袭账号,合计从竞品网站上抄袭搬运了572万条餐饮点评与1221万条酒店点评,占到官网声称总点评数的85%。这些评论主要来自携程、艺龙、Agoda、Yelp等知名网站的用户内容。
不仅如此,乎睿数据团队还发现,一批在游记攻略中植入广告的商家通过抄袭、拼接等“做号”、“洗稿”手段批量炮制出含有广告内容的游记、问答、回复,再由大量的小号、马甲进行人工置顶,达到以低成本对平台上亿用户打广告的目的。
一时间,舆论如潮。10月21日,马蜂窝旅游网发布紧急声明称:对全站游记、攻略、嗡嗡(旅行故事)、问答、点评等数据进行了核查,并对涉嫌虚假的信息展开查处。点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的帐号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分帐号进行清理。自媒体文章所述的马蜂窝用户数量,与事实和第三方机构数据都严重不符。
此后,马蜂窝于22日上午发布声明称,马蜂窝的UGC内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%。这些数据背后是用户真实的情感与回忆,也是马蜂窝内容的真正价值。
对此,电子商务研究中心生活服务电商分析师陈礼腾认为,互联网行业“爬虫”抓取、抄袭、造假现象其实屡见不鲜。从其他平台抓数据的目的,就是为了制造流量很大的假象,既给用户看、商家看,更是给投资人看。
陈礼腾坦言,从其他网站或
APP上抓取页面商家内容和用户点评数据非常简单,由于不涉及到数据库门槛,在技术上没有任何难度,随便一个爬虫工程师就可以做到,既可以批量处理,通常是“机器抓取+人工编辑”。
陈礼腾表示,爬虫抓取、抄袭和造假在互联网行业并不少见,甚至已经成为很多平台屡试不爽的一大“捷径”,但对于像马蜂窝这样的企业而言,或许入驻马蜂窝平台的商家为吸引人气和流量所为的可能性更大。
据悉,马蜂窝今年8月被曝计划融资3亿美元,其估值或达25亿美元。去年12月,马蜂窝在第二轮融资中筹集到1.33亿美元,新的投资者包括美国Gen-eralAtlantic、OceanLink、淡马锡、元泰投资和厚朴投资,以及现有的投资者——今日资本、启明和高瓴资本。在2018年俄罗斯世界杯上,马蜂窝花费1.65亿元成为央视世界杯转播的赞助商,凭借广告词“旅游之前,先上马蜂窝”在短时间内获得了大量曝光与关注。
陈礼腾指出,如该事件属实,虽然对于消费者的日常使用不会造成多大的影响,但消费者对于平台的信任度将大打折扣,造成用户流失,品牌形象、未来经营都将受到一定影响。
但从估值影响上看,陈礼腾认为,对于投资者言这些数据仅仅是一些参考指标,并非其核心内容,最终还是要看马蜂窝的转化率及盈利能力如何。如此看来,该事件对于马蜂窝的投资人信任与核心估值是否会产生较大影响尚难定论。(来源:新农村商报 文/刘旭颖)