Reddit计划封杀谷歌/必应等搜索引擎 防止这些搜索引擎拿数据训练AI – 蓝点网
据华盛顿邮报发布的计划消息,为了防止自己平台的封杀内容被其他公司白嫖,知名网络社区 Reddit 计划在后续封杀谷歌和必应等搜索引擎的谷歌爬虫,同时为了防止 OPENAI 等获取 Reddit 论坛的等搜内容,Reddit 还计划要求用户必须登录账号才可以浏览内容。索引索引数据
最近一年因为 AI 问题 Reddit 似乎有些魔怔了,擎防擎拿例如之前 Reddit 要求 AI 公司必须与该公司签订协议支付费用才能获取数据进行训练。止搜
那么怎么防止这些 AI 公司未经授权抓爬数据呢?训练Reddit 直接调整了 API 接口,结果这也导致大量第三方 Reddit 客户端凉凉,蓝点这引起了巨大争议,计划但 Reddit 最终也没有松口。封杀
现在封杀搜索引擎对 Reddit 来说其实是谷歌个大事件,因为 Reddit 很多流量是等搜靠着搜索引擎导流而来的,如果封杀谷歌和必应等搜索引擎,索引索引数据未来 Reddit 上的擎防擎拿新内容将无法在网上搜到,那这肯定会导致流量下跌。
针对华盛顿邮报的报道 Reddit 澄清表示没有任何变动,同时向华盛顿邮报发邮件要求他们进行更正。
随后华盛顿邮报也确实添加了更正信息,不过新增信息只变更了要求用户登录才能阅读帖子的部分,但 Reddit 并未否认可能会封杀谷歌和必应等搜索引擎的传闻。
也有匿名人士告诉华盛顿邮报称,Reddit 高管认为即便封杀搜索引擎,Reddit 也可以继续撑下来。言外之意就是流量肯定会下跌,但 Reddit 也决意这么做。
对 Reddit 来说,可能现在靠着 AI 大潮卖数据才是最好的买卖,所以现在不惜毁掉第三方客户端和封杀搜索引擎,冒着流量大跌的风险也要牢牢守住自己的数据。
PS:我觉得 Reddit 可能已经在某些帖子里埋上特定的标识符,后续等各种 AI 产品更新后可以通过测试标识符来判断这些模型是否使用了 Reddit 的数据,如果被判定使用了数据但不是签订 API 合同的客户,那 Reddit 就可以起诉了。(类似做法在国内已经比较流行,主要就是防止竞争对手抓爬数据的。)
(责任编辑:休闲)