近日消息,有报道称电子商务巨头亚马逊旗下的云服务部门——亚马逊网络服务(AWS)正针对创新型人工智能搜索引擎企业Perplexity AI启动了一项调查程序。
此次调查聚焦于Perplexity AI被指控违反AWS服务协议的事件,特别是涉及未经许可抓取并索引那些明确设置反爬虫机制的网站信息。这一行为不仅引发了数据安全与隐私权的争议,还对双方的合作关系及Perplexity AI的技术伦理边界提出了质疑。
Perplexity AI是一家由杰夫·贝佐斯家族基金和Nvidia支持的初创公司,最近估值达30亿美元。《连线》杂志发现,该公司似乎依赖于抓取通过Robots排除协议禁止访问的网站内容。
Robots排除协议是一项网络标准,用于指示哪些页面不应被自动机器人和爬虫访问。虽然该协议不具有法律约束力,但大多数公司传统上都会遵守。
AWS发言人表示,公司服务条款禁止客户使用其服务进行任何非法活动,客户有责任遵守条款和所有适用法律。AWS客户在爬取网站时必须遵守robots.txt标准。
调查发现,Perplexity可以使用未公开的IP地址访问一台服务器,该服务器在过去三个月内至少访问了康泰纳仕旗下的资产数百次,显然是为了抓取被禁止访问的内容。
Perplexity首席执行官Aravind Srinivas称,被发现的抓取行为是由一家提供网络抓取和索引服务的第三方公司进行的,但拒绝透露该公司名称。Perplexity发言人Sara Platnick表示,公司已回应亚马逊的询问,并称其PerplexityBot尊重robots.txt,但在用户输入特定URL时会忽略该协议。
数字内容行业贸易协会Digital Content Next的首席执行官Jason Kint认为,如果针对Perplexity的指控属实,该公司就违反了防止潜在版权侵权的多项原则。他强调,人工智能公司默认不应未经许可获取和使用出版商的内容。
目前,这起事件引发了对AI公司数据获取方式的广泛关注和讨论。业界期待AWS调查结果的公布,以及可能对Perplexity采取的进一步行动。
文明上网,理性发言,共同做网络文明传播者