OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型
(相关资料图)
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型,以解决可能涉及到的数据隐私和版权问题。网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI的网络爬虫名为GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练GPT模型。 OpenAI表示,网站运营者可以通过在其网站的Robots.txt文件中禁止GPTBot的访问,或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还表示,“使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许GPTBot访问您的网站可以帮助AI模型变得更加准确,并提高它们的通用能力和安全性。” 然而,这并不会追溯性地从ChatGPT的训练数据中删除之前从网站上抓取的内容。互联网为大型语言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的训练数据,为AI训练获取数据已经变得越来越有争议。一些网站,包括Reddit和Twitter,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。
关键词:
相关阅读
-
OpenAI现允许网站阻止其网络爬虫抓取数...
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数 -
中化岩土08月08日涨停分析
中化岩土08月08日涨停收盘,股价上涨10 00%,收盘价为3 08元。该股于上 -
七彩虹推出新款隐星P16游戏本 13代酷睿+RTX4060
一、七彩虹推出新款游戏本高性能高性价比七彩虹公司,起初以板卡产品起 -
杨雪莉,雪莉杨为什么叫这个名字?
一、雪莉杨为什么叫这个名字?雪莉杨父亲杨玄威给取名。正常叫法是杨雪 -
渤海首个千亿方大气田Ⅰ期海上平台全部...
(王君妍 王在御)记者9日从海洋石油工程股份有限公司(简称“海油 -
最少使用·遵循自愿·最小储存——《人...
为规范人脸识别技术应用,国家网信办8日公布《人脸识别技术应用安全管 -
2023黑龙江省各级机关补充录用公务员(...
按照省委组织部《关于做好2023年度全省各级机关考试录用公务员体检和考 -
驰援涿州众志成城 德邦快递提供免费公...
洪涝灾害牵动人心,全国多地投入到紧张地抢险救援行动中。德邦快递密切 -
2023福建省教育厅转任遴选选调生拟遴选...
根据《关于转任遴选选调生到省教育厅工作实施方案》,经笔试、面试、考 -
2023大学生村官考试行测常识判断知识点...
在行测常识判断部分经常考查历史地理相关知识,比如的航海行动。15世纪 -
柯桥区“三式联动”推进印染产业合规体...
今年以来,柯桥区司法局聚焦印染产业发展和印染企业经营突出问题, -
NVIDIA与全球工作站厂商共同推出用于生...
NVIDIA与全球工作站厂商共同推出用于生成式AI及LLM开发、内容创作和数 -
激励≠福利 开润股份、神州泰岳、大为...
莫让好事变坏事作者:业文编辑:钧杰风品:闻道来源:铑财——铑财... -
氟化工,谁是成长最快企业?
企业成长能力是随着市场环境的变化,企业资产规模、盈利能力、市场占有 -
江苏舜天收上交所监管工作函,公司还预...
雷达财经文|冯秀语编|深海8月7日,深交所向江苏舜天下发监管工作函,关 -
8月4日LME基本金属库存统计
-
《最好朝南》:当下中国女性的生命书写...
看完病后医生给了她治疗方案,而作者的愤怒才刚开始,因为所有的市面上 -
网传山东平阴“多人起冲突大打出手”,...
原标题:网传山东平阴“多人起冲突大打出手”,警方通报:2人抢救无... -
第三届“海峡两岸杯”台胞台企羽毛球联...
(董囿希)8月5日,第三届“海峡两岸杯”台胞台企羽毛球联谊赛在兰州... -
韦增鹏:数据中心是黑石最看好的板块之...
韦增鹏表示,数据中心是黑石最看好的板块之一,拥有着强劲的优势和值得