?ω?
在大模型竞赛中,数据短缺危机正越来越严峻。最近《纽约时报》的一项调查显示,为了获得大量且高质量的训练数据,包括OpenAI、Google和Meta在内的科技公司纷纷走捷径,忽视平台政策,在违法边缘疯狂试探。其中OpenAI通过语音转录工具Whisper,收集了超100万小时的YouTube视频说完了。
?ω?
4月7日消息,当地时间4月5日,视频网站YouTube首席执行官尼尔·莫汉(Neal Mohan)表示,他并没有直接证据能够证明OpenAI确实使用了YouTube的视频来完善其文生视频AI工具Sora,如果真的使用了,那就“明显违反”了YouTube平台的使用条款。莫汉表示:“从创作者的角度来看,当创作后面会介绍。
4 yue 7 ri xiao xi , dang di shi jian 4 yue 5 ri , shi pin wang zhan Y o u T u b e shou xi zhi xing guan ni er · mo han ( N e a l M o h a n ) biao shi , ta bing mei you zhi jie zheng ju neng gou zheng ming O p e n A I que shi shi yong le Y o u T u b e de shi pin lai wan shan qi wen sheng shi pin A I gong ju S o r a , ru guo zhen de shi yong le , na jiu “ ming xian wei fan ” le Y o u T u b e ping tai de shi yong tiao kuan 。 mo han biao shi : “ cong chuang zuo zhe de jiao du lai kan , dang chuang zuo hou mian hui jie shao 。
ゃōゃ
03报告称OpenAI 采集了超一百万小时的YouTube 视频来训练GPT-4据纽约时报报道,OpenAI 迫切需要训练数据,并开发了Whisper 音频转录模型来克服困难,转录了超过100 万小时的YouTube 视频来训练其最先进的大型语言模型GPT-4。报道提到,OpenAI 在2021 年耗尽了有用的数据等会说。
近日,《纽约时报》报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。据报道,OpenAI通过使用其Whisper语音识别工具,转录了超过一百万小时的YouTube视频内容,并将这些数据用于训练其GPT-4模型。..
据《纽约时报》4月6日报道,随着2021年底OpenAI面临数据供应问题,研究人员创建了一款名为Whisper的语音识别工具,用以将YouTube视频转录为对话文本,最终转录了超100万小时的YouTube视频,用于训练GPT-4。YouTube禁止将其视频用于“独立”于该视频平台的应用程序,OpenAI后面会介绍。
OpenAI采集了超一百万小时的YouTube视频来训练GPT-4。紧接着,谷歌公司发言人Matt Bryant表示,“我们的robots.txt文件和服务条款都禁止未经授权的抓取或下载YouTube内容”。YouTube CEO尼尔・莫汉更是在接受彭博社采访时表示,尽管没有直接证据表明OpenAI使用了YouTube视后面会介绍。
●▽●
转录了超过100 万小时的YouTube 视频来训练其最先进的大型语言模型GPT-4。报道提到,OpenAI 在2021 年耗尽了有用的数据供应,并在耗尽其他资源后讨论了转录YouTube 视频、播客和有声读物的可行性。此外,OpenAI 使用了包括来自Github 的计算机代码、国际象棋走棋数据库和好了吧!
IT之家4 月6 日消息,YouTube 首席执行官尼尔・莫汉(Neal Mohan)近日在采访中公开表示,尽管没有直接证据表明OpenAI 使用YouTube 视频来训练Sora(文本生成视频的AI 模型),但警告称这种行为违反了YouTube 现行的平台服务条款。莫汉在接受彭博社采访时强调,下载YouTube 视频等会说。
金融界2024年4月6日消息,据国家知识产权局公告,深圳市华曦达科技股份有限公司申请一项名为“一种YouTube多账号认证的处理方法和装置“公开号CN117828579A,申请日期为2024年1月。专利摘要显示,本申请实施例公开了一种YouTube多账号认证的处理方法和装置,其方法包括:响是什么。
转录了超过100 万小时的YouTube 视频来训练其最先进的大型语言模型GPT-4。据《纽约时报》报道,该公司知道这在法律上存在问题,但相信这是合理使用。OpenAI 总裁格雷格·布罗克曼(Greg Brockman) 亲自参与了所使用视频的收集。OpenAI 发言人Lindsay Held 在一封电子邮件还有呢?
发表评论