- 详细资料
- 分类:财经要闻
在生成式AI越来越普及的当下,用AI做海报已经不是什么新鲜事了。但迪士尼旗下漫威疑似用AI制作海报,还是引发了诸多争议,更招致了不少“剥削”的批评。生成式AI就像是一根刺,扎在好莱坞影视制作人员的心里,让他们时时紧张,担心自己失业。
迪士尼海报是AI画的?
在MidJourney等AI制图工具已经越来越普遍的当下,企业机构用AI生成商业海报广告,早就已经不是什么新鲜事了。或许创意有所不及,但AI制图不仅省时省事,更是成本低廉。
然而,近期全球娱乐巨头迪士尼旗下漫威影视发布的一张电视剧海报,却引发了诸多行业人士的质疑和愤怒。很多人怀疑这张海报出自AI制作,即便迪士尼和AI制图网站双双出面否认,却依然没有化解业界的疑虑与怒火。
AI做个图怎么了?为什么迪士尼会引发如此大争议?好莱坞到底在紧张什么?引发争议的海报来自上周迪士尼发布的电视剧《洛基》第二季。
《洛基》是漫威超级英雄宇宙系列的一部分,由英国演员“抖森”汤姆·希德斯顿(Tom Hiddleston)主演。作为漫威宇宙的二级核心人物,《洛基》是为专为迪士尼流媒体平台Disney+制作的电视剧。2021年6月,《洛基》第一季在Disney+首播,点播数据和观众反响都不错;而第二季则是上个星期刚刚上映。
这张引发争议的海报是抖森的正面大头像,画面中心是他那双迷人的绿眼睛;而他头像的周围则是一圈螺旋,诸多人物在螺旋上或走或跑。看起来,这只是一张普普通通的海报,甚至难以留下什么印象。
但就是这样一张平淡无奇的海报,却引发了诸多争议与批评。在迪士尼发布这张海报之后,几位AI制图方面的专业人士很快就在X平台(此前的推特)上指出,这张毫无创意的海报很可能是AI制作的。
证据在哪里?几位影视行业人士指出,这张海报上的螺旋设计是典型的AI制图元素,很可能是Shutterstock网站的AI图片。而且,有网友拿这张海报进行了四次AI检测,其中有三次都被判定是AI制图。
AI制图早就成为了行业惯例。现在市场上的主要AI制图工具包括了OpenAI的DALL-E3、微软的Bing Image Creator等图片生成工具以及Getty和Adobe等素材库。Shutterstcok也是刚刚推出自己的AI图片生成工具。
但问题是,迪士尼并没有标注这张海报是“AI生成”,但如果这真是Shutterstock网站AI制图的话,那“维权大户”迪士尼可能就侵权了,因为他们没有得到Shutterstock的商业使用授权。Shutterstock的网站政策明确标明,AI生成图片必须加上标明“借助AI创作”的说明。
最早的质疑者是一位居住在德国的电脑绘图师Katria Raden。她解释说,图片和插画的授权费一直是很多努力工作的艺术工作者谋生手段。“企业通过大规模剥削打造的AI技术生成图片取代艺术家的工作,这并不比裁员更有道德”。言下之意是,如果迪士尼等大公司如此频繁使用AI制图的话,那么诸多像她这样的电脑绘图师可能会因此失业。
这件事很快就引起了网络热议,很多网民的批评点是迪士尼居然使用AI来制作海报,是他们创作力枯竭的表现,但也有不少网民觉得现在使用AI图片已经成为行业惯例,娱乐巨头迪士尼最终不能免俗,这也没什么大不了的。
一位Reddit网友认为,一家行业领先娱乐巨头使用工具,更快更好的打造娱乐内容,这没什么问题。但其他网友很快反驳他说,“问题是,这并不是更好的内容。你难道真的看不出利用AI作出图片,和创造一副符合剧作主题的海报之间的差别吗?”
《秘密入侵》AI打造开场
那么迪士尼到底有没有用AI做海报呢?该公司发言人对媒体澄清,这张海报并不是AI生成的。而Shutterstock也发表声明,验证了迪士尼的说法。“我们可以证实,这张海报并不是AI创作的。设计师通过软件工具创作了一个时空漩涡的画面元素,而这通常会与AI联系在一起。”
尽管迪士尼和Shutterstock双双否认这张《洛基》海报是AI作品,但网友似乎对此并不完全相信。因为这也不是迪士尼第一次卷入“AI制图”的争议了。上一次迪士尼的解释也是令人将信将疑。
今年6月,同样是漫威出品的电视剧《秘密入侵》(Secret Invasion)上线Disney+,其中片头字幕的部分,即绿光笼罩地球,人面逐渐幻化成斯克鲁人(Skrull)的那一幕,也被业内人士怀疑是AI制作的。
制作《秘密入侵》的Method Studio当时发表声明,承认他们的确使用了“特定的AI工具”来展现外太空与异形的形象,但Method Studio强调“这些新工具并没有取代艺术家的工作”。
Method Studio具体解释称,“制作过程是高度协作和迭代性质的,专注于一款AI工具集的特定使用。这包括了艺术指导、2D与3D动画师、艺术家、开发者们的共同努力。但尤其需要强调的是,虽然使用了AI部分提供最佳效果,AI只是我们艺术家所使用的诸多工具集之一。”
然而,当时正值好莱坞演员和编剧工会大罢工期间。而生成式AI在影视行业的应用也是双方的争议焦点之一。就在双方谈判的过程中,演员编剧们得知迪士尼漫威新一季的《秘密入侵》已经完全使用AI技术打造开场场景。这一消息让双方的谈判再次搁浅。
这样的担忧情绪不仅存在于好莱坞,也存在于视频游戏开发行业。在OpenAI推出GPT-4大模型之后,诸多游戏开发者就担心游戏公司未来会通过AI开发游戏,从而会导致大量游戏开发人员失业。
但即便是担忧论者也不得不承认,游戏开发行业已经在频繁广泛地使用AI在开发游戏。AI不仅可以编写代码,也可以生成游戏创意,或者为角色撰写对话文本,大大减少游戏开发人员的时间和劳动投入。
举例来说,游戏开发者Ammaar Reshi在X平台上介绍,自己使用了GPT-4开发了一款叫Snake的游戏,他要求GPT-4为其编写程序运行所需的HTML、CSS以及JavaScript代码,Reshi只需要复制粘贴代码到开发程序里,还可以要求AI对代码进行修改,对更改作出解释。之后,他又让ChatGPT为1993年的经典游戏SkyRoads重写了代码。
编剧罢工赢得AI话语权
虽然这次迪士尼否认《洛基》海报是AI生成的,但AI生成内容就像是一根刺,扎在影视从业人员的心里。每次看到疑似生成式AI生成的内容,都会拨动到他们紧张的神经。
为什么影视行业使用AI工具引发这么多的争议和批评?业内人士主要是担心制片方使用现有素材进行AI训练,未来频繁使用AI工具生成内容,这不仅侵犯到了创作者已有作品的版权,没有给他们足够的回报,更会影响到创作者未来的工作机会和空间。
如何使用AI工具也是今年好莱坞两场大罢工的焦点问题之一。
由于无法与制片方就劳资协议达成一致,今年5月和7月,美国编剧协会WGA和好莱坞演员工会SAG-AFTRA先后宣布大罢工,让好莱坞顿时陷入了历史性大停摆。上一次演员和编剧一道罢工还是在1960年。
十多万名好莱坞编剧和演员工会成员集体停下了所有电影的相关工作,不仅拒绝拍摄和制作,甚至拒绝参加现有电影的宣发工作,连在社交媒体上宣传新片都不可以。直到9月底,编剧工会才和制片方达成初步协议,从而结束了近5个月的大罢工。而演员工会还在继续坚持。
编剧协会与制片方的主要分歧点除了提高片酬待遇和流媒体分成之外,还有一个关键分歧就是影视制作应该如何规范使用生成式AI工具。编剧们担心制片方会用他们此前的剧本训练人工智能,自动生成几乎没有成本的新剧本,让人类编剧被迫接受更低的薪酬,甚至是大批失业。
他们的担心并不是没有道理。影视行业正在越来越多地使用AI工具,华纳影业、Netflix、迪士尼等主要片场已经在通过AI制作特效、生成字幕以及撰写概要等简单任务。而亚马逊、Netflix、苹果这些流媒体巨头本就是技术实力雄厚的互联网科技巨头,拥有行业一流的技术人才储备。未来AI全面进入影视制作,只是一个时间问题。
面临财大气粗和技术优势的片场巨头,编剧们只能以大罢工来进行抗衡,毕竟至少现在AI还无法取代人类编剧。资方暂时还离不开编剧。而且,AI工具要不断完善和提高,需要大量的现有数据进行训练。这些已有的影视剧本等内容,则属于编剧们的版权。
因此,好莱坞编剧协会在劳资谈判中除了要求提高片酬待遇和二次分成之外,还专门提出要求在如何使用AI工具方面拥有主导权,给予编剧们质疑和否决使用他们现有内容训练AI软件的权利。
具体而言,在双方最终达成的劳资协议中,资方在如何规范使用AI工具方面接受了编剧们提出的要求,主要包括以下几个方面:
1、AI不得用于撰写或者重写文学内容,AI生成的内容不能被视为源材料,这意味着AI生成的内容不得影响编剧的作品权益或单独权益。
2、如果制片方同意,编剧在编写剧本时可以自己选择使用AI工具,但是制片方不得强制要求编剧使用ChatGPT等AI工具。
3、如果制片方提供给编剧的任何材料包括了AI生成的内容或者部分内容,必须披露给编剧。
4、如果制片方违反规定使用编剧们的内容训练AI工具,编剧们有权维护自己的合法权益。
在过去五个月的大罢工中,编剧们不惜让行业停摆和自己失业,换来了制片方们的让步,取得了暂时性的胜利。但三年后的下一次劳资谈判,面对可能性能大升级的AI,编剧们的处境可能会更加艰难。
- 详细资料
- 分类:财经要闻
机器人技术的一大挑战是必须投入大量精力来训练每个机器人、任务和环境的机器学习模型。
现在,谷歌 DeepMind 和其他 33 个研究机构的一个新项目旨在通过创建一个通用人工智能系统来应对这一挑战,该系统可以与不同类型的物理机器人一起工作并执行许多任务。
谷歌机器人公司高级软件工程师 Pannag Sanketi 表示:“我们观察到,机器人是伟大的专家,但却不是多面手。” “通常,必须为每个任务、机器人和环境训练一个模型,更改单个变量通常需要从头开始。”
为了克服这个问题,让训练和部署机器人变得更加容易和快捷,这个被称为 Open-X Examples 的新项目引入了两个关键组件:一个包含多种机器人类型数据的数据集,以及一系列能够跨机器人传递技能的模型,任务范围广泛。
研究人员在机器人实验室和不同类型的机器人上对模型进行了测试,与常用的机器人训练方法相比,取得了更好的结果。
▌结合机器人数据
通常,每种不同类型的机器人及其独特的传感器和执行器集都需要专门的软件模型,就像每个生物体的大脑和神经系统如何进化以适应该生物体的身体和环境一样。
Open X-Embodiment 项目的诞生源于这样一种直觉:结合来自不同机器人和任务的数据可以创建一个优于专用模型的通用模型,适用于所有类型的机器人。
这个概念部分受到大型语言模型(LLM)的启发,当在大型通用数据集上进行训练时,该模型可以匹配甚至优于在狭窄的特定任务数据集上训练的较小模型。令人惊讶的是,研究人员发现同样的原理也适用于机器人。
为了创建 Open X-Embodiment 数据集,研究团队收集了来自不同国家 20 个机构的 22 个机器人实施例的数据。该数据集包括超过100万集的500多项技能和15万项任务的示例(一集是机器人每次试图完成一项任务时采取的一系列动作)。
随附的模型基于 Transformer,深度学习架构也用于大型语言模型。RT-1-X 建立在Robotics Transformer 1 (RT-1)之上,这是一个适用于现实世界大规模机器人技术的多任务模型。
RT-2-X 建立在 RT-1 的后继者RT-2的基础上,RT-2 是一种视觉语言动作 (VLA) 模型,可以从机器人和网络数据中学习,并且可以响应自然语言命令。
研究人员在五个不同的研究实验室的五种常用机器人上测试了 RT-1-X 的各种任务。与为每个机器人开发的专用模型相比,RT-1-X 在拾取和移动物体以及开门等任务上的成功率高出 50%。该模型还能够将其技能推广到不同的环境,而不是适合特定视觉设置的专用模型。这表明,在大多数任务中,经过不同示例集训练的模型都优于专业模型。论文称,该模型可以应用于从机器人手臂到四足动物的各种机器人。
加州大学伯克利分校副教授、该论文的合著者谢尔盖·莱文(Sergey Levine)写道:“对于任何做过机器人研究的人来说,你都会知道这是多么了不起:这种模型‘从来’不会在第一次尝试时就成功,但这个模型却成功了。” 。
在紧急技能、未包含在训练数据集中的新任务方面,RT-2-X 的成功率是 RT-2 的三倍。特别是,RT-2-X 在需要空间理解的任务上表现出更好的性能,例如区分将苹果移到布附近与将其放在布上的区别。
研究人员在一篇宣布Open X和RT-X的博客文章中写道:“我们的研究结果表明,与其他平台的数据共同训练为RT-2-X注入了原始数据集中没有的额外技能,使其能够执行新的任务。”。
▌为机器人研究采取未来措
展望未来,科学家们正在考虑将这些进展与DeepMind 开发的自我改进模型RoboCat的见解相结合的研究方向。RoboCat学习在不同的机械臂上执行各种任务,然后自动生成新的训练数据以提高其性能。
Sanketi 认为,另一个潜在的方向可能是进一步研究不同的数据集混合如何影响跨实施例泛化以及改进的泛化如何实现。
该团队开源了 Open X-Embodiment 数据集和小型版本的 RT-1-X 模型,但没有开源 RT-2-X 模型。
桑凯蒂说:“我们相信这些工具将改变机器人的训练方式,并加速这一领域的研究。” “我们希望开源数据并提供安全但有限的模型将减少障碍并加速研究。机器人技术的未来依赖于让机器人能够互相学习,最重要的是,让研究人员能够互相学习。”
- 详细资料
- 分类:财经要闻
途乐(配置|询价)是一款深受国内越野爱好者喜爱的全尺寸硬派SUV,曾因为相对低廉的价格一度成为“街车”。近日,我们从外媒获得了日产全新一代途乐的最新消息。新车预计在2023年底或2024年初首发亮相。
新一代车型依然保持了方正的硬派造型,全新的下格栅贯穿整个前脸,营造了车头的宽大感。全新的中网格栅采用了多重堆叠的元素,顶部还有一根粗壮的横杠。另外,该车全新大灯在伪装下展现出L形日间行车灯。
新车侧面造型依旧十分庞大,宽大的车窗和平直的车顶展现了该车拥有出色的车内空间,全新多辐式轮圈也为它增色不少。车尾配备了厚实的顶部扰流板,尾灯转而采用了垂直排列布局,点亮效果出众,保险杠看上去也更加厚重,中间设置了用于安装拖车钩的开口。
虽然我们还没有看到新一代途乐车内的详细图像,但可以看到仪表板顶部有一层覆盖物,这表明开发人员刻意隐藏某些东西,或许是全新的仪表台和中控屏,现款车型提供了12.3英寸信息娱乐屏幕和7.0英寸仪表显示屏。此前也有报道称,新一代途乐的车内将使用更高级的材料和更大的屏幕,并进行了安全性和驾驶辅助技术的更新。
动力方面,新一代途乐预计放弃当前的5.6升V8发动机,改为搭载一款产生424马力的双涡轮V6发动机,同时9速自动变速器也将取代现有的7速自动变速器。
- 详细资料
- 分类:财经要闻
近日,有媒体报道称,百度正加紧训练文心大模型4.0,这将是文心大模型3.5版本后又一个重磅版本。据报道,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。
10月10日,记者从百度内部人士基本确认了该消息,据悉,即将推出的文心大模型4.0的参数量、训练数据量以及推理成本等都比3.5高出一个数量级。
今年3月16日,百度官宣新一代大语言模型“文心一言”启动邀测,8月31日正式面向公众开放服务。如今,文心大模型即将再度升级发布4.0版,如此迅速的大模型升级速度,在国内尚属唯一。只不过,快速升级的背后,文心大模型4.0快速攀升的参数量、数据量所带来的训练和推理成本提升,也正在成为大模型商业化过程中需要考虑的重点。
据此前消息报道,相比文心大模型3.5,文心4.0不仅训练成本在增加,推理成本也增加了很多,大概是此前的8-10倍。一直以来,百度并未对外披露大模型训练、推理的各项成本,不过据国盛证券此前估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),训练成本介于200万美元至1200万美元之间。作为国内大语言模型代表,文心一言想要在性能上追赶甚至超越ChatGPT等国外同行,所需耗费的资金成本,恐怕也将与之相当。
过高的训练和推理成本压力下,在打造领先的底层基础大模型的路上,注定只能是一场巨头间的游戏。不过对于百度而言,由于具备万卡集群、飞桨、文心大模型以及丰富的百度应用生态优势,独具芯片、框架、模型及应用四层架构优势,更具技术竞争力。
在进一步降低大模型算力成本和时间成本上,百度万卡集群的整体优势已得到充分体现——在万卡集群训练大模型时,常规方法下工程师们有30%-40%时间都花在容错和故障恢复上,而在百度智能云自研的集群组网故障管理机制下,模型有效训练时间达到95%以上,人力及算力资源均得到了利用。
真金白银投入的背后,目前国外大模型厂商已开始尝试收费模式,无论是在面向企业客户的B端垂类大模型开发,还是面向消费群体的To C付费产品,均有不少案例。例如,在面向C端消费者付费领域,目前GPT-4已推出“每月支付20美元订阅费”的收费模式。
可以预见,不远的将来,以百度为代表的大模型企业们,或将陆续推出收费模式。在To C大模型AI应用层面,类似爱奇艺或百度网盘VIP会员的收费模式,也将不断浮现,逐渐培养用户付费习惯。
- 详细资料
- 分类:财经要闻
9月22日,特斯拉Model 3焕新版实车在上海亮相,新车由上海超级工厂生产,得益于生产效率的提升,25.99万元的起售价已远低于BBA(奔驰、宝马、奥迪)等同级别车型。同时,接近特斯拉的相关人士透露,特斯拉正加速创新,将一体化压铸技术升级到2.0版本,将电动汽车几乎所有复杂车身底板零部件压铸成一个整体。
上海证券报记者近日获悉,作为特斯拉上海超级工厂的重要创新成果,一体化压铸正推动汽车行业新一轮的生产变革。目前,从上游设备到下游整车,多家中国企业已经在这一创新产业(64.210, -0.83, -1.28%)链进行布局,有望使中国汽车在车身轻量化、生产成本等方面获得提升或优化。
“一体化压铸创新技术对汽车行业具有颠覆性。”中国汽车流通协会专家委员会成员颜景辉分析,特斯拉新的一体化压铸有助于汽车实现轻量化,新能源车人工成本得到降低的同时,续航里程还能提高。
记者在上海浦东临港的特斯拉超级工厂看到,这里生产的特斯拉Model Y车型的后底板总成系统,已经成功采用一体化压铸技术实现快速铸型。
“我们的超级压铸是重要的创新,在Model Y车型有非常淋漓尽致地体现。”特斯拉上海有限公司结构与热管理系统经理崔海伦说。
据崔海伦介绍,在特斯拉Model Y一体压铸的后底板车型上,原本散件被安装集成为一个零件,生产效率得到大幅提升。相比传统方式,车身系统节省重量超10%。另外,成本也有非常明显的优势,得益于优化的结构设计以及材料回收利用成果,车的后底板总成系统采用一体压铸方式后,成本降低了40%。
在节约成本的同时,生产时间也在大幅节省。2023年9月6日,特斯拉上海超级工厂第200万辆整车下线。特斯拉有关人士介绍,特斯拉第一次完成 “100万辆”的目标,上海工厂用了33个月,而这次从“100万”到“200万”,只用了13个月。
特斯拉掀起的“一体化压铸”潮流已开始影响中国汽车产业链。在整车企业方面,国内汽车制造商已经开始主动加入这场“生产技术革命”。
吉利汽车旗下的极氪汽车在智能化新能源车极氪009的车身就采用了一体化压铸。极氪研发人员介绍,在使用新技术后,新车消除了近800个焊接点,零部件数量减少80多个,重量减轻了16%。新车变得更轻的同时,也消除了各种零件焊接时潜在的失效率。另外在安全性方面,整车的刚度得以大幅提升,在遇到冲击时变形量减少16%,同时弯曲刚度提升11%,扭转刚度提升9.5%。
造车新势力小鹏汽车新推出的“扶摇”架构则采用了国内目前唯一量产的前后一体式铝压铸车身,前后一体压铸集成零件数161个,车身结构一次压铸成型,最大压铸力可达1.2万吨。
上游零部件企业也在积极布局一体化压铸领域。永茂泰(9.040, 0.19, 2.15%)负责人日前表示,公司后底板等相关汽车零部件产品正在与长安、奇瑞等准备做一体化压铸的车企进行前期验证,目前还未进行大批量生产、销售。
多利科技(51.830, 1.67, 3.33%)则于近日公告,公司拟在江苏金坛投资新建“汽车精密零部件及一体化底盘结构件项目”,计划投资30亿元。公司全资子公司近日收到国内某头部新能源汽车制造商的定点意向书,提供一体化压铸后地板零部件,预计将于2025年开始量产。
博俊科技(26.340, 0.36, 1.39%)负责人近期表示,公司部分一体化压铸产品已完成试模及制样,预计将于2024年四季度开始量产。另外,公司已为AITO问界品牌的新车M9批量供货车身件。
对于产业链企业的积极布局,中国工程院院士丁文江指出,包括新能源汽车在内的车身、底盘等大型结构件一体化、集成化压铸成型,将原本需要数十道铆接、冲压、焊接、锻造成型的复杂工艺化繁为简,减少加工工艺,减轻零件重量,实现成本降低,这也将成为行业发展的必然趋势。
