OR 新媒|oror.vip跨平台阅读首选
2023-01-16 16:00
商业与经济

谷歌开发AI系统 预示未来视频生成前景

或者任何有点脑细胞和一台电脑的人,很快就能制作长片了;另一个可能的后果是虚假信息泛滥,但短期内可能无需对此小心提防。
GPT-4首次亮相,在消费办公工具人工智能的竞赛中,谷歌击败微软
彭博

■人工智能的创造力超过了它在驾驶方面的技能。虽然自动驾驶技术已陷入停滞,但利用简单文本生成图像的人工智能系统,即生成模型的研究,出现了引人注目的爆炸式进展。2022年10月,来自Meta PlatformsInc.和Alphabet Inc.旗下谷歌公司的人工智能研究人员实现了非凡的跨越,他们开发的系统可以用人们想象得到的任何文本提示生成视频。Facebook母公司Meta Platforms提供的视频看上去像是梦境中的画面,里面是一只泰迪熊在画着花朵,或者是一匹臃肿着腿的马在田野上飞奔。视频只有一两秒钟时长,质量上的一个小问题暴露了其来源,但依然值得称道。谷歌生成的视频是咖啡被倒进杯子,或者是在雪山上空飞行,视觉效果非常逼真。

更令人赞叹的是,谷歌还创建了一个名为Phenaki的第二系统,可制作时长两分钟甚至更长的视频。下面是谷歌用于其中一段视频的提示文字:“未来城市的交通非常拥挤。一艘外星飞船抵达未来城市。镜头来到外星飞船内部。镜头推进,直到蓝色房间里的一位宇航员显现。宇航员在键盘上打字。镜头从宇航员身上移开。宇航员离开键盘,向左方走去......”

全部提示文字读起像是电影剧本,里面有“镜头拉近”等指令,上面这段文字还不到全部内容的三分之一。Phenaki在Google Brain上的主创之一杜米特鲁·埃尔汉(Dumitru Erhan)在推特上发布了这段提示内容生成的视频。

你可能会想,这就是我们所知道的好莱坞的末日,或者任何有点脑细胞和一台电脑的人,很快就能制作长片了。这实际上也是研究人员所希望的。埃尔汉在推特上说,他和他的团队想让人们有能力“创作自己的视觉故事......让人们更容易产生创造性。”

短时间内,人工智能生成的视频很难出现在你当地的电影院中。但几乎可以肯定,我们将会在社交媒体动态,特别是在字节跳动旗下的TikTok和Instagram旗下的Reels或者YouTube等平台上看到这类视频的发布。

TikTok没有回复是否在开发自己的人工智能视频生成工具的问题,但它这么做是合情合理的。TikTok的用户喜欢在他们发布的视频中添加贴图、文字和绿幕效果,该平台的新技术

可以满足这种需求。2022年8月,TikTok在其应用中添加了一个人工智能图像生成器,可以创建程式化的绿幕效果。输入“鲍里斯·约翰逊”这样的提示文字,TikTok会弹出一幅抽象的画像,隐约显出这位英国前首相的样貌。

如果机器不仅会根据我们划屏的情况为我们推荐视频,而且在制作视频方面也发挥了更大作用,会有什么结果呢?我们很多人都喜欢观看可爱的猫咪和人们被自己绊倒的视频,所以一种能制作出笨拙的绊倒或活泼小猫的虚假蒙太奇画面的算法,能轻松带来病毒式的点击,只要看上去是真实的。

TikTok上的内容创作者以及平台本身,都有充分的动机去开发可以大规模生成视频的工具,尤其是在成本低廉又简便易行的时候。而对于我们其他人,结果将是社交媒体的信息流比以往任何时候都更多受到机器的驱动。已经有人工智能和推荐算法加持的人工智能视频,将进一步增加自我强化式的反馈循环,挠到我们认知的痒处。

另一个可能的后果是虚假信息泛滥,但短期内可能无需对此小心提防。社交媒体平台一直在大力清除虚假内容,谷歌和Facebook都不愿向公众发布他们的视频制作工具,因为可能会被滥用(想必还会搞坏公共关系)。谷歌表示,它的系统生成的视频对女性存有偏见,即使他们试图过滤掉刻板印象的结果也是一样。谷歌研究人员称,在问题解决之前,不会对外发布该模型和源代码。

当然,很快你就可以不受限制地使用这些工具了,这得感谢Stability AI这样的组织。这家英国初创公司去年8月发布了一款图像生成工具,任何人都可以用来生成绝妙的艺术作品,以及假装的名人、政客和战区照片,这是大型人工智能公司不能做的。我试用了这款工具,几秒钟就能炮制出美国前总统唐纳德·特朗普和朝鲜领导人金正恩打高尔夫的照片。StabilityAI正在开发一款视频生成工具,将在一切就绪之后发布。

不过,虽然这类工具的普及将导致更多虚假内容,但也意味着更多人会意识到它们的存在。人们更有可能怀疑乔·拜登总统殴打老太太的“照片”是人工智能生成的。不管怎样,这就是希望。

同样令人担忧的是,这些工具将对人们日常获得的内容产生什么影响。谷歌研究人员认为,他们的工具将增强人类的创造力。但当制作视频变得如此轻而易举,几乎无需思考,真的就能发挥我们的想象力吗?也许不是所有情况下都能这样。

还有驱动着我们在网上看到大量内容、主要是为了产生点击量的推荐引擎,它们一道让我们的未来看上去更像是被机器“导演”了,而且可以说,并不是很有创造性。■

读者评论
MORE +

热门排行榜
OR
+
GPT-4首次亮相,在消费办公工具人工智能的竞赛中,谷歌击败微软
2023-01-16 16:00
商业与经济

谷歌开发AI系统 预示未来视频生成前景

或者任何有点脑细胞和一台电脑的人,很快就能制作长片了;另一个可能的后果是虚假信息泛滥,但短期内可能无需对此小心提防。
彭博

■人工智能的创造力超过了它在驾驶方面的技能。虽然自动驾驶技术已陷入停滞,但利用简单文本生成图像的人工智能系统,即生成模型的研究,出现了引人注目的爆炸式进展。2022年10月,来自Meta PlatformsInc.和Alphabet Inc.旗下谷歌公司的人工智能研究人员实现了非凡的跨越,他们开发的系统可以用人们想象得到的任何文本提示生成视频。Facebook母公司Meta Platforms提供的视频看上去像是梦境中的画面,里面是一只泰迪熊在画着花朵,或者是一匹臃肿着腿的马在田野上飞奔。视频只有一两秒钟时长,质量上的一个小问题暴露了其来源,但依然值得称道。谷歌生成的视频是咖啡被倒进杯子,或者是在雪山上空飞行,视觉效果非常逼真。

更令人赞叹的是,谷歌还创建了一个名为Phenaki的第二系统,可制作时长两分钟甚至更长的视频。下面是谷歌用于其中一段视频的提示文字:“未来城市的交通非常拥挤。一艘外星飞船抵达未来城市。镜头来到外星飞船内部。镜头推进,直到蓝色房间里的一位宇航员显现。宇航员在键盘上打字。镜头从宇航员身上移开。宇航员离开键盘,向左方走去......”

全部提示文字读起像是电影剧本,里面有“镜头拉近”等指令,上面这段文字还不到全部内容的三分之一。Phenaki在Google Brain上的主创之一杜米特鲁·埃尔汉(Dumitru Erhan)在推特上发布了这段提示内容生成的视频。

你可能会想,这就是我们所知道的好莱坞的末日,或者任何有点脑细胞和一台电脑的人,很快就能制作长片了。这实际上也是研究人员所希望的。埃尔汉在推特上说,他和他的团队想让人们有能力“创作自己的视觉故事......让人们更容易产生创造性。”

短时间内,人工智能生成的视频很难出现在你当地的电影院中。但几乎可以肯定,我们将会在社交媒体动态,特别是在字节跳动旗下的TikTok和Instagram旗下的Reels或者YouTube等平台上看到这类视频的发布。

TikTok没有回复是否在开发自己的人工智能视频生成工具的问题,但它这么做是合情合理的。TikTok的用户喜欢在他们发布的视频中添加贴图、文字和绿幕效果,该平台的新技术

可以满足这种需求。2022年8月,TikTok在其应用中添加了一个人工智能图像生成器,可以创建程式化的绿幕效果。输入“鲍里斯·约翰逊”这样的提示文字,TikTok会弹出一幅抽象的画像,隐约显出这位英国前首相的样貌。

如果机器不仅会根据我们划屏的情况为我们推荐视频,而且在制作视频方面也发挥了更大作用,会有什么结果呢?我们很多人都喜欢观看可爱的猫咪和人们被自己绊倒的视频,所以一种能制作出笨拙的绊倒或活泼小猫的虚假蒙太奇画面的算法,能轻松带来病毒式的点击,只要看上去是真实的。

TikTok上的内容创作者以及平台本身,都有充分的动机去开发可以大规模生成视频的工具,尤其是在成本低廉又简便易行的时候。而对于我们其他人,结果将是社交媒体的信息流比以往任何时候都更多受到机器的驱动。已经有人工智能和推荐算法加持的人工智能视频,将进一步增加自我强化式的反馈循环,挠到我们认知的痒处。

另一个可能的后果是虚假信息泛滥,但短期内可能无需对此小心提防。社交媒体平台一直在大力清除虚假内容,谷歌和Facebook都不愿向公众发布他们的视频制作工具,因为可能会被滥用(想必还会搞坏公共关系)。谷歌表示,它的系统生成的视频对女性存有偏见,即使他们试图过滤掉刻板印象的结果也是一样。谷歌研究人员称,在问题解决之前,不会对外发布该模型和源代码。

当然,很快你就可以不受限制地使用这些工具了,这得感谢Stability AI这样的组织。这家英国初创公司去年8月发布了一款图像生成工具,任何人都可以用来生成绝妙的艺术作品,以及假装的名人、政客和战区照片,这是大型人工智能公司不能做的。我试用了这款工具,几秒钟就能炮制出美国前总统唐纳德·特朗普和朝鲜领导人金正恩打高尔夫的照片。StabilityAI正在开发一款视频生成工具,将在一切就绪之后发布。

不过,虽然这类工具的普及将导致更多虚假内容,但也意味着更多人会意识到它们的存在。人们更有可能怀疑乔·拜登总统殴打老太太的“照片”是人工智能生成的。不管怎样,这就是希望。

同样令人担忧的是,这些工具将对人们日常获得的内容产生什么影响。谷歌研究人员认为,他们的工具将增强人类的创造力。但当制作视频变得如此轻而易举,几乎无需思考,真的就能发挥我们的想象力吗?也许不是所有情况下都能这样。

还有驱动着我们在网上看到大量内容、主要是为了产生点击量的推荐引擎,它们一道让我们的未来看上去更像是被机器“导演”了,而且可以说,并不是很有创造性。■

 

读者评论
OR

 

分享:
每日头条
OR
+
最新资讯
OR
+
热门排行榜
OR
+
OR品牌理念
+

■ 或者,  留一段影像,回一曲挂牵。丝丝入扣、暖暖心灵 ,需飘过的醇厚与共。
■ 或者,热烈空雨伴芬芳泥土;绿绿生命缠锐意骄阳。
回望,回望,一马平川红酒飘散断归途。
■ 或者,灰蒙蒙空气重回道指一万四千点。滚动时光,照进现实,流逝过往,回归未来。

■ OR 新媒体是一个提供时政、经济、文化、科技等多领域资讯的平台,旨在为用户提供优质的阅读体验。网站的网址是oror.vip,用户可以通过浏览器在台式电脑 、笔记本电脑 、平板电脑 、手机访问。.......