仅需几个关键词,再花上几分钟等待,你就能获得一幅梵高风格的画作。更重要的是,这幅画作的版权属于你。
最近,AI作画技术成为艺术圈的火爆话题。过去几十年里,绘画艺术一直被视为AI难以逾越的天堑。不过如今,这一道屏障,或许也在经历如当初AI冲击围棋一样的挑战。
(相关资料图)
仅需关键词即可作画
“星空、开满红色玫瑰花的山坡、破旧的石头城堡、梵高风格、油画”,在输入这5个关键词描述仅仅几分钟后,记者就获得了一幅极具梵高浪漫主义风格的油画作品,乍一看还真与大家熟知的名作《星空》有几分神似。而这一切的创作者并非人类,而是具备深度学习功能的AI软件。
曾一度被人类视为“护城河”的艺术创造力,如今可能正被AI迎头赶上。上个月,在美国科罗拉多州博览会艺术比赛中,一幅名为《太空歌剧院》的作品经过评委层层挑选后,最终被确定为比赛的金奖作品。然而这幅作品并非出自人类之手,而是一位游戏设计师用AI作画工具Midjourney(中途)创作的。而这也引发艺术圈极大的争论。
就在Midjourney走红后,国内也涌现了大量的AI作画平台。值得一提的是,在今年世界人工智能大会上,百度推出的“文心”平台也包含了AI作画功能。彼时,百度CEO李彦宏表示:“过去一年,无论是在技术层面还是在商业应用层面,人工智能都有了巨大的进展,有些甚至是方向性的改变。之所以说有方向性的改变,这里指的是AI从理解语言,理解文字,理解图片和视频,走向了生成内容。”
从输入到输出,AI如今正在从量变走向质变。自2015年,谷歌推出可以运用AI完成简单图像生成的程序后,如今技术再次迎来重要创新。
“这次最引起业内注意的其实是Stable Diffusion模型的出现,它解决了此前谷歌Disco Diffusion模型在绘制人脸上的不足。”一位资深程序员告诉记者,人脸绘制要求极高,相似度过低会导致“恐怖谷”效应,因此一直以来模型都无法很好解决。如今,能够绘制人脸,意味着AI作画应用场景大大拓宽,而这也是多模态预训练领域的一次可贵突破。
“人工智能多模态的预训练其实不是什么新鲜事物了。”一位业内工程师告诉记者,所谓多模态指的是在人工智能的训练模型中,将文字、图像、声音等若干不同类型的信息要素协同融合,比如AI作画实际上就是将文本语义转化为视觉图像的过程。“其实像大家熟悉的语音转文字,也是一种多模态预训练的人工智能。”
由于这类AI作画本质上都是基于这些开源模型建构的“训练项目”,开发门槛并不高,因此近两个月来,国内也涌现了大量的AI作画平台。仅在微信小程序上以“AI作画”为关键词搜索,就能发现超过20款相关程序。
内容创作成本再降
如今,AI作画对于行业的变革力量已经显现。就在Midjourney走红不久后,多家国际知名的报纸、杂志已经开始使用其生成作品制作封面及插图。
放眼国内,百度也通过其“文心”平台,在今年人工智能大会上短时间创作出了多幅热门电视剧海报,其中数张作品让网友直呼,“专业画师可能都需要画上好几天。”彼时,相关负责人称,该功能已在百家号平台内测,开放给部分作者使用。并且未来百度将依托文心平台,在百家号上上线更多高阶创作工具,包括将生成的AI图片自动配上相应的音乐和文字,一键生成短视频,无需创作者制作剪辑。
随着这些AI作画程序逐步投入商用,最为直观的变化,就是多媒体内容创作的成本将明显降低。据媒体报道称,目前Midjourney的注册用户数已超过300万,其提供付费生成画作的套餐价格,最高也不过每月30美元,这远低于传统插画师作图的价格。
显然,插画行业将面临挑战。记者了解到,目前已有部分商家开始考虑在中低端插画市场中,使用AI作画来节省开支。近期就有插画师在接受媒体采访时表示,在可以预见的未来,除了重点画作仍需知名插画师外,大部分要求不那么高的插画将用人工智能解决。
当然,AI作画的兴起也将带来新的机遇。近期许多短视频平台、游戏公司均挂出了诸如“多模态智能创作算法工程师”等相关岗位,而从岗位介绍来看,主要工作便是通过训练相关模型,实现智能化的内容输出。
有意思的是,记者注意到,目前部分招聘平台上还出现了一些负责调试协助AI作画的岗位。这些标注为“插画师”的岗位,实际工作是通过不断调整关键词,协助AI大量生产合格插画。
而这也揭示了目前大部分AI作画平台的问题所在。在实际体验中,记者发现目前市面上大部分平台生成画作质量仍不算太高,普遍存在无法解读融合全部关键词的情况。“这类模型的核心还是需要持续大量投喂高质量的数据,这样AI才能越来越好,因此很多小模型数据量不够,作画的质量肯定也不尽如人意。”前述工程师分析道,“另一个原因是,目前许多成熟的模型基于英文开发,而中文的语义逻辑和英文有着明显区别。”