AI“新宠”！互联网巨头争相布局仅需关键词即可作画-环球新要闻_推荐_三板富

仅需几个关键词，再花上几分钟等待，你就能获得一幅梵高风格的画作。更重要的是，这幅画作的版权属于你。

最近，AI作画技术成为艺术圈的火爆话题。过去几十年里，绘画艺术一直被视为AI难以逾越的天堑。不过如今，这一道屏障，或许也在经历如当初AI冲击围棋一样的挑战。

(相关资料图)

仅需关键词即可作画

“星空、开满红色玫瑰花的山坡、破旧的石头城堡、梵高风格、油画”，在输入这5个关键词描述仅仅几分钟后，记者就获得了一幅极具梵高浪漫主义风格的油画作品，乍一看还真与大家熟知的名作《星空》有几分神似。而这一切的创作者并非人类，而是具备深度学习功能的AI软件。

曾一度被人类视为“护城河”的艺术创造力，如今可能正被AI迎头赶上。上个月，在美国科罗拉多州博览会艺术比赛中，一幅名为《太空歌剧院》的作品经过评委层层挑选后，最终被确定为比赛的金奖作品。然而这幅作品并非出自人类之手，而是一位游戏设计师用AI作画工具Midjourney(中途)创作的。而这也引发艺术圈极大的争论。

就在Midjourney走红后，国内也涌现了大量的AI作画平台。值得一提的是，在今年世界人工智能大会上，百度推出的“文心”平台也包含了AI作画功能。彼时，百度CEO李彦宏表示：“过去一年，无论是在技术层面还是在商业应用层面，人工智能都有了巨大的进展，有些甚至是方向性的改变。之所以说有方向性的改变，这里指的是AI从理解语言，理解文字，理解图片和视频，走向了生成内容。”

从输入到输出，AI如今正在从量变走向质变。自2015年，谷歌推出可以运用AI完成简单图像生成的程序后，如今技术再次迎来重要创新。

“这次最引起业内注意的其实是Stable Diffusion模型的出现，它解决了此前谷歌Disco Diffusion模型在绘制人脸上的不足。”一位资深程序员告诉记者，人脸绘制要求极高，相似度过低会导致“恐怖谷”效应，因此一直以来模型都无法很好解决。如今，能够绘制人脸，意味着AI作画应用场景大大拓宽，而这也是多模态预训练领域的一次可贵突破。

“人工智能多模态的预训练其实不是什么新鲜事物了。”一位业内工程师告诉记者，所谓多模态指的是在人工智能的训练模型中，将文字、图像、声音等若干不同类型的信息要素协同融合，比如AI作画实际上就是将文本语义转化为视觉图像的过程。“其实像大家熟悉的语音转文字，也是一种多模态预训练的人工智能。”

由于这类AI作画本质上都是基于这些开源模型建构的“训练项目”，开发门槛并不高，因此近两个月来，国内也涌现了大量的AI作画平台。仅在微信小程序上以“AI作画”为关键词搜索，就能发现超过20款相关程序。

内容创作成本再降

如今，AI作画对于行业的变革力量已经显现。就在Midjourney走红不久后，多家国际知名的报纸、杂志已经开始使用其生成作品制作封面及插图。

放眼国内，百度也通过其“文心”平台，在今年人工智能大会上短时间创作出了多幅热门电视剧海报，其中数张作品让网友直呼，“专业画师可能都需要画上好几天。”彼时，相关负责人称，该功能已在百家号平台内测，开放给部分作者使用。并且未来百度将依托文心平台，在百家号上上线更多高阶创作工具，包括将生成的AI图片自动配上相应的音乐和文字，一键生成短视频，无需创作者制作剪辑。

随着这些AI作画程序逐步投入商用，最为直观的变化，就是多媒体内容创作的成本将明显降低。据媒体报道称，目前Midjourney的注册用户数已超过300万，其提供付费生成画作的套餐价格，最高也不过每月30美元，这远低于传统插画师作图的价格。

显然，插画行业将面临挑战。记者了解到，目前已有部分商家开始考虑在中低端插画市场中，使用AI作画来节省开支。近期就有插画师在接受媒体采访时表示，在可以预见的未来，除了重点画作仍需知名插画师外，大部分要求不那么高的插画将用人工智能解决。

当然，AI作画的兴起也将带来新的机遇。近期许多短视频平台、游戏公司均挂出了诸如“多模态智能创作算法工程师”等相关岗位，而从岗位介绍来看，主要工作便是通过训练相关模型，实现智能化的内容输出。

有意思的是，记者注意到，目前部分招聘平台上还出现了一些负责调试协助AI作画的岗位。这些标注为“插画师”的岗位，实际工作是通过不断调整关键词，协助AI大量生产合格插画。

而这也揭示了目前大部分AI作画平台的问题所在。在实际体验中，记者发现目前市面上大部分平台生成画作质量仍不算太高，普遍存在无法解读融合全部关键词的情况。“这类模型的核心还是需要持续大量投喂高质量的数据，这样AI才能越来越好，因此很多小模型数据量不够，作画的质量肯定也不尽如人意。”前述工程师分析道，“另一个原因是，目前许多成熟的模型基于英文开发，而中文的语义逻辑和英文有着明显区别。”