文章主题:关键词:Prompt, AI, 生成式AI, Midjourney

666AI工具大全,助力做AI时代先行者!

ChatGPT、Midjourney、Stable Diffusion 等新兴技术的推动下,Prompt 的概念已经逐渐为更多人所熟知。

OpenAI所引发的大模型热潮再次颠覆了我们对AI的认识。然而,当前的AI仍处于弱人工智能阶段,其“知识”储存在一个隐性的环境中,只有通过向AI提供正确的指令,即过去几个月内频繁被提及的提示,才能将其释放出来。

在探讨人工智能助手Prompt时,有人将其理解为“提示词”,有人则称之为“激发词”。这种词语的理解,就如同童话故事中的魔法一般,Prompt被誉为AI时代的魔法,掌握它,便如同获得了“巫师”般的神奇力量。

01 Prompt是什么?

Prompt这个概念并非难以理解其字面意义,然而,何至于会出现这样一个词汇呢?作为ChatGPT炒热的新名词,我们不妨听听ChatGPT自身的解读。

AI时代的魔法:Prompt及其应用解析

在本文中,我们发现了一些有趣且有价值的信息。首先,Prompt在设计上借鉴了计算机编程中的命令行提示符,这无疑为人工智能的使用提供了更为直观且灵活的控制方式。然而,在生成式AI的领域中,Prompt的价值并不在于执行计算机命令,而在于其引导作用。这种引导作用在很大程度上帮助用户更好地理解和应用人工智能技术,从而实现更为高效和精准的结果。

以类比的方式,我们可以将大型人工智能模型视为人类大脑。在这个比喻中,知识的储存位于神经元之间的连接中。只有在面临特定问题时,例如“你最喜欢的食物是什么?” 大脑才会给出精确的答案。因此,提出问题往往比解决问题更为重要。这种观点在人工智能领域广为流传,得到了广泛的认可。实际上,你在使用 ChatGPT 时所遇到的“限制”实际上是自我设定的限制。

Prompt的价值并非体现在ChatGPT所代表的对话机器人的身上,而是 Midjourney 等图像生成类应用的主导地位。

在概括而言,你希望AI能够生成特定类型的图片,从而将你脑海中的想法转化为可视化的图案,这需要使用数十个单词作为提示。即使仅有一个关键词的区别,AI生成的图像也可能存在显著差异。因此,如何准确地提供给AI提示,已逐渐成为一项复杂的艺术,并由此产生了提示语工程学(Prompt Engineering)这一领域。

在评价大型模型能力的过程中,三个方面成为了关键指标:其预训练水平、用于预训练的语料库的数量及质量,以及提示语的质量。举例来说,针对文心一言生成图像的问题,即使我们不考虑前两个因素,仅从提示语的角度来看,文心一言与Midjourney之间的差距仍然非常明显。

因为在文心一言上想要生成图片,普遍给的指令是:帮我生成一张XXX(这也是百度官方的示例),解析为Prompt时注定只有几个提示词,远不足以表达脑海里想要的画面;同样的需求给Midjourney,可能是十几个乃至几十个提示词,大模型可以更准确地理解并输出用户想要图案。

理解了这些差异,便不难读懂Prompt走红的原因。

目前大模型对算力的要求很高,以OpenAI的DALL・E为例,生成一张图片的收费约0.02美元,如果让不懂Prompt的人去调用模型,大概率会浪费掉一次次算力。何况当前想要生成满意的图片,需要不断重复调整,能否熟练运用Prompt,直接左右了大模型所能释放的生产力。

02 Prompt 还能赚钱?

利用信息差赚钱向来是最容易做的生意,生成式AI也不例外,Prompt作为AI时代的魔法,已然成了不少人用来“赚钱”的生产资料。

第一种:直接售卖Prompt。

国外已经出现了PromptBase等明码标价的平台,涉及Midjourney、Stable Diffusion、DALL・E、GPT等多个模型,而且适用的场景越来越细分,包括音乐创作、儿童插画、油画艺术、人物肖像等等,即便是不擅长整理提示词的普通用户,也可以直接复制Prompt生成相对不错的作品。

其实国内也有类似的现象,一些商家早已在电商平台上兜售Prompt,也有一些人将Prompt做成面向垂直任务场景的应用,比如AI 写评语、AI写邮件、AI翻译等等,吸引刚需用户按月付费使用。

第二种:用Prompt换流量。

国内最早一批售卖AI课程的自媒体,多半将Prompt作为吸引用户付费的筹码;小红书等年轻人扎堆的平台上,早早出现了分享Prompt的笔记;B站、抖音等视频平台上,教用户使用Prompt的教程已不可计数。

个中逻辑并不复杂。Prompt是驾驭AI的“咒语”,但提示词本身并没有版权效应,或许直接兜售Prompt可以快速变现,终归是不长久的买卖。将Prompt作为涨粉工具,趁机吸引到可观的粉丝群体,在流量变相高度繁荣的互联网江湖,无疑更符合市场规律,也是Prompt被广泛讨论的另一重诱因。

第三种:靠Prompt“找工作”

正如前面所提到的,正确使用Prompt已经是提升生产力的前提,不单单产生了提示语工程,还酝酿出了一批“提示词工程师”(Prompt Engineer)。

国外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速涨粉,然后被硅谷独角兽Scale AI聘请为“提示词工程师”,据说年薪高达百万人民币;另一位名为Jason M. Allen的艺术家,则使用Midjourney赢得了Colorado State Fair周年艺术比赛……如果说计算机时代的能力密码是编程,在生成式AI席卷全球的当下,Prompt正悄悄成为数以万计打工人“傍身”的工具。

至少就目前来看,程序员群体里已经渐渐兴起两股风潮:一类人瞄准了OpenAI等大模型企业的API,想要坐在人工智能的副驾驶上创业;另一类人打起了创造Prompt的主意,想要利用信息差赚到第一桶金。

倘若ChatGPT的出现当真是所谓的iPhone时刻,围绕Prompt的生意其实才刚刚开场。

03 Prompt 只是过渡?

相对应的一个问题是,Prompt是否是人工智能大众化不可或缺的一环?这个问题的答案直接影响着Prompt和Prompt Engineer的红利周期。

Open AI 的 CEO Sam Altman曾公开表示:五年后,就不再需要 Prompt Engineering。也许在接下来的一段时间里,我们仍需要提示语,需要去创造 Prompt,但生成式AI的发展速度可能超乎想象,AI对人类的理解力远未触达天花板。

可以佐证的是,第一代iPhone上市时还没有App Store,仅预装了浏览器、iPod、邮件等少量应用,想要安装其他应用,需要在电脑上安装iTunes,用USB线将iPhone连接到电脑……为了解决用户体验上的局限性,越狱工具和第三方应用商店应运而生,但在苹果引入App Store后,越狱工具渐渐被丢进了历史的故纸堆。

同样的问题询问ChatGPT,答案似乎客观了许多。

AI时代的魔法:Prompt及其应用解析

想要不用特定Prompt就能和AI流畅对话,ChatGPT认为需要解决四个挑战:

1、AI需要更好地理解语境和连贯性,哪怕用户像《大话西游》里的唐僧一样喋喋不休,或者语无伦次,AI也可以准确理解用户的意图,这样就不需要精确的提示词,用自然语言进行提问

2、AI需要有丰富的常识和推理能力,即根据特定的信息和场景做出合理的回应,而非像现在的模型那样“对牛弹琴”,比如中文里的多义词、不同场景下不同含义的语气词,非常考验推理能力。

3、AI需要理解和处理情感信息,这也是当前AI研究的重心所在。人的情感可以有很多种表达方式,文字只是其中重要的一种。在大模型不断向多模态演进时,视觉和声音是否也可以传递信息?

4、AI需要有主动学习和适应能力。主动学习是指AI系统在学习过程中,能够主动选择最具信息量的样本进行学习,在数据稀缺的情况下做出更好的决策;适应能力是指AI在面临新的任务、场景或环境变化时,能够自我调整并优化其行为。

按照ChatGPT的标准,在Prompt消失的时候,势必已经进入到了强人工智能时代,目前还有很长一段距离。

Prompt及其衍生机会的消亡是一种历史必然,在时间上仍有很大的不确定性,也许会很快出现另一场技术爆炸;也许AI会进入新一轮的瓶颈期, Sam Altman的五年预期不过是“盲目乐观”。

04 写在最后

或许可以借用科技媒体《VentureBeat》的说法:现在已经到了AI艺术的转折点,未来的艺术家无论是自学成才还是科班出身,都需要有创造Prompt的能力,需要理解和学习数据科学,以及大模型的工作原理。

进一步延伸的话,需要有这些能力的绝不只是艺术家,任何职业、任何行业的工作都不可避免和AI协作,将人类的思考和需求注入给AI,不断更新、创造Prompt,将是大多数人必须要掌握的一种技能,就像现在必须要用输入法打字一样。

AI时代的魔法:Prompt及其应用解析

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公写作、生活好得力助手!

搜索微信号AIGC666aigc999或上边扫码,即可拥有个人AI助手!