ChatGPT在开放域内容创作上表现较好,但在命题写作、摘要生成等约束条件下生成能力仍有不足。

中国信通院专家:ChatGPT短期无法取代高水平写作 | 新京智库西方若插手台湾,中方如何应对?77年邓公已指明方向,只有2条路
▲ChatGPT在全球掀起热潮,科技巨头纷纷跟进布局。图/IC photo

文 | 柯锐

ChatGPT火遍全球。

ChatGPT的一大特点是不再像之前的人工智能产品那么高冷,而是变得平易近人,能让普通用户参与互动聊天。

那么,在专业机构和研究人员眼中,ChatGPT代表了怎样的水平?就此,新京报新京智库专访了中国信通院云大所人工智能部副主任曹峰。

作为人工智能领域的“国家队”,曹峰和其所在的中国信息通信研究院团队,在2022年12月就基于智能对话和大模型等研究工作基础,对ChatGPT的对话、生成两项能力进行多维评测并发布结果,受到产业各界的关注。

1

ChatGPT在全球处技术领先位置

新京智库:在AIGC(利用人工智能技术来生成内容)领域,就计算能力与现有技术而言,ChatGPT属于什么级别?

曹峰:ChatGPT的计算能力、数据集尚未公布。但是从技术的领先性来说,ChatGPT在全球都属于领先位置,一般来看领先半年到一年左右。

在开放域对话方面,ChatGPT在对话集成的技术、实现的机制、达到的效果、覆盖的领域等方面均具有绝对优势。在特定域对话方面,ChatGPT优势不明显。根据中国信通院于2022年12月开展的评测结果来看,ChatGPT尚难摆脱知识整合和逻辑推理困境,在约束条件下生成能力仍有不足。

2

短期内无法取代高要求写作

新京智库:2022年12月,中国信通院对ChatGPT的对话、生成两项能力进行多维评测,评测有哪些发现?

曹峰:根据中国信通院对ChatGPT的测试结果来看,当前ChatGPT支持以下几大类的文案生成,包括创意写作:学术类、新闻类、文案类、散文类、诗歌类、戏剧类、小说类、心得类、其他类;命题写作:主题拟定、风格模仿、文本续写、格式拟定;摘要生成:学术类、新闻类、散文类、戏剧类、小说类;代码生成:原始生成、错误修复。

从结果上看,ChatGPT在开放域内容创作上表现较好,但在命题写作、摘要生成等约束条件下生成能力仍有不足。

可以看出,当前ChatGPT仅仅能代替一些开发类的文案协作,如果增加一些限定条件,那么其性能就会较大幅度的下降。所以短期内,它是无法代替具有高要求,高限定场景下的写作需求的。

中国信通院专家:ChatGPT短期无法取代高水平写作 | 新京智库西方若插手台湾,中方如何应对?77年邓公已指明方向,只有2条路

▲中国信通院和联盟对ChatGPT的生成能力评测结果截图。图/ 中国信通院人工智能产业发展联盟AIIA公众号

3

在多个方面取得重要突破

新京智库:有人说ChatGPT具有里程碑的意义,你怎么看?

曹峰:在产业热度上,ChatGPT发布至今已获得前所未有的关注度。ChatGPT仅用两个月就实现了上亿用户目标,成为史上用户数量增长最快的消费者应用。这种热度还在持续提升。ChatGPT引发科技浪潮,吸引Google、Microsoft、Amazon、百度、腾讯、竹间等国内外企业的积极布局。

在技术实现上,集成多种前沿技术并采用先进的训练方式。ChatGPT作为大规模语言模型,借助预训练学习、微调学习、提示学习和强化学习等技术手段,不断借助人类反馈,实现了更强的自我学习能力。

此外,ChatGPT在更广泛复杂的数据集上采用了更为通用的预训练方式,能捕捉到人类语言不同题材的特征,从而可以面向特定领域和场景做进一步的微调。

在应用表现上,ChatGPT交互语言多样、能力丰富、机制全面。ChatGPT支持英文、中文、日语等多语言交互,除擅长的对话问答能力外,还具备代码生成、论文写作、诗词创作等内容创作能力。相比于同一家族的GPT-3模型,ChatGPT在复杂语句理解、上下文语义衔接、错误内容纠正、质疑不合理前提、拒绝恶意提问等方面取得重要突破。

4

ChatGPT目前相当于一个“玩具”

新京智库:近期,OpenAI传出即将发布GPT-4的消息。据分析,升级版的GPT模型在技术上会有更大的提升,能够准确执行更接近人类能力的任务。ChatGPT未来还会有怎样的发展?

曹峰:我们注意到OpenAI已经预告即将发布GPT-4。据称,与GPT-4相比,ChatGPT就相当于是一个“玩具(toy)”。我们已经看到ChatGPT所能带来的巨大可能,GPT-4可能在功能、性能等方面远远超过现在的ChatGPT。

5

我国相关产品值得期待

新京智库:国内是否有类似的技术或产品?与其相比有哪些差距?

曹峰:当前我国并没有直接对标ChatGPT的产品,但是我们看到,2月7日,百度正式对外官宣类ChatGPT项目“文心一言”(ERNIE Bot)。该产品目前正在做上线前的冲刺,将于三月份完成内测,面向公众开放。另据报道,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。

实际上,国内智能对话相关产品很多,并已经出现了很多年。百度、腾讯、思必驰、竹间、图灵人工智能研究院均推出相关对话开发平台和产品。

目前,我们看到阿里、腾讯都在内部测试相关的产品,可以期待我国相关产品的能力和表现。

撰稿丨 新京智库首席研究员 柯锐 实习生 韩朝璐编 辑丨郑伟彬校 对丨吴兴发联系我们:邮箱 futurecity@xjbsmartcity.com微信 jimi906shixmp-common-profile

新京智库

新京智库是依托于新京报平台成立的新型媒体智库,我们着眼于自身立足北京的区位优势,服务北京、面向全国、放眼世界。在国家政策解读、政商学媒“四维一体”资源对接、城市案例研究和品牌传播等方面,生产具有高度专业化、全球广泛影响力的作品与研究成果,为政府、企业和行业机构提供一流的智力支持。