天天视点!云从科技大模型来了!六大经典问题对比chat GPT,国产大模型进行到哪一步了?

2023-06-22 08:14:12 来源:证券之星

大模型的乱纪元时代,云从终于用自己的方式,迈出了第一步。


(资料图片)

5月30日,云从从容大模型宣布正式开启公测,此时,距离从容5月18日首次亮相仅过去不到两周。

时间上来说,距离chat GPT发布已经过去了半年多,并不算早;但关注度上,作为过去几个月时间里资本市场上最受瞩目的AI小巨头,云从的一举一动,都足以被数亿股民拿着放大镜解读分析。

那么,万众瞩目中,从亮相到正式公测,时间相距不到两周,云从的底气究竟从何而来?相比被数亿人关注的chat GPT,云从从容的表现又究竟如何?

根据云从从容大模型自己的介绍,它是云从科技开发的一款自然语言处理助手,目的是帮助人们更加高效地完成各种任务,例如回答问题、提供建议、生成代码等。因此,“从容”也可以理解为一种高效、便捷的工作方式。

根据从容官网,我们可以发现,从容的功能主要集中在知识问答、创意文案、逻辑推理、文章撰写、常识问答、代码编写、语言理解、日常生活、专业知识九大维度。

那么,接下来,我们就在以上领域,通过六大经典问题的横向测评对比,看一看,云从的从容大模型,到底成色几何?

一、更懂中文,更懂你的真实想法

任何人在深度体验了云从从容大模型之后,都不难得到一个结论,那就是作为一款由丰富中文语料库训练出来的中国本土的AI大模型,从容大模型在理解中文语义,掌握中文语料知识方面,具备着非常明显的优势。

首先对比一下不同大模型在中文语义,以及语义背后真正的深层含义理解上,不同大模型的表现如何。

以男女情感互动中的高频回复“你是个好人”为例

chat GPT,理解到了这句话背后的第一层,也就是最表面的意思,你是个还不错的人。但是在第二层意思的理解上,却出现了一定的偏差“这并不一定表示她对你的感情或者是否有意接受你的表白有明确的回应”。

事实上,在中文含蓄的表白场景中,发好人卡,其实就是“用肯定句表否定”的拒绝含义。相应的,在基于这个错误的判断,给出的后续追问式行动指引,自然是错上加错。

云从从容大模型,我们可以看到,在理解了第一层的字面意思之后,甚至对背后第二层“她可能只是把你当作朋友或者普通同事来看待”也作出了精准解读;

但更让人惊喜的是,在第二层含义解读之后,从容大模型给出的第三层行动指引,无疑是更加恰当合理的——“需要更多的行动和沟通来让她感受到你的诚意和真心”,而不是继续询问“你这句回应,究竟什么意思”。

在准确理解提问者意思之后,我们需要考虑的第二个问题,就是针对我们的提问,AI到底是真懂还是假懂。chat GPT推出后不久,就有不少用户发现,AI总是会一本正经地给出自己一个驴唇不对马嘴的错误回答。

还是以一个经典的中文爱情问答题来进行测试——“为什么情侣许愿,总是会说,在天愿作比翼鸟”?

这是chat GPT的回答,可以看到,AI给错了解题步骤,但蒙对了正确答案。将原本属于《长恨歌》的诗句,安在了《木兰诗》与纳兰性德的身上,另外也虚构出了一个似是而非的神话故事,但是却在使用场景中意外地回答对了象征美好爱情期许的答案。

相较而言,从容大模型对中文的了解程度,明显可以看出要更胜一筹。不仅准确说出了出处《长恨歌》,也对诗句的上下文背景给出了精准解释;同时,对使用场合、诗句真正含义上的描述上,从容相较chat GPT也要更加精当。

当然,云从的从容大模型也并非全能,依然爱情题,我们稍加变化出题方式,就可以看到,无论是外国的chat GPT,还是中国的从容大模型,在面对“我和你家人同时掉水里”这个死亡问题,都稚嫩的像一个小学生。

二、更多场景,更专业化地回答

当然,除了最基础的语义理解,以及语料库训练之外,我们更关心的,其实是作为一个大模型,云从从容,究竟能给我们的生产力,带来怎样的变革与加速。

一般来说,我们最常用的AI文本生成场景无非三类,1、总结长文章内容,节省时间 2、帮助我们写周报、写邮件,完成一些基础的事务性工作 3、在一些创意性文案创作中,给我们一些思路启发。

我们先看看总结长文本,以《人民日报》不久前发表的《人工智能,务实发展是正道》一文为例,可以看出chat GPT与云从从容的表现,各有千秋。

其中,chat GPT总结的内容更加详细,但相对有些冗长;从容大模型,整体总结字数较少,但也同样能精准概括文章中的核心思想与内容。

接下来我们看看在写邮件这样具体的场景中,两个的表现分别如何:

可以看出,无论哪一家产品,AI都是懂道歉的。两相对比,chat GPT更加侧重原因复盘以及后续具体解决方案的提供;云从从容的邮件则更加简洁明了,究竟哪一方更好,则具体取决于我们的需求如何。

最后一个问题,创意文案的启发——写一个公主安排恶龙抢亲的新童话故事。

两个回答中,从容大模型保持了一贯的简洁风格,在故事的最后,恶龙将王子变成了青蛙的设定,让人眼前一亮;

chat GPT则依旧是给出了非常丰富的内容填充,对于故事中具体人物性格的设定、情节的设计则更加饱满。

在以上几种没有明确对错的问答中,整体我们可以看到,云从从容风格更为简洁,而GPT则以细节见长,对于不同需求的用户来说,不妨将两者结合使用,或许会是一个不错的选择。

三、从国内AI三小巨头到全球大模型五强,云从何以从容?

一定程度上,在国内“千模竟发”的背景下,作为资本市场的当红炸子鸡,云从拿出成果的时间并不算早。那么为什么,云从却是最受瞩目的一个,能够与谷歌、微软、百度、讯飞并列大模型五强?

一个标准的答案是,在技术的发展中,好饭从来不怕晚,更何况,在大模型的这一细分赛道,大家其实都站在起跑线上。就像马化腾所说“工业革命中,早一个月把电灯泡拿出来在长的时间跨度上来看是不那么重要的。与其拿出半成品展示,不如把底层的算法、算力和数据扎扎实实做好。”

但落到一些更加具体的细节之中,我们则会发现,云从后发先至背后,是云从在AI领域的多年沉淀。

先看背景,成立之初,云从科技就是带着中科院的背景技术派。2015年,云从科技正式从z中国科学院孵化成立,云从的创始人周曦,也曾以中科院“百人计划”专家身份引进回国,组建了中科院最大的人脸识别研究团队,担任中国科学院重庆绿色智能技术研究院信息所副所长等职位。

发展过程中,云从一度与商汤、旷视等企业并列,成为国内第一波AI浪潮中,最受关注的AI三巨头,无论在人才保有量、专利申请,还是融资情况、企业规模、落地情况都属于行业第一梯队。

随后,在2022年5月27日,云从科技集团股份有限公司正式在上海交易所科创板上市,成为中国第一家纯内资背景的AI小巨头IPO。

一路不断过关斩将的云从到底多厉害?我们用数据就能知晓一二。

早在2016年,广东省公安厅曾组织过一场摄像头拍摄数据比对800多万常住人口数据库的比赛。结果,那场比赛中,两家最先进的海外企业,识别准确率仅有5%,而刚成立不久的云从则一举将识别正确率拉到了超过50%。

到如今,翻开云从财报,我们则可以看到云从的1000多名员工,其中过半为科学家及工程师,硕士及以上学历占比更是达39.21%。

更重要的是,8年发展中,云从同样注重能力的复用与沉淀。在从容发布会中,对于云从“从容速度”的来源,云从创始人周曦归结原因之一是“2019年,我们就开始打造整个CWOS操作系统。”

基于这样的操作系统能力,云从在后续又分别在“2021年推出AI精灵,2022年承接科技部的视听交互国家人工智能开放平台”,从容大模型的推出,正是CWOS操作系统能力的又一延伸。

有了这些积淀,也才能让云从在如今的大模型竞赛中,走得更加从容。

理解了云从在技术上的从容之后,另一个问题紧跟着浮出水面,为什么云从的大模型姗姗来迟,但是在落地上,却能够做到先人一步?

不久前的云从从容大模型的发布会上,云从科技除了拿出产品亮相之外,还宣布与中检计量、神州信息、深圳报业、佳都科技、今世缘、游族网络、艾登科技达成战略签约。

签约背后的意义,不仅在于商业化的领先,更在于通过与安防、白酒、游戏等领域的顶级玩家合作,让大模型的“聪明才智”落地具体应用,在专业场景中发挥出更高的效用与价值。

在云从内部,周曦反复强调的一点是,不仅要打造好通用大模型作为基础,同时更要在分门别类的垂直领域打造出可以真正造福行业的垂直行业大模型。打个形象的比方就是“人的基本素质至关重要。有了基础再做专业的事,大学学习专业知识,我们学法律专业,成为律师,我们学医学,成为医生。”

结合多个场景进行落地,不仅是云从做深大模型的技术野心;更是造福行业、自我造血的必要生存手段。

从当初的人脸识别,到落地金融、安防,再到打造CWOS操作系统,并以此为基础孵化出国家级平台、从容大模型,一定程度上,从容,是云从的底色,同时更是这场人类社会百年不遇的技术革命中云从的底气所在。

标签:

为您推荐

新闻快讯