尝鲜讯飞星火认知大模型，看看它能力如何？

2023-05-27 14:45| 来源: 网络整理| 查看: 265

从结果来看，仍然不尽如人意。先抛开剧情的套话描述，其演员团队依旧是错误的。

再来一个问题：以“讯飞星火”做一首藏头诗.

通过以上两次生成的内容来看，讯飞星火认知大模型有一定的能力，但其能力并不完美，完成度只能达到50%左右。

对外的内容出现偏差，可以理解，那对内呢？来问一下，科大讯飞2022年的营收情况。

这个回复是出乎意料的。在时间上，科大讯飞在4月20日晚已发布财报，不是未来时间。同时，作为语言模型，讯飞星火认知大模型也未生成模板化的内容。

二、逻辑能力

把两杯50度的水融在一起后，水的温度是多少？

1+1在什么情况下等于3？

如果猫会爬树，那么狗也会。

针对逻辑性问题，笔者也尝试了重新生成，来看看有没有不同的答案，但多次生成的回复是一样的。

三、编程能力

先来一个简单的编程问题“从1加到100等于多少，请用JAVA语言编程，并得出结论。”

“编写一个JAVA程序，用if-else语言判断2023年是否为闰年。”

对于其编程能力，笔者也问了两位JAVA程序员，他们都表示其编程能力还是有的。但对于大型项目还说，具体编程效果如何，可能还得看能够给出具体的描述。

四、图文生成能力

前有百度文心一言，后有通义千问等等大模型。图文生成能力也是备受关注的一点。

可以看到，讯飞星火认知大模型定位于语言模型目前无法生成图片。

五、交互能力

成语接龙是最直接的交互形式，来玩一局。

对于出现“及时雨”回复时，多次让其重新生成，答案内容并未改变。

整体来看，科大讯飞这次推出的讯飞星火认知大模型表现还比较初级，无论是语义理解，持续对话、编程能力，还是数理推理能力等，与真正的“对话式AI”还有距离。

最后再来一个问题，“目前有几个和你类似的认知智能模型？”

通过回复可以看到，当前类似的认知智能模型已经有很多了，讯飞星火认知大模型的将呈现怎样独有的优势呢？还需要再等十余天才能揭晓。返回搜狐，查看更多

【本文地址】

公司简介

联系我们

今日新闻

推荐新闻

专题文章