尝鲜讯飞星火认知大模型,看看它能力如何? | 您所在的位置:网站首页 › 编程作业:成语接龙编程 › 尝鲜讯飞星火认知大模型,看看它能力如何? |
从结果来看,仍然不尽如人意。先抛开剧情的套话描述,其演员团队依旧是错误的。 再来一个问题:以“讯飞星火”做一首藏头诗. 通过以上两次生成的内容来看,讯飞星火认知大模型有一定的能力,但其能力并不完美,完成度只能达到50%左右。 对外的内容出现偏差,可以理解,那对内呢?来问一下,科大讯飞2022年的营收情况。 这个回复是出乎意料的。在时间上,科大讯飞在4月20日晚已发布财报,不是未来时间。同时,作为语言模型,讯飞星火认知大模型也未生成模板化的内容。 二、逻辑能力 把两杯50度的水融在一起后,水的温度是多少? 1+1在什么情况下等于3? 如果猫会爬树,那么狗也会。 针对逻辑性问题,笔者也尝试了重新生成,来看看有没有不同的答案,但多次生成的回复是一样的。 三、编程能力 先来一个简单的编程问题“从1加到100等于多少,请用JAVA语言编程,并得出结论。” “编写一个JAVA程序,用if-else语言判断2023年是否为闰年。” 对于其编程能力,笔者也问了两位JAVA程序员,他们都表示其编程能力还是有的。但对于大型项目还说,具体编程效果如何,可能还得看能够给出具体的描述。 四、图文生成能力 前有百度文心一言,后有通义千问等等大模型。图文生成能力也是备受关注的一点。 可以看到,讯飞星火认知大模型定位于语言模型目前无法生成图片。 五、交互能力 成语接龙是最直接的交互形式,来玩一局。 对于出现“及时雨”回复时,多次让其重新生成,答案内容并未改变。 整体来看,科大讯飞这次推出的讯飞星火认知大模型表现还比较初级,无论是语义理解,持续对话、编程能力,还是数理推理能力等,与真正的“对话式AI”还有距离。 最后再来一个问题,“目前有几个和你类似的认知智能模型?” 通过回复可以看到,当前类似的认知智能模型已经有很多了,讯飞星火认知大模型的将呈现怎样独有的优势呢?还需要再等十余天才能揭晓。返回搜狐,查看更多 |
今日新闻 |
推荐新闻 |
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 |