商汤ChatGPT「商量」炸场!秒生6K神图,代码提速62%,现场直播怼脸 | 您所在的位置:网站首页 › 微软api翻译 › 商汤ChatGPT「商量」炸场!秒生6K神图,代码提速62%,现场直播怼脸 |
0
分享至
用微信扫码二维码 分享至好友和朋友圈 新智元报道 编辑:桃子 好困 【新智元导读】「日日新SenseNova」大模型体系发布,商汤正式官宣入局! 商汤正式加入ChatGPT战局! 就在昨天,商汤在发布会现场一口气来了个全套的,大模型文生图、代码生成、做视频、2D/3D数字人.... 话不多说,直接上图。 一个人类站在非常有未来感的建筑面前,畅想平行宇宙种种可能。 只需5分钟真人视频素材,活灵活现的数字人就来了。 还有代码翻译实时演示,码农狂喜。 日日新,又日新 这些让所有人惊呆的大模型能力,便来自商汤的「日日新SenseNova」大模型体系。 「日新SenseNova」这一名字取自《礼记·大学》中,汤之盘铭曰「苟日新、日日新、又日新」。 它寓意着在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。 在这一大模型体系中,商汤自研了中文语言大模型商量SenseChat、以及包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型与应用。 商量SenseChat:妙解复杂问题,创作一流文本 商量SenseChat是商汤最新研发的中文语言大模型,有1800亿参数。 模型训练使用了大量数据,并充分考虑了中文语境,能够更好地理解和处理中文文本。 活动现场,商量SenseChat不仅能进行单轮对话,而且多轮对话,超长文本理解能力上表现出色。 在单轮对话上,理解句子含义,判断句子合理性不在话下。 另外,还能够进行逻辑推理,比如正确完成非命题和命题的逻辑问题。 问它旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么? 在多轮对话中,商量SenseChat还具备出色的语义理解、创造力和共情能力。 能够为你提供情感上的抚慰,比如「如何提高自我认识,更好地了解自己?」 它还可以进行共同创作,比如与人一人一句共同创作儿童故事。 最后,在超长文本理解上,商量SenseChat能够帮助用户快速通过与大模型互动来获取知识、寻找答案。比如,让它快速阅读理解《专利法》。 此外,商汤直接把商量SenseChat用在了代码开发上,推出了AI代码助手。 更刺激一点在于,他们这次竟然上了现场实时演示,而且还是镜头直接怼屏幕的那种。 据了解,全新的AI代码助手为码农提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。 与此同时,AI代码助手还支持中英文,以及多种编程语言,并能够快速适应码农个性化编码风格。 在内部实测中,AI代码助手可以让代码编写效率提升62%,HumanEval测试集一次通过率40.2%。 商汤科技董事长兼CEO徐立称,下一代软件开发范式是AI for AI,并提出了全新的二八定律:代码= 80% AI生成+20%人工。 除了写代码,商量SenseChat已经用在医疗场景中,比如问诊分诊、医疗知识科普、疾病鉴别诊断。 未来,将继续拓展在药物治疗、手术方案等方面的问诊能力,帮助医生进一步提升诊疗效率。 真·全能AI 除了发布中文语言大模型,当前,最火的就是生成式AI了,商汤在该领域也展开了全方位的布局。 基于「日日新SenseNova」大模型体系,商汤自研了包括秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings等一系列生成式AI模型及应用。 文生图创作平台「秒画SenseMirage」 文生图有多强,其实你刚刚也见证到了。秒画SenseMirage能够展现光影真实、细节丰富、风格多变,还能支持6K高清图的生成。 该模型基于超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格。 另外,用户还可以自主训练,可基于单卡,5分钟内定制属于自己的LoRA 模型@20张训练图片。 对创作者来说,生成模型开源社区汇聚了1万+开源模型,结合自研模型及训练能力,为其提供了更加完善的内容生产工具。 AI数字人视频生成平台「如影SenseAvatar」 谈到元宇宙,就需要数字化分身Avatar。 如今,无需专业拍摄设备,通过文字驱动,你就可以快速、高效打造一个高度逼真的数字形象。 如影SenseAvatar仅需要5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。 甚至,只需提供一个粗略的想法,文案也有了。此外,它还能支持百种语言,让你轻松创作跨国际化内容。 除了打造短视频,「如影SenseAvatar」还可以轻松制作教育、企业,娱乐文化等领域的视频。 3D内容生成平台「琼宇SenseSpace/格物SenseThings」 格物SenseThings可基于3D内容生成技术实现对空间和物体的复刻与交互,并支持再编辑再创作。 除了数字人,基于NeRF,商汤的琼宇SenseSpace可以进行场景生成,复刻和还原真实空间。 琼宇SenseSpace生成的场景不仅支持自由漫游,还支持实时交互和编辑。 比如进行城市生成,高度还原场景细节。 甚至有厘米级的重建精度,可通过实时渲染和互动带来超真实感的场景。 多源数据融合带来超精细化的清晰度和细节效果。 另外,格物SenseThings可以进行物体3D内容生成。 它能够良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原。 以上是日日新SenseNova大模型体系带来的强大内容生成能力,不论在图片、还是数字人、视频上,直接打破了人类创意天花板,将重塑行业生态。 释放大模型这么多能力,商汤的底气在哪? 5年磨一剑,直指AGI 2023年,由AIGC及ChatGPT引领的新一轮人工智能热潮已箭在弦上。 其实,早在2018年,商汤就开始着手AI大模型研发。只不过,这个概念,今年才被炒火。 到现在,这家AI公司已经5年多的技术沉淀和实践经验。已经打造了CV、NLP、AIGC多个AI大模型。 2019年,商汤最先推出了10亿参数量规模的视觉模型,实现了当时业界最好的算法效果。 那时,商汤已经具备了千卡并行的系统能力,使用了上千张GPU卡进行单任务训练。 在2021-2022年,商汤还训练了百亿参数规模的超大视觉模型,这相当于千亿参数语言模型的训练量。 目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型。 该模型已经实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。 今年3月,商汤还开源了多模态多任务通用大模型书生(INTERN)2.5,有30亿参数。 商汤这家前沿AI科技公司,不仅有着深厚的算法积淀,最重要的是还有强大的基础设施——SenseCore AI大装置。 在急需算力的当下,商汤SenseCore AI大装置以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施。 现有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。 算法,算力有了,数据怎么来? 一直以来,商汤在智慧城市、智慧商业等领域的长期耕耘,积累了海量真实世界的高质量视觉数据。 徐立表示,模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量,即模型的能力可以用所依赖计算量来做标定。这就是新时代下,算法、数据和算力的新公式。 发布会现场,商汤基于「日日新SenseNova」大模型体系和AI大装置SenseCore,面向商业伙伴提供API。 其中包括图片生成,自然语言生成,视觉感知通用任务与标注服务,客户可以根据自己想要的内容进行调用。 在推进AGI布局上,商汤向所有人展示了大模型+大算力的战略布局。 未来,商汤还将继续推进「日日新SenseNova」大模型体系的建设,将AGI作为核心发展目标。 日复一日,在大模型研发实现AGI突破,让AI惠及每个人。 特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。 Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services. /阅读下一篇/ 返回网易首页 下载网易新闻客户端 |
CopyRight 2018-2019 实验室设备网 版权所有 |