行业研究报告哪里找

您所在的位置:网站首页 美股vldr 行业研究报告哪里找

行业研究报告哪里找

2024-07-16 07:16:57| 来源: 网络整理| 查看: 265

人工智能行业从CHAT~GPT到生成式AI(Generative AI):人工智能新范式重新定义生产力-230129(100页).pdf

从从CHATCHAT-GPTGPT到生成式到生成式AIAI(Generative AIGenerative AI):):人工智能新范式,重新定义生产力人工智能新范式,重新定义生产力证券研究报告证券研究报告 行业深度报告行业深度报告发布日期:2023年1月29日本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供,由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。分析师:武超则分析师:武超则SAC编号:S1440513090003SFC编号:BEM208分析师:杨艾莉分析师:杨艾莉SAC编号:S1440519060002SFC编号:BQI330研究助理:杨晓玮研究助理:杨晓玮 1 1核心观点核心观点 近期人工智能研究公司近期人工智能研究公司OpenAI推出的聊天机器人模型推出的聊天机器人模型CHAT-GPT不断不断出圈出圈,据据 Semafor援引知情人士报道援引知情人士报道,微软正商谈以微软正商谈以 290 亿美元估值亿美元估值,向向 OpenAI 投资投资 100 亿美元亿美元,一切一切均指向人工智能模型的新范式均指向人工智能模型的新范式“生成式生成式AI模型模型(Generative Model)”。此前的决策式此前的决策式AI模型模型(Discriminant Model)是根据已有数据进行分析是根据已有数据进行分析、判断判断、预测预测,典典型应用为内容的智能推荐型应用为内容的智能推荐(短视频短视频)、自动驾驶等;而生成式自动驾驶等;而生成式AI更强调学习归纳后进行演更强调学习归纳后进行演绎创造绎创造,生成全新的内容生成全新的内容,本质是对生产力的大幅度提升和创造本质是对生产力的大幅度提升和创造,已催生了营销已催生了营销、设计设计、建筑和内容领域的创造性工作建筑和内容领域的创造性工作,并开始在生命科学并开始在生命科学、医疗医疗、制造制造、材料科学材料科学、媒体媒体、娱乐娱乐、汽车汽车、航空航天进行初步应用航空航天进行初步应用,为各个领域带来巨大的生产力提升为各个领域带来巨大的生产力提升。2 2前言:微软,百亿美金级别的选择(前言:微软,百亿美金级别的选择(1)资料来源:微软,Semafor,The information,中信建投 继继2019年向年向OpenAI注资注资10亿美元之后亿美元之后,微软与微软与OpenAI的合作进入第三阶段的合作进入第三阶段。此前据 Semafor 援引知情人士报道,微软正商谈以 290 亿美元估值,向 OpenAI 投资 100亿美元。2019年,微软即开始与OpenAI进行合作。到了2021年,微软向OpenAI投资10亿美金。根据微软对外的声明根据微软对外的声明,在与在与OpenAI新的合作阶段中新的合作阶段中,微软将有以下计划微软将有以下计划 Supercomputing at scale:微软将增加对专业超算系统开发和部署的投资,以加速OpenAI突破性的独立AI研究。微软还将继续构建Azure的AI基础结构,以帮助客户在全球范围内构建和部署各自的AI应用程序。New AI-powered experiences:微软将在其消费者和企业产品中部署OpenAI模型,并引入基于OpenAI技术的新型数字体验。包括微软的Azure OpenAI服务,该服务使开发人员能够通过直接访问OpenAI模型来构建尖端的AI应用程序。Exclusive cloud provider:作为OpenAI的独家云供应商,Azure将为OpenAI 在研究、产品和API服务中的所有工作负载提供支持。此外据媒体报道此外据媒体报道,微软还计划将微软还计划将ChatGPT整合进旗下搜索引擎必应整合进旗下搜索引擎必应(Bing),提高必应提高必应在搜索引擎市场的市占率;同时在搜索引擎市场的市占率;同时Chat-GPT功能引入功能引入Office,用于部分文本的生成和问答用于部分文本的生成和问答。3 3前言:微软,百亿美金级别的选择(前言:微软,百亿美金级别的选择(2)资料来源:微软,OpenAI,中信建投 OpenAI表示表示,来自微软的投资将使来自微软的投资将使其其能独立研究开发出更安全能独立研究开发出更安全、有用和强大的有用和强大的 AI。根据微软对外的声明根据微软对外的声明,此前其与此前其与OpenAI的合作已取得一定成绩的合作已取得一定成绩,并将继续向前并将继续向前 自 2016 年以来,微软致力于将Azure 打造成世界级AI 超级计算机,微软和 OpenAI推动了云超级计算技术的前沿,在 2020 年推出其第一台 Top-5 超级计算机,随后大规模构建了多个 AI 超级计算系统。OpenAI 使用此基础结构来训练其突破性模型,这些模型现已部署在 Azure 中,以支持 GitHub Copilot、DALL E 2 和 ChatGPT。双方的创新激发了人们的想象力,并将大规模人工智能作为一种强大的通用技术平台引入,这将在个人计算机、互联网、移动设备和云的规模上产生变革性的影响这将在个人计算机、互联网、移动设备和云的规模上产生变革性的影响。4 4目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成:从判别决策到创造生成生成式生成式AI:范式升级:范式升级,应用多元应用多元第三章第三章生成式生成式AI应用:内容制作应用:内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用第六章第六章综合应用:游戏行业的案例综合应用:游戏行业的案例 5 5蒸汽机蒸汽机电力电力信息技术信息技术人工智能人工智能大数据大数据1.1 AI正在推动第四次工业革命,进一步提升生产力正在推动第四次工业革命,进一步提升生产力资料来源:世界银行,联合国教科文组织,科学的历程,中信建投18世纪世纪19-20世纪世纪20世纪后期世纪后期21世纪世纪-第一次工业革命第一次工业革命第二次工业革命第二次工业革命第三次工业革命第三次工业革命第一次信息革命第一次信息革命第四次工业革命第四次工业革命第二次信息革命第二次信息革命机器替代人力大规模工业生产替代个体手工生产电能成为主要能源,社会生产力远超蒸汽时代动力提高:发动机、电动机等信息传输效率提高:电报、无线电通讯等原子能、电子计算机和空间技术的发展,其中电子计算机为核心电子计算机替代部分脑力劳动,少部分模拟人的智能活动人工智能、物联网、生物技术等人工智能为主要驱人工智能为主要驱动力动力,数据成为重数据成为重要的生产要素要的生产要素决策式决策式AI:实现分:实现分析功能析功能生成式生成式AI:实现创:实现创造性功能造性功能 6 61.2 AI:从决策到:从决策到生成生成,AI技术与应用迎来跨越发展技术与应用迎来跨越发展资料来源:Dynabench:Rethinking Benchmarking in NLP,Google Scholar,indigox.me,公司官网,中信建投2011年以前年以前2012年至今年至今前神经网络前神经网络专家系统专家系统概率推论概率推论神经网络神经网络基础模型基础模型 大规模模型大规模模型AI学科成立学科成立1956感知器模型感知器模型解答特定领域解答特定领域的问题的问题1980sProlog&Lisp专家系统专家系统机器语言翻译机器语言翻译2014GAN生成图像但生成图像但分辨率不高分辨率不高生成式生成式AI急速发展急速发展决策式决策式/分析式分析式AI时代时代1990s机器学习算法机器学习算法IBM 沃森沃森益智问答益智问答打败人类打败人类2011大数据大数据推荐算法推荐算法2012DNNs物体识别物体识别自动驾驶自动驾驶2017Transformer能够完成能够完成大多数大多数NLP任务任务2020GPT-3 网络结构进化网络结构进化为后续大型模为后续大型模型打下基础型打下基础1994GroupLens首个自动首个自动化推荐系统化推荐系统2021CLIP由文本生成由文本生成的高清具有的高清具有独创性图像独创性图像AI绘画绘画2022DALL E2 以以40亿个文亿个文本本-图像对为图像对为训练数据训练数据实现文本到实现文本到图像跨模态图像跨模态2014人类平均水平线人类平均水平线AI的急速发展使得的急速发展使得AI模型在手写识别、语音识模型在手写识别、语音识别、图像识别、阅读理解、语言理解等领域的别、图像识别、阅读理解、语言理解等领域的表现加速超越人类平均水平表现加速超越人类平均水平 7 71.3 AI:决策式:决策式AIAI与生成式与生成式AIAI对比对比类型类型决策式决策式AIAI生成式生成式AIAI技术路径技术路径已知数据分别求解输出类别标签,区分不同类型数据,例如将图像区分为猫和狗分析归纳已有数据后创作新的内容,例如生成逼真的猫或狗的图像成熟程度成熟程度技术成熟,应用广泛,辅助提高非创造性工作效率2014年开始快速发展,近期发展速度呈指数级爆发,部分领域应用落地应用方向应用方向推荐系统、风控系统、决策智能体等内容创作、科研、人机交互以及多个工业领域应用产品应用产品人脸识别、精准广告推送、金融用户评级、智能辅助驾驶等文案写作、文字转图片、视频智能配音、智能海报生成、视频智能特效、代码生成、语音人机交互、智能医疗诊断等 AI模型可大致分为决策式模型可大致分为决策式/分析式分析式AI(Discriminant/Analytical AI)和生成式和生成式AI(Generative AI)两类两类。决策式决策式AI:学习数据中的条件概率分布,根据已有数据进行分析、判断、预测,主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。生成式生成式AI:学习数据中的联合概率分布,并非简单分析已有数据而是学习归纳已有数据后进行演技创造,基于历史进行模仿式、缝合式创作,生成了全新的内容生成了全新的内容,也能解决判别问题也能解决判别问题。表:决策式表:决策式AIAI与生成式与生成式AIAI对比对比资料来源:Learn Open CV,海外独角兽,中信建投 8 81.4 决策式决策式AI:推荐系统、图像识别等已创造巨大市场:推荐系统、图像识别等已创造巨大市场资料来源:沙利文,公司官网,中信建投010002000300040005000600070002016201720182019202020212022E2023E2024E2030E图:全球人工智能市场规模及预测(亿美元)图:全球人工智能市场规模及预测(亿美元)2016年年,人工智能技术全面爆发人工智能技术全面爆发,决策式决策式AI开始大规模应用开始大规模应用,包括推荐系统包括推荐系统、计算机视觉计算机视觉、自然语言处理等自然语言处理等。全球人工智能市场规模从2016年的约600亿美元发展到2021年的近3000亿美元,在推荐系统、计算机视觉、自然语言处理等技术加持下,亚马逊、字节、商汤、特斯拉等公司快速发展。我们认为我们认为,生成式生成式AI经过前期技术积累进入爆发期经过前期技术积累进入爆发期,随着技术与应用的进一步成熟随着技术与应用的进一步成熟,后续市场空间更为广阔后续市场空间更为广阔。2015及以前决策式决策式AIAI大规模应用大规模应用生成式生成式AIAI大规模大规模成熟应用成熟应用AIAI技术积累技术积累生成式生成式AIAI部分部分应用趋于成熟应用趋于成熟决策式决策式AIAI全面爆发全面爆发决决策策式式AI推荐系统推荐系统电商:广告、商品电商:广告、商品推荐推荐娱乐:新闻、视频、娱乐:新闻、视频、音乐、游戏等推荐音乐、游戏等推荐图像识别图像识别人脸识别:人脸识别:Face ID身份认证身份认证自动驾驶自动驾驶内容审核内容审核文本分类、情感分文本分类、情感分析、规则引擎等析、规则引擎等生成式生成式AIAI爆发爆发生生成成式式AI内容内容科研科研建筑建筑航天航天医疗医疗材料材料能源能源计算机计算机 9 91.4.1 决策式决策式AI应用:推荐系统助力电商、视频等行业快速发展应用:推荐系统助力电商、视频等行业快速发展资料来源:华为云,VentureBeat,CSDN,中信建投 电商推荐:深度挖掘用户和物品的关联关系电商推荐:深度挖掘用户和物品的关联关系,将商品将商品、店铺精准推送给用户店铺精准推送给用户。2003年,亚马逊将协同过滤推荐算法应用到电商行业,凭借推荐商品与用户需求精准匹配、大幅降低用户检索用时,推荐算法在电商交易中心逐渐成为资源配置的核心。推荐系统显著提升电商平台销售额推荐系统显著提升电商平台销售额。2006年,据VentureBeat,亚马逊的个性化推荐系统为其贡献了35%以上的销售额;2015年,京东基于大数据个性化推荐算法的订单占到总订单的10%。新闻新闻、音乐音乐、视频等推荐:分析用户长期兴趣和短期兴趣视频等推荐:分析用户长期兴趣和短期兴趣,根据兴趣标签将内容实时推送给用户根据兴趣标签将内容实时推送给用户。推荐算法通过对用户观看、停留、点赞等行为的实时分析,精准刻画用户画像,将用户可能感兴趣的内容推荐给用户,降低人工运营规则的摄入,显著提高了用户粘性。图:推荐系统精准刻画用户画像准确推送图:推荐系统精准刻画用户画像准确推送用户用户电商电商媒体媒体资讯资讯观看、停留时长、点赞、评论浏览、点击、收藏、购买推荐商品推荐新闻、音乐、视频等用户数据用户数据行为数据行为数据商品、资讯数据商品、资讯数据决策式决策式AI实时分析实时分析用户特征用户特征兴趣标签兴趣标签商品、资讯特征商品、资讯特征画像描绘兴趣挖掘特征引擎推荐结果列表 10101.4.1 决策式决策式AI应用:字节跳动凭精准推送应用:字节跳动凭精准推送1010年内估值超年内估值超30003000亿美元亿美元资料来源:36氪,钛媒体,晚点LatePost,QuestMobile,富途资讯,中信建投 字节跳动:字节跳动:AI驱动抖音驱动抖音、头条精准推荐内容头条精准推荐内容,10年内年内估值估值超超3000亿美元亿美元。凭借判别式AI等先进算法对用户画像的学习,抖音、头条等字节系产品,将内容与广告等高效、精准推荐给用户,快速驱动自身用户数、业绩与估值增长。用户数量方面用户数量方面,据QuestMobile,抖音2022年9月月活7.1亿,全国移动互联网用户渗透率50%;2021年12月,今日头条月活3.3亿,远高于传统新闻资讯平台;收入收入方面方面,据晚点LatePost及华尔街日报,字节收入由2016年的60亿元,上升到2021年的4391亿元,CAGR达136%;市值方面市值方面,据创业家及胡润研究院2021全球独角兽榜,字节跳动市值由2014年的5亿美元,上升至2021年的3375亿美元。图:图:20212021年底各大新闻资讯平台年底各大新闻资讯平台MAUMAU(亿)(亿)0123456782017-022017-062017-102018-022018-062018-102019-022019-062019-102020-022020-062020-102021-022021-06 2021-102022-022022-06图:抖音主站月活(亿)图:抖音主站月活(亿)图:字节跳动市值变化(十亿美元)图:字节跳动市值变化(十亿美元)0.5112075140337.50501001502002503003504002014201620172018202020210.00.51.01.52.02.53.03.5 11111.4.2 决策式决策式AI应用:图像识别推动自动驾驶市场快速增长应用:图像识别推动自动驾驶市场快速增长资料来源:IDC,零壹智库,中信建投 自动驾驶:自动驾驶:AI智能分析智能分析、识别路况识别路况,渗透率不断提升渗透率不断提升。借助决策式AI,自动驾驶汽车可分析判别各种路况,并可对多种物体进行识别与跟踪,从而提高行车的安全性,例如行人、空旷行驶空间、地上标注、红绿灯、车辆等。目前自动驾驶市场规模快速增长目前自动驾驶市场规模快速增长,据据Research And Markets,2021年全球无人驾驶汽车的市场规模约年全球无人驾驶汽车的市场规模约273亿美亿美元元,2026年全球无人驾驶汽车市场规模将达到年全球无人驾驶汽车市场规模将达到594亿美元亿美元,年复合增长率为年复合增长率为16.84%。带动产业链发展带动产业链发展,多环节均有高市值上市公司及高估值公司多环节均有高市值上市公司及高估值公司。判别式AI为自动驾驶汽车提供核心技术支持,自动驾驶汽车的销售则带动整个相关产业链的发展,如车用无线通信技术V2X、高精度地图、激光雷达、芯片、ADAS驾驶辅助系统、智能车解决方案等。多个产业链环节均有高估值、大市值公司诞生,例如蔚来汽车(造车)、商汤科技(激光雷达、V2X、ADAS等)、Momenta(高精度地图)等。图:全球自动驾驶汽车销量及预测(万辆)图:全球自动驾驶汽车销量及预测(万辆)公司名称业务市值特斯拉造车;L4自动驾驶5785亿美元蔚来汽车造车;L4自动驾驶1400亿港元小鹏汽车造车;L4自动驾驶485亿港元理想汽车造车;L4自动驾驶1469亿港元商汤科技激光雷达;V2X;ADAS算法620亿港元寒武纪V2X;自动驾驶芯片;ADAS算法255亿人民币表:自动驾驶产业链上市公司市值(亿美元,截至表:自动驾驶产业链上市公司市值(亿美元,截至20222022年年1111月月2424日)日)公司名称业务估值公司名称业务估值哪吒汽车造车70亿蘑菇车联V2X;L4 自动驾驶30亿滴滴自动驾驶L4 自动驾驶34亿地平线V2X;自动驾驶芯片;ADAS 算法30亿文远知行造车;L4自动驾驶33亿奇点汽车造车;L4自动驾驶27亿小马智行造车;L4 自动驾驶31亿酷哇机器人造车;车联网;高精度地图25亿Momenta高精度地图31亿千寻位置高精度地图21亿表:自动驾驶产业链非上市公司估值(亿美元,截至表:自动驾驶产业链非上市公司估值(亿美元,截至20222022年年2 2月)月)010002000300040005000600020202021202220232024L1L2L3-L5 12121.4.2 决策式决策式AI应用:应用:AI四小龙多领域开创“四小龙多领域开创“AI ”新业态”新业态资料来源:公司官网,中信建投 AI四小龙:在多场景探索计算机视觉应用四小龙:在多场景探索计算机视觉应用。借助判别式AI,商汤科技、旷视科技、依图科技、云从科技对C端、B端、G端的各大应用场景进行智能分析,提高信息的判别分析效率、节省人力成本,并为用户及时提供决策反馈。四家公司均获得了较高的估值。商汤科技:商汤科技:将人工智能基础设施、智能驾驶、人/物检测、SLAM、图像生成、智能决策为核心,应用领域涵盖智能驾驶、身份验证、城市管理、游戏AI、VR/AR等,11月24日市值620亿港元。旷视科技:旷视科技:专注于图像/视频的分析与理解,以人脸识别为核心,业务场景包括城市治理、楼宇园区管理、实名认证、通行考勤等,据胡润全球独角兽榜,2021年估值270亿元。依图科技:依图科技:聚焦于人脸识别、自然语言处理等领域,解决方案包括城市管理、智慧医疗等据胡润全球独角兽榜,2020 年估值140亿元。云从科技:云从科技:建立视觉、语言、环境认知系统,应用于智慧交通、金融、教育等领域,11月24日市值131亿元。类型应用场景商汤科技旷视科技依图科技云从科技C端手机人脸3D重建、手机图像处理、手机人脸解锁方案等手机安全、认证、影像等解决方案汽车高级辅助驾驶系统、智能座舱车主身份验证、司机驾驶状态分析B端金融互联网金融、线下金融、智慧网店、会员识别等卡证信息录入、身份认证智能网点、刷脸取款解决方案智慧网点、智慧识人、票据OCR、风控解决方案医疗智慧诊疗平台Care.ai医疗智能全栈式产品解决方案教育AI基础教育、智慧校园教育行业数字化物流仓储物流数字化制造工厂制造数字化G端安防方舟城市级开放视觉平台、人脸动态比对服务器等产品城市管理、楼宇园区管理数字化解决方案城市安全、智慧园区AI 人像大数据、智慧社区实有人口、智慧园区安防解决方案交通人群分析系统民航旅客出港服务、航站楼管理服务、民航大数据服务零售智慧商业解决方案零售行业数字化解决方案顾客识别、轨迹热区、4D店标准化解决方案智慧门店综合、智慧4D专营店智慧案场人脸识别解决方案表:表:AIAI四小龙四小龙AIAI应用场景应用场景 13131.4.3 决策式决策式AI应用:内容审核显著降低人工成本应用:内容审核显著降低人工成本资料来源:公司官网,中信建投 决策式决策式AI通过通过规则引擎规则引擎、文本分类文本分类、图像分类等进行内容审核图像分类等进行内容审核,广泛应用于搜索引擎广泛应用于搜索引擎、社交平台社交平台、电子商务电子商务、新闻网站等领域新闻网站等领域,以确保内容符合法律法规和公司政策以确保内容符合法律法规和公司政策,保护用户隐私和安全保护用户隐私和安全,大幅降低了各公司人工审核的大幅降低了各公司人工审核的成本成本,并提高了内容质量并提高了内容质量,建立了用户信任建立了用户信任。规则引擎:规则引擎:通过预定义的规则检查内容是否包含某些敏感词汇以决定是否通过审核。文本分类:文本分类:按照一定的体系或标准对文本进行自动分类标记,包括情感分析、意图识别、主体分类等,例如识别评论是积极的还是消极的、将文本按照政治、军事、体育等进行分类等。图像分类:图像分类:将图像内容进行分类,例如将图像分入动物、植物、风景、人像等不同的类别。应用领域应用领域名称名称应用场景应用场景搜索引擎谷歌网页敏感词审核、内容审核、广告审核等百度社交平台Facebook对用户发布的文字、图像、视频的进行审核,屏蔽侮辱、攻击性、暴力、色情等违法违规信息以及虚假信息等Twitter微信微博电子商务京东商品内容审核、商品宣传图审核、违法宣传标语过滤、评论审核、虚假评论及恶意评论的过滤等淘宝新闻网站Reuters智能新闻分类、虚假新闻识别过滤、评论审核等表:内容审核应用场景表:内容审核应用场景 14141.4.4 决策式决策式AI应用:谷歌开发多款模型替代人力分析应用:谷歌开发多款模型替代人力分析资料来源:谷歌,Google Scholar,36氪,中信建投 谷歌深耕人工智能领域谷歌深耕人工智能领域,不仅开发出了多个图像识别不仅开发出了多个图像识别、人脸识别人脸识别、语音识别算法语音识别算法,替代了常见的人类能够完成替代了常见的人类能够完成的分析性工作的分析性工作,还推出了天气预测还推出了天气预测、流行病预测等模型流行病预测等模型,实现了优于常人的决策结果实现了优于常人的决策结果。名称名称时间时间应用应用Building High-level FeaturesUsing Large Scale Unsupervised Learning2012训练人工神经网络从无标注图像识别特征,例如识别图像中的人脸、猫脸等TensorFlow2015包含一系列机器学习算法,支持多种编程语言,方便用户训练、开发、部署机器学习模型。不仅支持判别式模型,也支持生成式模型不仅支持判别式模型,也支持生成式模型AlphaGo2015通过对大量数据学习如何做出围棋决策,击败世界顶尖围棋选手,后续用于金融领域预测股票价格、自动驾驶领域判断路况等FaceNet2015使用深度卷积网络,高精度识别人脸图像之间的差别Wide&Deep2016基于Embedding和多层感知机的推荐算法,在推荐领域有广泛的应用Joint Speech Recognition and Speaker Diarization via Sequence Transduction 2018集成语音识别和说话人分类系统,判断谁在什么时候说了什么Building Damage Detection in Satellite Imagery Using Convolutional Neural Networks2019使用卫星遥感图像分析建筑物的损坏程度,为救灾决策提供帮助MetNet2020通过观测数据预测天气,能够以1km的解析度、两分钟的时间间隔预测未来8小时内的降雨量A prospective evaluation of AI-augmented epidemiology to forecast COVID-19 in the USA and Japan2021模拟政策变化对新冠确诊人数和死亡病例的影响表:谷歌部分决策式表:谷歌部分决策式AIAI模型梳理模型梳理 1515目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成:从判别决策到创造生成生成式生成式AI:范式升级:范式升级,应用多元应用多元第三章第三章生成式生成式AI应用:内容制作应用:内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用第六章第六章综合应用:游戏行业的案例综合应用:游戏行业的案例 16162.1 生成式生成式AI VS Web 3.0:不仅是:不仅是web3.0的生产工具,更是人工智能的新范式的生产工具,更是人工智能的新范式资料来源:Gartner,陀螺科技,雷锋网,中信建投 生成式生成式AI可以作为可以作为Web3.0的生产工具的生产工具,但但Web3.0中的应用仅是其应用的冰山一角中的应用仅是其应用的冰山一角。Web3.0围绕去中心化的理念展开,结合区块链、智能合约、加密货币等技术,核心是产生的数据由用户拥有,能够改变用户数据及原创内容等均由互联网中心化实体控制的现状,在创作者经济中取得更好的平衡从而提升用户创作内容的积极性。生成式AI在内容领域的应用能够满足用户不断提升的创作需求,但这仅是其应用的冰山一角。生成式生成式AI在广大垂直领域的应用带来的是在广大垂直领域的应用带来的是AI用途的结构性改变以及生产力的进一步提高用途的结构性改变以及生产力的进一步提高,未来可能创造巨大未来可能创造巨大的市场价值的市场价值。图:生成式图:生成式AIAI与与Web3.0Web3.0生成式生成式AIWeb3.0人工智能内容创作设计科研计算机建筑航天医疗材料能源 17172.1 生成式生成式AI VS Web 3.0:不追求生产关系的重塑,但将大幅度提升和创造生产力:不追求生产关系的重塑,但将大幅度提升和创造生产力资料来源:中国管理信息化,雷锋网,中信建投 创造是生成式创造是生成式AI的核心的核心,本质是对生产力的大幅度提升和创造本质是对生产力的大幅度提升和创造。生成式AI通过从数据中学习要素,进而生成全新的、原创的内容或产品,不仅能够实现传统AI的分析、判断、决策功能,还能够实现传统AI力所不及的创造性功能。生成式AI已催生了营销、设计、建筑和内容领域的创造性工作,并开始在生命科学、医疗、制造、材料科学、媒体、娱乐、汽车、航空航天进行初步应用,为各个领域带来巨大的生产力提升。生成式生成式AI将促进生产关系高效发展将促进生产关系高效发展,而不是像而不是像Web3.0重塑生产关系重塑生产关系。Web3.0通过底层的分布式与去中心化、密码学的应用、加密货币的结算方式,为集体协作、分工、收益提供了更好的结算方式,去中心化自治组织(Decentralized Autonomous Organization,DAO)将是常见的组织形态,打破了原有的生产关系。生成式AI不是打破传统的生产关系,而是通过提高生产力促进现有生产关系高效发展。图:生成式图:生成式AIAI与与Web3.0Web3.0对生产关系的影响对生产关系的影响传统传统Web3.0生产关系生产关系生产力生产力反作用作用生成式生成式AIAI生产关系生产关系生产力大幅提高生产力大幅提高反作用促进生产关系高效发展DAO形式的形式的分布式生产关系分布式生产关系 18182.2 生成式生成式AI:“最有商业前景的人工智能技术”:“最有商业前景的人工智能技术”资料来源:Gartner,中信建投 Gartner将生成式将生成式AI列为最有商业前景的人工智能技术列为最有商业前景的人工智能技术。根据其发布的根据其发布的2022年人工智能技术成熟度曲线年人工智能技术成熟度曲线,预计生预计生成式成式AI 2-5内将进入生产成熟期内将进入生产成熟期,发展潜力与应用空间巨大:发展潜力与应用空间巨大:2025年,生成式AI产生的数据将占到所有数据的10%,而2021年生成式AI产生的数据不到所有数据的1%;2025年,30%的大型组织出站消息将由生成式AI生成;2025年,50%的药物发现与研发将使用生成式AI;2027年,30%的制造商将使用生成式AI提高产品研发效率。图:图:20222022年人工智能技术成熟度曲线年人工智能技术成熟度曲线生成式人工智能 19192.3 资本:海外一级投资涌入资本:海外一级投资涌入 多家知名风投公司看好生成式多家知名风投公司看好生成式AI赛道:赛道:红杉资本官网9月19日发布的文章生成式AI:充满创造力的新世界中提到:“生成式AI有潜力产生数万亿美元的经济价值”。Coatue发布的AI2022:爆发认为规模化突破使得AI在短时间内变得指数级强大,其应用场景迅速突破。2022年10月,Stability AI完成1.01亿美元融资,估值10亿美元,投资方包括Coatue、Lightspeed VenturePartners和OShaughnessy Ventures。公司由前英国对冲基金经理Emad Mostaque于2020年成立。2022年10月,Jasper完成1.25亿美元融资,估值达15亿美元,投资者包括Coatue、Bessemer VenturePartners、IVP等多家机构。2019年,OpenAI获得微软10亿美元投资,2021年OpenAI 估值已达200亿美元。表:风投机构视角下的生成式表:风投机构视角下的生成式AIAI资料来源:公司官网,中信建投This incredible AI renaissance is happening simultaneously across many diverse fields and verticals.This is not a coincidence:scaling breakthroughs have enabled AI to become exponentially more powerful in a very short period of time.Engineers are now taking this technology breakthrough and applying it everywhere they can.20202.3 资本:海外一级投资涌入资本:海外一级投资涌入 多家生成式多家生成式AI公司进入公司进入Madrona、高盛高盛、微软微软、亚马逊网络服务和亚马逊网络服务和 PitchBook联合发布的联合发布的2022年智能应用前年智能应用前40名榜单名榜单(Intelligent Applications 40,IA40)。IA40招募了来自40多家顶级风险投资和投资公司的50多名风险投资人,提名并投票选出塑造智能应用未来的顶级公司,这些公司自成立以来募资超160亿美元,今年募资超过50亿美元,其中包括Runway、Jasper、Copy.ai在内的14家生成式AI相关公司,占比达35%。表:表:20222022年年IA40IA40(生成式(生成式AIAI公司用虚线框出)公司用虚线框出)资料来源:公司官网,中信建投 21211.E 001.E 011.E 021.E 031.E 041.E 051.E 061.E 071.E 081.E 091.E 101.E 111.E 121.E 131.E 141.E 151.E 161.E 171.E 181.E 191.E 201.E 211.E 221.E 231.E 241952195419561958196019621964196619681970197219741976197819801982198419861988199019921994199619982000200220042006200820102012201420162018202020222.4 技术:技术:2022年是拐点年是拐点资料来源:COMPUTE TRENDS ACROSS THREE ERAS OF MACHINE LEARNING,Google Scholar,中信建投 前期架构前期架构、模型模型、数据数据、算力的积累与提升算力的积累与提升架构改进:架构改进:深度神经网络的学习能力和模型的大小呈正相关,但规模越大训练难度越高,需要对结构进行改进,拥有更强并行性的Transformer架构带来了深度神经网络参数量从最早的几万到目前的数千亿的跃升。模型发展:模型发展:GPT-3、CLIP、Diffusion、DALL E2等模型的提出极大提升了AI处理NLP、跨模态、生成问题的能力。数据增多:数据增多:拥有的优质训练数据越多,算法从中学习的效果越好。随着数字时代的到来,生成数据的工具和软件越来越普遍,数据总量呈指数增长,可供AI训练的数据质量和数量均有很大提升。算力提升:算力提升:大规模深度学习模型的参数和数据量达到了一定量级,需要相应算力的支撑,目前,大规模模型的训练算力是原来的10到100倍。图:用于训练机器学习经典算法的算力图:用于训练机器学习经典算法的算力用于AI训练的算力增长符合摩尔定律,大约每20个月翻一番深度学习的出现加速了性能的扩展,用于AI训练的算力大约每6个月翻一番大规模模型出现,其训练算力是原来的是原来的10到100倍深度学习出现深度学习出现大规模模型出现大规模模型出现训练算力(FLOPs)图:生成式图:生成式AIAI关键模型关键模型/架构架构20222021202020192018201720142013DALL E2对比语言图像预训练对比语言图像预训练(CLIP)、扩散模型、扩散模型GPT-3 GPT-2生成式预训练(生成式预训练(GPT)变换器架构(变换器架构(TransformerTransformer)生成对抗网络(生成对抗网络(GAN)变分自编码器(变分自编码器(VAE)22222.5 技术:模型迭代技术:模型迭代资料来源:freeCodeCamp,Google Scholar,中信建投 变分自编码器变分自编码器(Variational Autoencoder,VAE):2013年由Diederik P.Kingma和Max Welling提出,编码器将原始高维输入转换为对潜在空间的概率分布描述,从中采样输入解码器,得到新生成的结果,可用于图像生成、语音合成等,生成的图像较为模糊。生成式对抗网络生成式对抗网络(Generative Adversarial Nets,GAN):2014年由Ian J.Goodfellow等人提出,模型由生成器和判别器组成,以图像生成为例,生成器输入训练噪声后生成图像,判别器用来判断图像是真实的还是由生成器生成的,随着训练不断进行,生成器水平提升,判别器不再分辨图像真伪,固定生成器对判别器进行驯良,直到判别器能够分辨图像真伪,固定判别器再次训练生成器,不断循环,获得生成效果好的生成器。GAN模型能够生成图像、3D模型甚至视频,但对输出结果控制较弱,易产生随机结果。图:图:GANGAN模型示意图模型示意图图:图:VAEVAE模型示意图模型示意图 23232.5 技术:架构升级,能力质变技术:架构升级,能力质变资料来源:中国信通院,Google Scholar,中信建投 Transformer:2017年由Google团队提出,采用自注意力机制,按输入数据各部分重要性的不同而分配不同的权重,仅用attention来做特征抽取,网络结构的进化带来了参数量和模型层数的提高,引起了生成式AI技术能力的质变;并行化优势允许其在更大的数据集上进行训练,这也促成了GPT等预训练模型的发展。视觉视觉Transformer(ViT):2020年由Google团队提出,将Transformer应用在图像分类领域。ViT将输入图片分为16x16个patch,再将每个patch投影为固定长度的向量送入Transformer,后续操作与原始Transformer相同。ViT通过将人类先验经验知识引入网络结构设计,获得了更快的收敛速度、更低的计算代价、更多的特征尺度、更强的泛化能力,能够更好地学习和编码数据中蕴含的知识,正在成为视觉领域的基础网络架构。以ViT为代表的视觉大模型赋予了AI感知、理解视觉数据的能力,提升了AI的感知能力。图:图:ViTViT模型示意图模型示意图图:图:TransformerTransformer模型示意图模型示意图 24242.5 技术:技术:快速进化快速进化资料来源:中国信通院,OpenAI,Google Scholar,中信建投 GPT-3升级升级自然语言处理自然语言处理,CLIP实现文本与图像互相理解实现文本与图像互相理解GPT:2018年由OpenAI提出,参数量1.17亿,预训练数据量约5GB,基于Transformer模型充分利用海量无标注文本进行预训练,赋予文本大模型在小数据集、零数据集下的理解和生成能力,提升了生成式AI的认知能力。2020年GPT-3推出,参数量达1750亿,预训练数据量达45TB,除自然语言推理、句子关系判断、问答、常识推理、分类等常见NLP任务外,GPT-3在撰写文章、编写SQL语句、编写JavaScript代码等困难任务也有优异表现,入选了麻省理工科技评论2021年“十大突破性技术”。CLIP:2021年由OpenAI提出,利用文本信息监督视觉任务自训练,训练数据集为40亿个“文本-图像”对,采用Transformer模型对图像的patch序列进行建模,将不同模态的原始数据映射到统一或相似的语义空间,实现不同模态信号间的相互理解,拥有寻找不同模态数据间关系的能力,基于此能够实现不同模态数据间转化与生成,进一步可以根据图片生成对应语言描述也可以根据语言提示生成对应的图片,极大丰富了生成式AI技术的应用广度,为AIGC带来了更多的可能性。图:图:CLIP模型示意图模型示意图图:图:GPT模型示意图模型示意图 25252.5 技术:技术:快速进化快速进化资料来源:OpenAI,雷锋网,Google Scholar,腾讯科技,中信建投 Diffusion与与DALL E2实现高质量图像产出实现高质量图像产出扩散模型扩散模型(Diffusion model):扩散模型的概念最早在 2015年“Deep Unsupervised Learning using NonequilibriumThermodynamics”中被提出。2020年“Denoising Diffusion Probabilistic Models”中提出DDPM模型用于图像生成。扩散模型通过给图像增加高斯噪声破坏训练数据来学习,找出逆转噪声过程的方法,利用学习到的去噪声方法实现从随机输入中合成新的图像。该算法在分子图生成中可以进行药物分子和蛋白质分子的生成。DALL E2:2022年4月由OpenAI提出,基于CLIP实现文本与图像的联系,基于Diffusion从视觉语义生成图像,使用先验模型实现从文本语义到相应视觉语义的映射,最终实现以下功能:1)根据文本生成图片;2)将图像扩展到画布之外;3)根据文本对图像进行编辑,实现添加或删除元素;4)给定一张图片生成保持原风格的变体。图:图:扩散扩散模型算法示意图模型算法示意图图:图:DALL E2模型示意图模型示意图 26262.6 跨过恐怖谷:人类对生成式跨过恐怖谷:人类对生成式AI的好感度随其拟人程度的增加而增加的好感度随其拟人程度的增加而增加资料来源:Researchgate,抖音,中信建投 恐怖谷效应:恐怖谷效应:1970年由日本机器人专家森政弘提出的关于人类对机器人和非人类物体感觉的假设,随着类似人类物体的拟人程度增加,人类对其的好感度呈现“增-减-增”的曲线,当类似人类的物体与人类相像到一定程度后,人类对其好感度会下降呈现一个情感反应的低谷,即恐怖谷,而当其与人类的相似程度继续上升,人类对其的好感会随之增加。生成式生成式AI跨过了恐怖谷跨过了恐怖谷。随着技术的发展,生成式AI越来越多的能力接近人类甚至超越人类,人们对其不是反感而是热衷于使用,例如抖音中AI绘画特效使用人数已经超过2700万人,AI会话工具ChatGPT发布5天用户即超百万,人类对生成式AI的好感正随着其能力的提升、与人类相似程度的提升而增加,说明生成式AI已经成功跨过了恐怖谷。图:图:生成式生成式AI已经跨过恐怖谷已经跨过恐怖谷图:图:抖音抖音AI绘画特效绘画特效使用人数超使用人数超2700万万好好感感度度 -与人类相似程度与人类相似程度工业机器人工业机器人人型机器人人型机器人生成式生成式AIAI恐怖谷恐怖谷 2727 根据红杉资本的预测:后续基本模型的发展将继续推进生成式根据红杉资本的预测:后续基本模型的发展将继续推进生成式AIAI应用发展应用发展,预计预计20232023年文本领域和代码领域的应年文本领域和代码领域的应用已经成熟用已经成熟。图像图像/视频视频/3 3D D/游戏领域的成熟应用仍需要一定的发展时间游戏领域的成熟应用仍需要一定的发展时间,20252025年以后的应用发展进程仅为推测年以后的应用发展进程仅为推测。2.7 生成式生成式AI技术演进展望技术演进展望资料来源:sequoia,中信建投图:生成式图:生成式AIAI相关应用发展进程时间表相关应用发展进程时间表20202020年之前年之前20222022年年20202020年年20232023年?年?20252025年?年?约约20302030年?年?文本领域文本领域代码领域代码领域图像领域图像领域视频视频/3D/3D/游戏领域游戏领域诈骗垃圾信息识别翻译基础问答回应基础文案撰写初稿更长的文本二稿垂直领域的文案撰写实现可精调(科学论文等)终稿,水平高于人类平均值终稿,水平高于专业写手单行代码补足多行代码生成更长的代码更精确的表达支持更多语种领域更垂直根据文本生成初版应用程序根据文本生成终版应用程序,比全职开发者水平更高艺术图标摄影模仿(产品涉及、建筑等)终稿(产品涉及、建筑等)终稿,水平高于专职艺术家、设计师和摄影师视频和3D文件的基础版/初稿二稿AI版Roblox可依个人梦想定制的游戏与电影大规模实现难度:接近成熟初级尝试成熟应用 2828目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成:从判别决策到创造生成生成式生成式AI:范式升级:范式升级,应用多元应用多元第三章第三章生成式生成式AI应用:内容制作应用:内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用第六章第六章综合应用:游戏行业的案例综合应用:游戏行业的案例 29293.1 生成式生成式AI应用:娱乐媒体内容制作应用:娱乐媒体内容制作资料来源:Sequoia,中信建投 当前阶段生成式当前阶段生成式AI最常见的应用场景为娱乐媒体内容的辅助生产最常见的应用场景为娱乐媒体内容的辅助生产。以文字续写或纠错、文字转语音、文字生成语音、图像智能编辑、视频智能剪辑等方式替代既有创意产生后的专业性机械劳动,同时通过内容生成满足用户的娱乐需求或者为其提供创作灵感。随着生成式随着生成式AI的不断成熟的不断成熟,部分专业内容生产者将被替代部分专业内容生产者将被替代。数据、算力的进一步提升将带来具有更强生成效果的AI,能够根据用户需求生成个性化定制内容终稿,并且AI生成内容达到专业内容生产者水平且具有独特新颖的创意,从而替代部分文字作者、翻译人员、插画创作者、配音人员、音乐制作人、视频编辑人员等等。机器机器辅助人辅助人 辅助大批量内容生产辅助大批量内容生产 改进内容生产人工操作流程,生成内容初稿改进内容生产人工操作流程,生成内容初稿 替代既有创意产生后的专业性机械劳动替代既有创意产生后的专业性机械劳动机器机器“替代”人“替代”人 AI生成内容达到专业水准生成内容达到专业水准 根据用户需求生成个性化定制内容终稿根据用户需求生成个性化定制内容终稿 替代部分专业内容生产者替代部分专业内容生产者图图:生成式:生成式AIAI在娱乐媒体内容领域的应用在娱乐媒体内容领域的应用 30303.2 AIGC:生成式:生成式AI在娱乐媒体领域的应用(在娱乐媒体领域的应用(1)资料来源:rct ai,36氪,中信建投 AIGC(AI-Generated Content)指利用人工智能技术自动生成的内容指利用人工智能技术自动生成的内容,是继专业生成内容是继专业生成内容(PGC)和用户生成和用户生成内容内容(UGC)之后一种之后一种新型生成内容的方式新型生成内容的方式。国际上被称为人工智能合成媒体(AI-generated Media或Syntheticmedia),是通过人工智能算法对数据或媒体进行生产、操作和修改的统称。AI绘画作品出圈绘画作品出圈、一级投资活跃一级投资活跃,2022年年AIGC爆发式发展爆发式发展。2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,参赛者提交AIGC绘画作品太空歌剧院获得了此次比赛“数字艺术/数字修饰照片”类别一等奖,而参赛者没有绘画基础,通过AI绘图软件MidJourney耗时80个小时创作了该作品。AI绘画技术发展快速,从年初的技艺生疏到目前能够生成专业级别的图像仅过去几个月的时间,目前国外已有Stable Diffusion Midjourney等多个成熟的AIGC平台。其中技术领先的AI公司Open AI当前估值或达290亿美元,Stable Diffusion背后的StabilityAI 估值也达到10亿美元。图:内容生成的四个阶段图:内容生成的四个阶段专业生成内容专业生成内容专业创意团队生产内容,对专业性要求高,内容质量高用户生成内容用户生成内容用户自由创作内容,对技术要求不高,内容质量参差不齐AI辅助生成内容辅助生成内容用户和专业团队在AI的协助下生成内容,具有较高的生产效率AI生成内容生成内容人工智能技术自动生成内容,生产内容的质量、效率、自由度均较高受限于人的制造能力、想象能力、知识水平受限于人的制造能力、想象能力、知识水平所产出的内容数量和质量有限所产出的内容数量和质量有限图:图:AIAI绘画作品绘画作品太空歌剧院太空歌剧院获奖出圈获奖出圈 3131 AICGAICG大幅度降低了数字内容生产的成本大幅度降低了数字内容生产的成本,打破了数字内容生产受到人类想象能力和知识水平的限制打破了数字内容生产受到人类想象能力和知识水平的限制,广泛应用于广泛应用于文本生成文本生成、音频生成音频生成、图像生成图像生成、视频生成视频生成、跨模态生成及游戏领域跨模态生成及游戏领域,其广泛应用能够满足数字经济时代日益增其广泛应用能够满足数字经济时代日益增长的数字内容供给需求长的数字内容供给需求。3.2 AIGC:生成式:生成式AI在内容创作领域的应用(在内容创作领域的应用(2)资料来源:AIGC/AI生成内容产业展望报告,中信建投表表:AIGCAIGC应用场景及所处发展阶段应用场景及所处发展阶段类型类型应用场景应用场景所处阶段所处阶段文本生成文本生成新闻播报等结构化写作广泛应用,技术细节待提升剧情续写、营销文本等非结构化写作底层技术明确,预计1-2年将规模化应用内容推荐、文章润色等辅助性写作广泛应用,技术细节待提升智能客服、聊天机器人等交互式文本写作广泛应用,技术细节待提升文本交互游戏等底层技术明确,预计1-2年将规模化应用音频生成音频生成语音克隆广泛应用,技术细节待提升由文本生成播报、虚拟人歌声等特定语音广泛应用,技术细节待提升作曲、编曲、自动作词等乐曲/歌曲的生成广泛应用,技术细节待提升图像生成图像生成去除水印、提高分辨率、滤镜等图像编辑工具广泛应用,技术细节待提升按照特定属性生成画作、根据指定要求生成功能性图像底层技术明确,预计1-2年将规模化应用视频生成视频生成删除特定主体、生成特效、跟踪剪辑等视频属性编辑广泛应用,技术细节待提升视频换脸等视频部分剪辑底层技术明确,预计1-2年将规模化应用对特定片段进行检测及合成等视频自动剪辑底层技术待完善,增长可期跨模态生成跨模态生成根据文字生成创意图像底层技术明确,预计1-2年将规模化应用根据图片素材生成视频底层技术明确,预计1-2年将规模化应用根据文字生成创意视频底层技术待完善,增长可期根据图像或视频生成文字底层技术待完善,增长可期游戏游戏AI Bot底层技术明确,预计1-2年将规模化应用NPC逻辑及剧情底层技术明确,预计1-2年将规模化应用 3232 文本生成是生成式文本生成是生成式AIAI最早应用的领域之一最早应用的领域之一,已经在对话机器人已经在对话机器人、内容续写内容续写、新闻稿撰写新闻稿撰写、诗歌小说创作等领域具诗歌小说创作等领域具有广泛的应用有广泛的应用。对话机器人:对话机器人:包括问答型机器人、闲聊型机器人、任务型机器人、知识图谱型机器人、多轮对话机器人,在智能客服场景中能够显著降低企业人力成本。新闻稿撰写:新闻稿撰写:在全球范围具有广泛的应用,很多新闻机构使用AI生成稿件,尤其是体育、天气、股市交易变动、公司业绩报道等结构性新闻报道。自然语言生成公司Automated Insights仅在2014年就产生了10亿篇新闻文章,每秒可撰写多达2000篇新闻报道,用户包括雅虎、美联社等。3.2.1 文本生成:对话机器人、新闻稿撰写广泛应用文本生成:对话机器人、新闻稿撰写广泛应用资料来源:腾讯云,GIJN,Automated Insights,中信建投图图:腾讯云对话机器人:腾讯云对话机器人图图:Automated InsightsAutomated Insights为雅虎生成的体育新闻为雅虎生成的体育新闻 3333 内容续写:内容续写:基于给定的文本续写新的内容,续写的内容包括文学创作、商业写作、教学内容等,典型应用有Google推出的Wordcraft、OpenAI推出的GPT-3等。WordcraftWordcraft:2021年由谷歌推出,作者和AI以对话的形式共同编辑故事,支持续写、扩写、改写、生成大纲等功能,能够极大提升写作效率,激发创作者灵感。文学创作:文学创作:2017年微软研发的AI“小冰”出版了人类历史上第一部人工智能诗集阳光失了玻璃窗,其中包含139首现代诗;2018年,AI创作的小说1 The Road出版;2022年谷歌子公司DeepMind发布剧本写作AI-Dramatron,能够从一句话表述的戏剧冲突中生成剧本标题、角色、场景、对话;越来越多的AI文学创作平台进入公众视野,AI创作的内容包括剧本、诗歌、小说、对联等等。3.2.1 文本生成:内容续写、文学创作部分达到专业水平文本生成:内容续写、文学创作部分达到专业水平资料来源:Google,微软,京东,DeepMind,中信建投图:图:WordcraftWordcraft图:图:阳光失了玻璃窗阳光失了玻璃窗 3434 1111月月3030日日,OpenAIOpenAI发布语言模型发布语言模型ChatGPTChatGPT,该模型采用对话的形式该模型采用对话的形式与人进行交互与人进行交互,可以回答后续问题可以回答后续问题、承认错误承认错误、挑战不正确的前提挑战不正确的前提、拒绝不适当的请求拒绝不适当的请求。ChatGPTChatGPT不仅在日常对话不仅在日常对话、专业问题回答专业问题回答、信息检索信息检索、内容续写内容续写、文学创作文学创作、音乐创作等方面展现出强大的能力音乐创作等方面展现出强大的能力,还具有生成代码还具有生成代码、调试代码调试代码、为代码生成注释的能力为代码生成注释的能力。ChatGPTChatGPT发布后发布后5 5天用户已超百万天用户已超百万,而而OpenAIOpenAI之前发布的之前发布的GPTGPT-3 3用了将近两年的时间才突破用了将近两年的时间才突破100100万用户万用户。3.2.1 文本生成:文本生成:ChatGPT集大成集大成资料来源:OpenAI,中信建投图:图:ChatGPTChatGPT回答专业问题回答专业问题图:图:ChatGPTChatGPT创作的小说大纲创作的小说大纲 3535 ChatGPTChatGPT是基于是基于GPTGPT-3 3.5 5系列微调的结果系列微调的结果,通过基于人类反馈的强化学习通过基于人类反馈的强化学习(ReinforcementReinforcement LearningLearning fromfrom HumanHumanFeedbackFeedback,RLHFRLHF)进行训练:进行训练:收集演示数据训练监督策略:收集演示数据训练监督策略:从提示数据集中抽取提示输入并人工给出期待输出,此数据用来微调GPT-3.5;收集比较数据训练奖励模型:收集比较数据训练奖励模型:人工对模型输出的答案以及人工答案按照符合程度进行排序,此数据用于训练奖励模型;使用近端优化策略使用近端优化策略(PPO)(PPO)优化奖励模型:优化奖励模型:在提示数据集中抽取新的提示输入,PPO模型由监督策略初始化,模型根据提示输出后由奖励模型计算奖励值,PPO使用奖励值更新策略参数,然后更新PPO,持续迭代优化。3.2.1 文本生成:文本生成:ChatGPT通过基于人类反馈的强化学习训练通过基于人类反馈的强化学习训练图图:ChatGPTChatGPT通过通过RLHFRLHF训练训练资料来源:OpenAI,中信建投 3636 GPTGPT-3 3于于20202020年年5 5月发布月发布,能够生成高质量文本能够生成高质量文本,截止截止20212021年年3 3月月,已经有超过已经有超过300300个应用程序提供个应用程序提供GPTGPT-3 3 驱动的搜驱动的搜索索、对话对话、文本完成和其他文本完成和其他AIAI功能功能,GPTGPT-3 3平均每天生成平均每天生成4545亿字亿字。目前目前GPTGPT-3 3已应用于:从客户评论中识别主题并已应用于:从客户评论中识别主题并生成摘要生成摘要、为虚拟人生成对话对话使其与人自然交流为虚拟人生成对话对话使其与人自然交流、提高语义搜索的准确率等提高语义搜索的准确率等。ChatGPTChatGPT相较于相较于GPTGPT-3 3具有支持多轮对话具有支持多轮对话、易于修正易于修正、人机交互效果更好人机交互效果更好、更快更快、更高效等优势更高效等优势,且目前免费使用且目前免费使用,用户已超百万用户已超百万,更适合应用于人工智能客服更适合应用于人工智能客服、搜索引擎搜索引擎、智能客服智能客服、虚拟人虚拟人、代码编程代码编程、文学创作等领域文学创作等领域。3.2.1 文本生成:以文本生成:以GPT-3和和ChatGPT为例的应用及展望为例的应用及展望资料来源:PWC,wind,公司公告,中信建投图:图:GPTGPT-3 3驱动的虚拟人驱动的虚拟人LucyLucy图:图:ViableViable使用使用GPTGPT-3 3生成客户反馈摘要生成客户反馈摘要 3737 自动语音生成:将文本转化为语音自动语音生成:将文本转化为语音,广泛应用于新闻阅读广泛应用于新闻阅读、有声书有声书、出行导航出行导航、通知播报通知播报、视频配音等领域视频配音等领域。目目前前,谷歌谷歌、微软微软、亚马逊亚马逊、腾讯腾讯、阿里阿里、百度百度、科大讯飞等均推出了相关平台科大讯飞等均推出了相关平台,支持在不同场景下将文本转化为支持在不同场景下将文本转化为流畅逼真的语音流畅逼真的语音。谷歌谷歌TextText-toto-SpeechSpeech:谷歌基于DeepMind 的语音合成专业技术打造,支持40多种语言、220多种语音和参数调整,并且支持用户上传自己录制的音频来训练自定义语音模型。科大讯飞在线语音合成:科大讯飞在线语音合成:提供了100 发音人,支持多语种、多方言和中英混合,可灵活配置音频参数,只需用户上传15分钟录音便能够生成专属声音。3.2.2 音频生成:语音生成广泛应用,大厂均有布局音频生成:语音生成广泛应用,大厂均有布局资料来源:Google,科大讯飞,中信建投图:谷歌图:谷歌TextText-toto-SpeechSpeech图:图:科大讯飞在线语音合成科大讯飞在线语音合成 3838 歌曲生成:歌曲生成:AIAI作词作词、作曲作曲、编曲等编曲等,具体包括由旋律生成歌词具体包括由旋律生成歌词、由歌词生成旋律由歌词生成旋律、不同曲风旋律生成不同曲风旋律生成、和弦生成和弦生成、音乐续写等音乐续写等,可应用于音乐欣赏可应用于音乐欣赏、游戏音效游戏音效、实体场景配乐等多个领域实体场景配乐等多个领域。天工乐府天工乐府SkyMusicSkyMusic:2022年由昆仑万维推出的商业级作曲AI模型,支持31种语种的歌词生成、多曲风旋律生成、多轨道编曲、VOCAL生成和智能缩混等,已在全球多个音视频平台发行近20首AI生成歌曲。PlayformPlayform AIAI:与音乐专家合作使用AI续写了贝多芬第十交响乐,完成了两个完整的超过20分钟的乐章,第十交响乐于2021年成功由波恩贝多芬管弦乐团演出。3.2.2 音频生成:歌曲生成已有商业级模型,应用场景广阔音频生成:歌曲生成已有商业级模型,应用场景广阔资料来源:昆仑万维,Playform AI,腾讯音乐,Youtube,中信建投图:天工乐府作曲专辑上线流媒体平台图:天工乐府作曲专辑上线流媒体平台图:图:AIAI续写贝多芬续写贝多芬第十交响乐第十交响乐 39393.2.3 图像生成:快速出圈,多款应用火爆图像生成:快速出圈,多款应用火爆资料来源:The New York Times,TechCrunch,SiliconANGLE,公司官网,中信建投 2022年下半年年下半年,AI由文本生成图像快速出圈由文本生成图像快速出圈,多款应用火爆多款应用火爆。目前对大众开放的图片生成模型主要包括StableDiffusion、OpenAI的DALL-E 2、Midjourney等,三款模型中,仅Stable Diffusion开源,累计使用人数最多,在全渠道有超1000万用户。谷歌于2022年五月推出了由文本生成高清图像的模型Imagen,其官网展示了Imagen生成的高清图像,并宣称Imagen 生成的图像已经全线超越了 DALL-E 2,但该模型尚未对外公开使用。表:表:Stability AIStability AI、MidjourneyMidjourney、OpenAIOpenAI、谷歌产品对比、谷歌产品对比Stable DiffusionStable DiffusionMidjourneyMidjourneyDALLDALL-E 2E 2ImagenImagen使用效果使用效果开发公司开发公司Stability AIMidjourneyOpenAI谷歌推出时间推出时间2022.082022.072022.042022.05是否开源是否开源是否否否是否是否To CTo C是是是暂未对外公开是否有内容创作限制是否有内容创作限制否是是-图片处理图片处理本地云端云端-使用人数(使用人数(22.1122.11)超1000万超300万超150万-40403.2.3 图像生成:快速出圈,多款应用火爆图像生成:快速出圈,多款应用火爆资料来源:Midjourney,DALL-E 2,Stable Diffusion,Analytics India Magazine,中信建投 由于底层算法和训练数据的不同由于底层算法和训练数据的不同,Stable Diffusion、Midjourney和和DALL-E 2创作的图片画风和效果有所差异创作的图片画风和效果有所差异。MidjourneyMidjourney:创作更像是绘画,而非照片。据公司创始人Holz介绍,这是有意为之,但也不排除公司未来会推出创作写实图片的版本。DALLDALL-E 2E 2:创作更写实。底层算法使DALL-E 2更适合图片修复(inpainting)。Stable DiffusionStable Diffusion:有一些突出的问题,比如人类和动物的四肢不自然;不能理解复杂的原创内容等。4141 视频智能编辑:视频智能编辑:使用AI对视频进行编辑,包括删除视频特定主体、自动跟踪剪辑、视频特效生成、自动添加特定内容、视频美颜等,大大降低了视频编辑的专业门槛,提升了视频剪辑效率,目前已广泛应用于视频创作领域,具体应用包括剪映、百度智能创作平台、抖音、美图等。剪映:剪映:字节旗下视频剪辑软件,支持AI智能字幕、曲线变速、智能抠像、文本阅读等。3.2.4 视频生成:智能编辑为主,生成有待发展视频生成:智能编辑为主,生成有待发展资料来源:剪映,中信建投图:图:剪映视频智能抠图剪映视频智能抠图 4242 视频生成:视频生成:目前由智能视频生成虽有部分应用,但生成的视频时长较短,且部分视频无法准确再现真实世界的运作方式,AI视频生成技术到成熟应用还有一段距离。MakeMake-A A-VideoVideo:2022年9月由Meta推出,支持由文字描述生成短视频,也支持输入图像制作视频及输入视频创作视频的变体。但其生成的视频存在时长较短、清晰度较低、无法复现现实中的动作或逻辑等问题。3.2.4 视频生成:智能编辑为主,生成有待发展视频生成:智能编辑为主,生成有待发展资料来源:Meta AI,中信建投图:图:MakeMake-A A-VideoVideo根据文字描述生成的视频根据文字描述生成的视频图:图:MakeMake-A A-VideoVideo生成的部分视频存在缺陷生成的部分视频存在缺陷 4343 ImagenImagen VideoVideo:2022年10月由Google推出,能根据文字描述生成 1280*768 分辨率(720P)、每秒 24 帧、长128帧的视频片段,与Make-A-Video相比生成的视频更加高清,但其生成的视频仍有部分扭曲和抖动。PhenakiPhenaki:2022年10月由Google推出,能根据 200 个词左右的提示语生成 2 分钟以上的长镜头,讲述一个连贯完整的故事,但生成的视频质量较低。3.2.4 视频生成:智能编辑为主,生成有待发展视频生成:智能编辑为主,生成有待发展资料来源:Google,中信建投图:图:Imagen VideoImagen Video根据文字描述生成的视频根据文字描述生成的视频图:图:PhenakiPhenaki根据文字描述生成的根据文字描述生成的长长视频视频 4444 百度智能创作平台:百度智能创作平台:百度AI推出的一站式内容创作助手平台,涵盖文章创作、视频生成和视频智能编辑。落地媒体机构超过20家,包括人民日报新媒体、新华社、央视网、百家号、好看视频等。视频创作:视频创作:作为综合型视频创作平台,基于多模态创作技术,为内容创作者和机构提供AI赋能创作工具,支持图文转视频、图表动画、虚拟主播、语音快剪、智能字幕等多种功能。目前,百度智能创作平台自动创作的短视频数量已超过15万条。3.2.4 视频生成:百度推出综合型视频智能创作平台视频生成:百度推出综合型视频智能创作平台资料来源:百度AI,中信建投图图:百度智能创作平台的视频创作功能:百度智能创作平台的视频创作功能 4545 全球娱乐及媒体市场规模超全球娱乐及媒体市场规模超2 2.3 3万亿美元万亿美元。据普华永道,2021年全球娱乐及媒体行业的总收入约为2.34万亿美元,中国市场收入达3586亿元,占比约15%。预计2026年全球娱乐及媒体行业的总收入约为2.93万亿美元,CAGR为4.6%。在各细分子行业中均有千亿级别上市公司诞生,其中综合型公司市值更高,腾讯、WALT DISNEY市值分别达3176亿美元、1802亿美元。3.3 内容生产环节价值巨大:全球娱乐娱乐市场规模内容生产环节价值巨大:全球娱乐娱乐市场规模2.3万亿美元,各赛道均有千亿市值公司万亿美元,各赛道均有千亿市值公司资料来源:PWC,wind,公司公告,中信建投表:娱乐及媒体行业典型内容公司市值及表:娱乐及媒体行业典型内容公司市值及20212021年收入年收入细分行业细分行业公司公司市值(亿美元,市值(亿美元,截至截至20222022年年1111月月2424日)日)收入(亿美元,收入(亿美元,20212021)广播电视广播电视SIRIUS XMSIRIUS XM2522528787FOXFOX160160136136COMCAST CORPCOMCAST CORP1541154111641164新闻新闻News CorpNews Corp105105100100出版出版PearsonPearson85854646电影电影Warner BrosWarner Bros279279122122视频视频快手科技快手科技284284127127爱奇艺爱奇艺1001004848游戏游戏Activision BlizzardActivision Blizzard5755758888音乐音乐Spotify TechnologySpotify Technology151151109109综合型综合型腾讯腾讯31763176880880WALT DISNEYWALT DISNEY18021802729729 4646 高质量内容是娱乐及媒体行业的核心高质量内容是娱乐及媒体行业的核心。高质量内容为娱乐媒体行业的基础,内容创作者在其中扮演了重要的一环,为各类媒介带来了用户流量及使用时长的增长。以视频平台为例,IBM 商业价值研究院对 42 个国家或地区将近21000 名消费者的调查显示,57%的受访者认为收到高质量的专属视频内容是对视频提供商保持忠诚的关键动因。3.3 内容生产环节价值巨大:内容生产者处于产业链核心地位内容生产环节价值巨大:内容生产者处于产业链核心地位资料来源:IBM 商业价值研究院,IDC,中信建投表:表:AIAI在媒体行业在媒体行业应用架构应用架构 4747 决策式决策式AIAI在娱乐媒体领域的应用集中在内容分发环节在娱乐媒体领域的应用集中在内容分发环节,提升分发环节的效率实现了千人千面提升分发环节的效率实现了千人千面,而不是对生产力的而不是对生产力的提升提升。生成式生成式AIAI能够创作新的内容能够创作新的内容,改变了传统的娱乐媒体内容由人工生产的方式改变了传统的娱乐媒体内容由人工生产的方式,带来的生产力的提升与突破带来的生产力的提升与突破。3.4 生成式生成式AI在娱乐媒体领域:不再是改变分发关系,而是升级生产力在娱乐媒体领域:不再是改变分发关系,而是升级生产力资料来源:中信建投传统内容生产与分发传统内容生产与分发人工生产内容人工生产内容数量、质量有限数量、质量有限平台平台用户用户热点推送热点推送主动检索主动检索决策式决策式AI精准推送精准推送人工生产内容人工生产内容数量、质量有限数量、质量有限平台平台用户用户生成式生成式AI提高生产力提高生产力AI生产内容生产内容数量、质量极大提升数量、质量极大提升平台平台按需生成按需生成用户用户精准精准推送推送精准精准推送推送主动检索主动检索 4848 AIAI目前在娱乐媒体领域的应用以内容分发为主目前在娱乐媒体领域的应用以内容分发为主,在内容生产阶段有部分辅助应用在内容生产阶段有部分辅助应用,后期将走向大规模辅助内容创后期将走向大规模辅助内容创作甚至大规模替代人类创作作甚至大规模替代人类创作。机器辅助人阶段:生成式机器辅助人阶段:生成式AIAI大幅度降低内容生产成本和门槛大幅度降低内容生产成本和门槛,为内容公司降本增效为内容公司降本增效,现有互联网娱乐巨头有现有互联网娱乐巨头有望获得更高利润望获得更高利润。机器机器“替代替代”人阶段:用户只需要输入指令便可以得到人阶段:用户只需要输入指令便可以得到AI创作的所需内容创作的所需内容,内容分发环节重要性下降内容分发环节重要性下降,现有现有互联网娱乐巨头面临从互联网娱乐巨头面临从“精准提供符合用户需求的内容精准提供符合用户需求的内容”到到“提供符合用户需求的内容生产工具提供符合用户需求的内容生产工具”的挑战的挑战。3.5 生成式生成式AI为现有互联网娱乐巨头带来机遇和挑战为现有互联网娱乐巨头带来机遇和挑战分发环节价值让位于内容生产环节分发环节价值让位于内容生产环节资料来源:PWC,IBM 商业价值研究院,公司公告,中信建投表:表:AIAI在娱乐媒体内容领域的应用在娱乐媒体内容领域的应用AI内容内容分发阶段分发阶段AI辅助辅助生产阶段生产阶段AI独立独立创作阶段创作阶段内内容容生生产产内容生产成本较高初级、重复性内容由AI生成,降低内容生产成本除极专业内容外均可由AI生成,大幅度降低内容生产成本和门槛内容生产成本降低内容生产成本降低效率提高效率提高占收入比重内容分发内容分发内容消费内容消费平台分发技术提升,促进内容精准投放与推广多数内容由用户根据需求生成或平台为客户个性化生成后推送给用户,分发环节重要性降低用户为消费者用户为消费者用户可集消费者与生用户可集消费者与生产者于一身产者于一身 49493.5.1 阶段一:机器辅助人:大规模内容辅助创作,提质增效阶段一:机器辅助人:大规模内容辅助创作,提质增效资料来源:量子位,京东,淘宝,网易云音乐,Stability,Jasper,中信建投 生成式生成式AI辅助创作辅助创作,大幅度降低了内容生产的成本大幅度降低了内容生产的成本,降低了创作门槛:降低了创作门槛:价格方面:人工创作价格偏高;生成式AI存在大量免费应用,部分收费的专业版本价格也远低于人工创作。速度方面:人工创作由于体力、脑力的限制,创作速度存在上限;而生成式AI辅助创作仅需几分钟甚至几秒钟便能够完成,其单纯的创作时间消耗可以忽略。效果方面:人工创作的效果因人而异,专业门槛较高,且不易统一;而生成式AI辅助创作降低了图片、音频的创作门槛,使得没有专业技能的人也能够完成自己的作品,在部分领域已经能够达到专业水准,生成式AI创作的诗歌、小说、音乐、图片具有发表,部分获得专业奖项。内容内容产品形态产品形态创作方式创作方式价格价格速度速度效果对比效果对比文字文字小说/新闻稿/聊天对话单独人工30-1000元/千字5000字/天AI纠错、补全高于人工平均水平,AI续写部分达到专业水平AI智能纠错、句子补全、自动续写免费-10元/千字最快达上万字/秒,时间几乎可忽略图片图片绘画/图片单独人工几十元/张起1小时/张起AI编辑、创作图片优于非专业人士,部分达到专业水平AI编辑图片、辅助甚至单独创作免费-0.4元/张1张不超过1分钟音频音频/音乐音乐音乐单曲/专辑单独人工作曲3000元/首起配音20/千字起2天/首起AI作曲作词降低创作门槛,少部分达到专业水平AI辅助作曲、创作歌词、智能配音免费-10元/首几分钟/首图图:生成式:生成式AIAI辅助创作与辅助创作与单独人工创作的对比单独人工创作的对比 50503.5.1 阶段一:机器辅助人:大规模内容辅助创作,降低人工成本阶段一:机器辅助人:大规模内容辅助创作,降低人工成本资料来源:腾讯研究院,视觉中国、爱奇艺、阅文集团、腾讯音乐、腾讯、中信建投 典型内容行业的制作典型内容行业的制作、版权成本通常占比不低版权成本通常占比不低。如视觉中国2014-2021年累计支付给供稿方的版权费为15亿,占收入的比重为28%;爱奇艺2021年内容成本为207亿,占收入比重为68%;腾讯的VAS业务,21年成本为1386亿(包括游戏、视频、音乐等内容成本),占VAS收入的比重为48%。制作制作/版权成本的背后通常是人力成本版权成本的背后通常是人力成本,AIGC有望降低人力成本有望降低人力成本。以游戏研发为例,其过程中传统的资本支出、固定投入较少,开发人员的人力成本为主要支出。除开市场调研、策划与发行阶段,在要素构建环节(如美术模型贴图、音效设计、动作设计),若用AIGC进行部分替代,则整体制作成本将明显降低。领域领域公司公司成本项成本项2014-2021年累计年累计图片图片视觉中国视觉中国向供稿方支付版权许可&服务费(亿)15占收入比重28%领域领域公司公司2017 2018 2019 2020 2021长视频长视频爱奇艺爱奇艺内容成本(亿)126211222209207占收入比重73wph%文字文字/阅读阅读阅文集团阅文集团内容分销成本(亿)2 6 12 12 占收入比重4.4%6.8.0.3%音乐音乐腾讯音乐腾讯音乐服务成本(亿,包括内容成本/分成等)103150175190占收入比重54Ya%游戏游戏/视频视频/音乐音乐腾讯腾讯VAS业务成本(亿)6147409411213 1386占VAS收入比重40BGFH%表:典型内容公司在制作、版权端的成本及占收入比重的情况表:典型内容公司在制作、版权端的成本及占收入比重的情况市场调研市场调研要素构建要素构建美术资源美术资源音乐音效音乐音效动作动作模型、贴图、场景音乐设计动作捕捉策划策划地图地图故事背景故事背景任务关卡任务关卡图:游戏研发流程(虚线框中为图:游戏研发流程(虚线框中为AIAI可替代过程)可替代过程)51513.5.1 阶段一:机器辅助人:国内市场空间可达千亿阶段一:机器辅助人:国内市场空间可达千亿资料来源:伽马数据,中国互联网络信息中心、中国演出行业协会、国际唱片业协会、中国音乐家协会及中国电影局;弗若斯特沙利文 我们以内容制作成本可我们以内容制作成本可AI化制作比例化制作比例,对对AIGC的理论市场空间进行匡算的理论市场空间进行匡算 1、内容制作成本:内容制作成本:按照各典型行业的市场空间预计的内容(或版权)成本占比进行匡算。如2021年游戏行业市场规模2965亿,游戏行业盈利能力较强&毛利高,预计其中制作成本占比25%;如直播行业主播分成比例惯例为五五分成,因此此处按照50%匡算主播分成成本;其他行业以此类推。2、可可AI化比例:化比例:当前AI图片、AI音乐相对较为成熟,预计未来可AI化的比例分别为55%、50%,而AI应用在视频类(直播/剧集/电影/综艺)的技术发展相对缓慢,预计可AI化的比例相对较低。综上,我们预计国内AIGC在B端市场的理论空间为1000亿左右。表:表:AIGCAIGC国内理论市场空间测算国内理论市场空间测算内容类型内容类型市场规模(亿市场规模(亿元,2021)元,2021)*内容/版权成*内容/版权成本占收入比重本占收入比重内容制作成本内容制作成本(亿元,匡算)(亿元,匡算)*未来可AI化*未来可AI化制作的比例制作的比例AIGC市场测算AIGC市场测算空间(亿元)空间(亿元)游戏游戏2,965 25t1 302.38 短视频短视频2,255 106 35x.93 直播直播1,936 508 30)0.40 剧集剧集902 70c1 10c.14 电影电影583 6050 20i.96 综艺综艺564 75B3 255.75 在线音乐在线音乐440 60&4 502.00 图片版权图片版权280 30 55F.20 网络文学网络文学209 35s 20.63 合计合计10,13410,134 377%3,7603,760 27%1,0231,023 52523.5.2 阶段二:机器“替代”人:为娱乐媒体领域带来颠覆性变革阶段二:机器“替代”人:为娱乐媒体领域带来颠覆性变革资料来源:中信建投 随着技术的不断发展随着技术的不断发展,生成式生成式AI技术发展到能够替代大部分专业生产者的阶段技术发展到能够替代大部分专业生产者的阶段,将为娱乐媒体领域带来颠覆性将为娱乐媒体领域带来颠覆性变革变革,我们做出以下展望:我们做出以下展望:内容总量指数级增长:内容总量指数级增长:内容生产效率极大提升,每个用户都可以成为内容创作者,生产效率和创作人数的增长将带来内容总量的爆发。内容质量达到甚至超越专业人员创作水平:内容质量达到甚至超越专业人员创作水平:目前,生成式AI在文字生成、图像生成等领域创作的内容已经可以媲美部分专业人员,随着技术的不断发展,生成式AI创作的内容质量或超越专业人员创作水平。3D内容内容、交互性内容占比大大增加:交互性内容占比大大增加:3D内容、交互性内容制作难度大、成本高,生成式AI的发展将大幅降低3D内容、交互性内容的制作门槛,叠加消费者对高质量内容的需求,3D内容、交互性内容占所有内容的比例将大大提高。决定公司核心竞争力的因素由内容质量变为生成式决定公司核心竞争力的因素由内容质量变为生成式AI水平:水平:目前,决定娱乐媒体领域公司核心竞争力的主要因素是内容的质量,但生成式AI将为以往的内容创作者带来更高效的创作方式,也会将部分原来的内容消费者转变为集内容创作和消费于一身的角色,届时生成式AI水平将直接决定内容质量以及创作者、消费者的体验,成为决定公司核心竞争力的因素。图:生成式图:生成式AIAI成熟后为娱乐媒体领域带来的颠覆性变革成熟后为娱乐媒体领域带来的颠覆性变革内容数量及质量内容数量及质量3D内容、交互性内容占比内容、交互性内容占比公司核心竞争力公司核心竞争力内容质量内容质量生成式生成式AIAI水平水平 53533.5.2 阶段二:机器“替代”人:阶段二:机器“替代”人:虚拟人集成内容创作工具,成为下一代互联网应用入口虚拟人集成内容创作工具,成为下一代互联网应用入口资料来源:acg人物资料网,虎嗅,品玩,极客网,腾讯网,中信建投 最早的虚拟人不具有智能交互功能最早的虚拟人不具有智能交互功能。2007年初音未来出现,能够输入音调、歌词等将人类声音合成为歌声,仅是一个虚拟的人物形象,按照人工既定的设计表演,不具有实时交互功能。早期虚拟人仅具有语音交互功能早期虚拟人仅具有语音交互功能,只闻其声不见其人只闻其声不见其人。2011年Apple在iPhone 4S中内置Siri,用户可以通过语音与Siri聊天,用户可通过Siri进行拨打电话、设置闹钟、记录待办事项、播放音乐等收集控制。后期出现的小度、小爱等以智能音响为代表的智能家居,也是仅具有语音交互控制功能,不具有鲜活的可视形象。目前的虚拟人智能程度增强目前的虚拟人智能程度增强,以以AI驱动为核心驱动为核心。多数虚拟人支持捏脸、智能语音交互、表情动作变化、情绪变动等等,形象更加真实,动作自然。目前虚拟人制作以AI驱动为核心,动捕、渲染、形象库等环节由AI完成,大幅度降低了制作成本。未来虚拟人集成生成式未来虚拟人集成生成式AI后后,将成为元宇宙的入口将成为元宇宙的入口,是用户创作的生产力工具集合是用户创作的生产力工具集合。虚拟人集成生成式虚拟人集成生成式AI后将后将更为个性化更为个性化,不仅具有交互不仅具有交互、陪伴陪伴、控制功能控制功能,成为元宇宙的入口成为元宇宙的入口,还具有创作能力还具有创作能力,成为生产力工具集合的成为生产力工具集合的形象代表形象代表,未来有望成为通用人工智能助手的形象代表未来有望成为通用人工智能助手的形象代表。图:虚拟人发展历程及展望图:虚拟人发展历程及展望初音未来初音未来仅为表现形象仅为表现形象Siri、小度等、小度等语音交互语音交互洛天依洛天依AI驱动、多种交互驱动、多种交互集成生成式集成生成式AI的虚拟人的虚拟人千人千面千人千面元宇宙入口元宇宙入口生产力工具集合生产力工具集合 54543.5.2 阶段二:机器“替代”人:阶段二:机器“替代”人:未来虚拟人雏形已现未来虚拟人雏形已现Adobe Sensei资料来源:Adobe,中信建投 Adobe Sensei:2016年由Adobe推出的人工智能平台,能够为Adobe家族中各种产品提供设计和数字支持,处于不断更新中,目前已经被嵌入到几十种Adobe产品之中,在一些产品中,人类只需要向Sensei发出指令便可以完成复杂的专业操作。我们认为我们认为,Adobe Sensei已经具备了未来虚拟人的雏形已经具备了未来虚拟人的雏形,可以通过人类的指令完成部分可以通过人类的指令完成部分专业内容创作专业内容创作,随着技术的发展随着技术的发展,Adobe Sensei可能具有独特的虚拟形象并支持语音交互可能具有独特的虚拟形象并支持语音交互,成为成为Adobe产品范产品范围内的通用人工智能助手围内的通用人工智能助手。图:图:通过文字指令为图片在通过文字指令为图片在PhotoshopPhotoshop中添加元素中添加元素图:图:通过文字指令为在通过文字指令为在ExpressExpress中生成艺术字中生成艺术字 55553.5.2 阶段二:机器“替代”人:阶段二:机器“替代”人:未来虚拟人雏形已现未来虚拟人雏形已现DeepMind Gato资料来源:DeepMind,中信建投 DeepMind Gato:2022年由DeepMind推出的“通才”AI模型,能够根据指令完成注释图像、交互式聊天、玩小游戏、关节力矩控制、在现实中使用机械臂堆叠积木、在模拟 3D 环境中导航等数百种任务。相较于相较于AdobeSensei,Gato不仅集成了生成式不仅集成了生成式AI,而是具备了未来集成通用人工智能的虚拟人的内核而是具备了未来集成通用人工智能的虚拟人的内核。图:图:GatoGato能够完成的部分功能能够完成的部分功能 5656目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成:从判别决策到创造生成生成式生成式AI:范式升级:范式升级,应用多元应用多元第三章第三章生成式生成式AI应用:内容制作应用:内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用第六章第六章综合应用:游戏行业的案例综合应用:游戏行业的案例 57574.1 生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用生成式生成式AIAI多行业应用多行业应用代码生成代码生成OpenAIOpenAICodexCodexChatGPTChatGPT微软微软GitHub CopilotGitHub Copilot亚马逊亚马逊CodeWhispererCodeWhisperer谷歌谷歌DeepMindDeepMindAlphaCodeAlphaCode华为华为PanGuPanGu-CoderCoder药物研发药物研发英矽智能英矽智能Chemistry42Chemistry42蛋白质蛋白质结构预测结构预测谷歌谷歌DeepMindDeepMindA Al lphaFold2phaFold2MetaMetaESMFoldESMFold资料来源:Sequoia,Coatue,OpenAI,亚马逊,Deepmind,英矽智能,GitHub,Meta,华为,中信建投 58584.2 代码生成:大厂广泛布局,极大提升编程效率代码生成:大厂广泛布局,极大提升编程效率资料来源:Coatue,OpenAI,中信建投 代码生成:生成式代码生成:生成式AI将自然语言翻译成代码将自然语言翻译成代码,极大提升了计算机编程的智能化极大提升了计算机编程的智能化、自动化自动化,使得程序员能够在相使得程序员能够在相同时间内编写更多的代码同时间内编写更多的代码,同时提高同时提高debug的效率的效率。目前目前,OpenAI、微软微软、谷歌谷歌、亚马逊亚马逊、华为等均在华为等均在AI代码代码生成领域有所布局生成领域有所布局。Codex:2021年8月由OpenAI基于GPT-3推出,精通Python、JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL甚至 Shell 等十几种编程语言,其中最为擅长Python。具有将注释变成代码、为代码生成注释、代码自动补全、查找可用库或API、代码检查、代码重构、代码语言转换等功能,是Github Copilot的底层支持,目前免费开放,需要通过API或 Playground 访问。图:图:CodexCodex由英文生成由英文生成JavaScriptJavaScript代码代码图:图:CodexCodex由英文生成由英文生成太空小游戏太空小游戏 59594.2 代码生成:代码生成:ChatGPT调试代码表现优于传统搜索引擎调试代码表现优于传统搜索引擎资料来源:OpenAI,中信建投 ChatGPT:2022年11月由OpenAI推出,是一个对话语言模型,但在代码生成领域具有优秀的表现,能够将自然语言转为代码、找出代码的问题并给出修改意见,且支持用户和AI连续对话,在调试代码过程中的使用体验优于传统的搜索引擎。图:图:ChatGPTChatGPT由中文生成代码并给出注释由中文生成代码并给出注释图:图:ChatGPTChatGPT指出代码错误并给出修改意见指出代码错误并给出修改意见 60604.2 代码生成:代码生成:Github Copilot每年节约开发人员成本或达百亿美元每年节约开发人员成本或达百亿美元资料来源:微软GitHub,中信建投 Github Copilot:2021年6月由微软旗下GitHub推出,由OpenAI Codex 提供支持,可以集成到Neovim,JetBrains IDEs,Visual Studio,and Visual Studio Code等编辑器中,支持 Python、JavaScript、TypeScript、Java、Ruby 和 Go 等编程语言。可以根据上下文自动写代码,包括文档字符串、注释、函数名称、代码,只要用户给出提示,就可以写出完整的函数。Github Copilot每年节约开发人员成本或达百亿美元每年节约开发人员成本或达百亿美元。在2021年6月-2022年6月中,超过120万开发者注册使用 GitHub Copilot 预览版,在启用的文件中,有近 40%的代码是由 Copilot 编写的。以使用人数120万、开发人员时薪20-200美元,Copilot每年可节省开发成本48-1920亿美元。图:图:GithubGithub CopilotCopilot根据提示补全代码根据提示补全代码表表:GithubGithub CopilotCopilot节省开发成本测算节省开发成本测算使用人数(万人)使用人数(万人)120开发人员薪资(美元开发人员薪资(美元/小时)小时)20-200使用使用GitHub Copilot前每年开发人员成本(亿美元)前每年开发人员成本(亿美元)480-4800GitHub Copilot节省开发时间节省开发时间10%GitHub Copilot节约开发人员成本(亿美元)节约开发人员成本(亿美元)48-480GitHub Copilot节省开发时间节省开发时间20%GitHub Copilot节约开发人员成本(亿美元)节约开发人员成本(亿美元)96-960GitHub Copilot节省开发时间节省开发时间30%GitHub Copilot节约开发人员成本(亿美元)节约开发人员成本(亿美元)144-1440GitHub Copilot节省开发时间节省开发时间40%GitHub Copilot节约开发人员成本(亿美元)节约开发人员成本(亿美元)192-1920 61614.3 药物研发:生成式药物研发:生成式AI从头设计药物,大幅降低药物研发成本从头设计药物,大幅降低药物研发成本资料来源:蛋壳研究院,埃森哲,MDPI,altexsoft,中信建投 传统药物研发过程需历时传统药物研发过程需历时10-15年年,花费数十亿美元花费数十亿美元。传统药物研发过程包括药物发现、临床前研究、临床研究、审判上市四个阶段,其中药物发现和临床前研究阶段需要4-6年。据埃森哲,一款新药问世的成本大约在26至67亿美元(包括资金成本和失败成本在内)。AI从头设计药物从头设计药物,大幅降低药物研发成本大幅降低药物研发成本。生成式AI在药物发现中,能够根据有关目标结构的信息创建分子,即预测候选药物的元素(例如原子、键的类型等),并为特定目标生成化学实体,而不是通过筛选找到它们。在人工智能驱动下,药物发现和临床前研究阶段可由4-6年降低至1-3年,甚至更短,同时费用也大大降低。具体应用包括基于GAN的Reinforced Adversarial Neural Computer(RANC),用于新型小分子有机结构从头药物设计;基于AE和GAN的LatentGAN,用于药物从头设计。图:药物研发流程图:药物研发流程药物发现阶段临床前研究阶段临床研究阶段审批上市阶段靶点发现化合物合成筛选晶型预测药理评估制剂研发患者招募优化设计药物重定向检验审批批量生产2 2-3 3年年2 2-3 3年年5 5-7 7年年AIAI驱动:驱动:1 1-3 3年年 62624.3 药物研发:制药公司的药物研发:制药公司的AlphaGo时刻时刻全球首例完全由全球首例完全由AI驱动发现的药物分子驱动发现的药物分子资料来源:蛋壳研究院,埃森哲,MDPI,英矽智能,altexsoft,中信建投 全球首例完全由全球首例完全由AI驱动发现的药物分子:驱动发现的药物分子:2021年2月,英矽智能通过新药靶点发现平台PandaOmics和AI分子生成、设计平台Chemistry42,研发出特发性肺纤维化疾病新靶点以及全球首例完全由AI驱动发现的药物分子,用时18个月,投入270万美元,时间成本和资金成本均大大地缘传统靶点药物研发,被誉为制药公司的AlphaGo时刻。目前,该药物在进行的临床I期试验中取得积极顶线数据,在安全性、耐受性、药代动力学方面均表现良好。其中,AI分子生成分子生成、设计平台设计平台Chemistry42利用生成式对抗神经网络利用生成式对抗神经网络(GAN)来进行深度学习来进行深度学习,帮助生成新小帮助生成新小分子化合物分子化合物。图:人工智能药物发现平台图:人工智能药物发现平台 63634.4 蛋白质结构预测:蛋白质结构预测:AlphaFold 2精确预测蛋白质三维结构精确预测蛋白质三维结构资料来源:Deepmind,中信建投 蛋白质的三维形状决定了其工作方式和作用蛋白质的三维形状决定了其工作方式和作用,传统破译蛋白质三维结构的方法耗时长且成本高传统破译蛋白质三维结构的方法耗时长且成本高。蛋白质是生命的基石,支撑着每一种生物的每一个生物过程。目前,已知有超过2亿种蛋白质,每种结构不同,传统的使用X射线衍射、冷冻电子显微镜等方法探测蛋白质的确切是一个漫长且昂贵的过程。1972 年,美国科学家Christian Anfinsen曾提出著名推论:理论上,蛋白质氨基酸序列可完全决定其三维结构。谷歌母公司谷歌母公司Alphabet旗下子公司旗下子公司Deepmind推出推出AlphaFold 2,实现蛋白质结构三维模型的精确预测实现蛋白质结构三维模型的精确预测。AlphaFold 2通过在数据库中搜寻目标氨基酸的相关序列,提取学习相邻“共进化”氨基酸的信息,从而在三维空间对蛋白质结构进行预测。Deepmind 2022 年年 7 月月 28 日发布的最新版本数据库扩展到了日发布的最新版本数据库扩展到了2 亿多个蛋白质结构亿多个蛋白质结构,包括科学界已知的几乎所有包括科学界已知的几乎所有蛋白质蛋白质。AlphaFold团队团队因此获得了因此获得了2023年生命科学突破奖年生命科学突破奖(Breakthrough Prize in Life Sciences),这是迄这是迄今科研领域里奖金最高的生物学及医学奖项今科研领域里奖金最高的生物学及医学奖项。折叠折叠预测空间结构预测空间结构图:图:AlphaFoldAlphaFold 2 2 6464目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成,技术与应用飞速发展:从判别决策到创造生成,技术与应用飞速发展生成式生成式AI:范式升级应用多元:范式升级应用多元,万亿市场空间可期万亿市场空间可期第三章第三章生成式生成式AI应用:娱乐媒体内容制作应用:娱乐媒体内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用,生产力大幅提高生产力大幅提高第六章第六章综合应用:以娱乐媒体内容中制作最复杂的游戏为例综合应用:以娱乐媒体内容中制作最复杂的游戏为例 65655.1 创业公司崭露头角,科技巨头积极布局创业公司崭露头角,科技巨头积极布局 国外多家生成式国外多家生成式AI创业公司获得大笔融资且拥有较高估值创业公司获得大笔融资且拥有较高估值。主要包括OpenAI、Stability AI、Midjourney、Jasper等,其中OpenAI技术积累最强,发布了多款生成式AI底层算法,估值或达290亿美元。国内外科技巨头在生成式国内外科技巨头在生成式AI领域多有布局领域多有布局。国内公司百度、腾讯、阿里、字节、网易等及国外公司谷歌、Meta、微软等均推出了生成式AI的应用产品,其中谷歌通过谷歌大脑、旗下Deepmind布局最为丰富。表:国内外科技巨头布局生成式表:国内外科技巨头布局生成式AIAI公司公司典型产品典型产品功能功能国国内内公公司司百度百度文心通过文字描述生成图片、图画修复、文档分析、蛋白质结构分析等腾讯腾讯优图输入多张人像图片完成对于人像面部的3D建模、提升电影分辨率等阿里巴巴阿里巴巴Lubanner输入图片、风格、尺寸等,自动完成素材分析、抠图、配色等设计,生成多套符合要求的设计方案字节跳动字节跳动剪映通过文字生成视频、AI配字幕等网易网易网易天音通过文字生成歌曲,支持作词、作曲、编曲、演唱全链路音乐创作国国外外公公司司谷歌谷歌Imagen Video、Phenaki 通过文字描述生成视频,前者注重视频清晰度后者注重视频长度和连贯性MetaMake-A-Video通过文字描述与图片参考生成视频,提供超现实、写实及风格化三种视频类型微软微软Github Copilot帮助工程师自动生成代码,目前用户数超过120万,使用该工具生成的代码已超过40%资料来源:公司官网,中信建投 66665.2 创业公司:创业公司:OpenAI等专注底层系统及应用,等专注底层系统及应用,Jasper等垂类应用四处开花等垂类应用四处开花资料来源:各公司官网,TechCrunch,SiliconANGLE,The Information,中信建投Stable DiffusionOpenAI DALL-E 2MidjourneyOpenAI GPT-3图片图片AIGCAIGC文本文本AIGCAIGCDreamStudioJasperCopy.aiCopysmith底层系统底层系统应用应用 底层系统:底层系统:目前海外参与研发AIGC模型的公司主要包括Stability AI、OpenAI、Midjourney,三家公司的AIGC模型均已正式向C端用户发布,谷歌和Meta等公司也正在研发文字转图片的AIGC模型,但仍未对外发布。垂类应用:垂类应用:在图片AIGC领域,Stability AI推出了基于自有模型Stable Diffusion的DreamStudio;在文本AIGC领域,应用开发商较多,且底层模型多是基于OpenAI GPT-3。目前目前,专注底层系统的公司估值更高专注底层系统的公司估值更高。虽然相较应用研发商,基础设施研发商的商业模式尚未成熟,多数还在探索阶段,但因其应用场景更广,且掌握核心技术能力,在未能实现稳定盈利的情况下,估值相对更高。但同样可见,海外除底层算法开发公司以外海外除底层算法开发公司以外,初创公司基于开源技术初创公司基于开源技术,仍可开发应用并开展仍可开发应用并开展To C业务业务,具有一定商业化具有一定商业化潜力潜力,因此我们预计因此我们预计,国内尽管头部互联网公司已积极布局国内尽管头部互联网公司已积极布局,但中小型公司仍有业务开展余地但中小型公司仍有业务开展余地。公司公司OpenAIStability AIMidjourneyJasperCopy.aiCopysmith开发内容开发内容底层模型底层模型、应用底层模型应用应用应用AIGCAIGC内容内容文本、图片图片、音频图片文本文本文本主要产品主要产品GPT-3(模型)DALL-E 2(模型)Stable Diffusion(模型)DreamStudio(应用)Midjourney(模型)Jasper(应用)Copy.ai(应用)Copysmith(应用)营业收入(营业收入(20212021)1000-5000万美元-4500万美元240万美元-最新轮融资金额最新轮融资金额-1.25亿美元1100万美元1000万美元估值估值200亿美元10亿美元-15亿美元-图表:主要参与公司和融资情况图表:主要参与公司和融资情况 67675.2.1 Open AI:提供底层算法,开发水平强、算法通用性高的:提供底层算法,开发水平强、算法通用性高的AI技术公司(技术公司(1)资料来源:OpenAI,华尔街日报,The Information,中信建投 OpenAI是一家大型人工智能研究公司是一家大型人工智能研究公司。公司AI开发水平处于第一梯队,研发人员包括世界著名AI专家,2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布将加盟公司。公司以公司以实现安全的通用人工智能实现安全的通用人工智能(AGI)为核心宗旨为核心宗旨。2015年成立之初,公司为一家非营利性研究机构,2019年接受微软10亿美元的注资,由非营利性机构转为盈利性公司。公司的投资者包括微软公司的投资者包括微软、Reid Hoffmans charitable foundation和和Khosla Ventures。TheInformation称公司2021年估值已经达200亿美元。据Semafor报道,微软正商谈以 290 亿美元估值,向 OpenAI 投资 100 亿美元,这笔投资还将引入其他风投公司。2022年公司收入约2500万-4000万美元,以290亿美元的估值测算,市销率达725-1160倍。我们认为我们认为,Open AI开发的底层算法系统开发的底层算法系统,虽然在短期有较大的成本投入虽然在短期有较大的成本投入,但在中长期有望创造巨大的价值但在中长期有望创造巨大的价值,类类似移动互联网时期的安卓系统似移动互联网时期的安卓系统。根据统计根据统计,仅仅是截止仅仅是截止2016年谷歌共通过年谷歌共通过Android操作系统获得操作系统获得310亿美元营收亿美元营收和和220亿美元利润亿美元利润,收入体量大且盈利能力强收入体量大且盈利能力强(对应净利率为对应净利率为71%)图:图:OpenAIOpenAI发展历程发展历程20152016201720182019202020212022由马斯克等人出资10亿美元创立定位为非盈利性人工智能研究机构OpenAI Gym测试版发布Universe软件平台发布近端策略优化(PPO)发布创建Dota 2机器人在1v1比赛中击败顶级职业选手Dactyl系统发布,训练机器手OpenAl LP成立微软注资10亿美金,变为盈利性公司GPT-2发布,15亿参数GPT-3发布,1750 亿参数量开放OpenAI API商用DALL-E发布CLIP发布Codex发布DALL-E 2发布ChatGPT发布 68685.2.1 Open AI:提供底层算法,开发水平强、算法通用性高的:提供底层算法,开发水平强、算法通用性高的AI技术公司(技术公司(2)资料来源:OpenAI,中信建投 公司发布了多款底层算法公司发布了多款底层算法,并推出相关应用并推出相关应用API:GPT-3:在NLP任务中实现重大突破,能够完成绝大多数NLP任务,入选了麻省理工科技评论2021年“十大突破性技术”,目前GPT-3已开源,注册人数超100万,基于该算法已经出现了Jasper、Copy.ai和Copysmith等。CLIP:与微软合作发布,能够将图像映射到文本描述的类别中,跨越了文字语义与图像语义的鸿沟,目前已开源,Disco Diffusion、MidJourney均基于CLIP架构及生成算法实现。Codex:基于GPT-3,具有将自然语言输入变成代码、代码自动补全等功能,是Github Copilot的底层支持。DALL-E 2:基于CLIP和Diffusion算法,实现了有文本生成高质量图片,两个半月注册人数突破100万,公司今年7月正式开始出售DALL-E 2 的图像生成软件许可,目前用户超过150万,每天生成200多万张图片。图:图:DALLE 2DALLE 2由英文生成图像由英文生成图像 69695.2.1 Open AI:ChatGPT准备推出专业付费版准备推出专业付费版资料来源:OpenAI,路透社,中信建投 ChatGPT:强大能力且用户友好强大能力且用户友好,发布发布5天用户超天用户超100万万,引起全球关注引起全球关注。ChatGPT不仅在对话、检索、创作、代码等领域展现出强大的能力,还支持直接通过网站试用该文本对话模型,而不是需要专业编程技能试用,且用户界面友好,大大降低了用户门槛,推动了其在全球范围的广泛传播,发布5天用户便突破了100万。计划推出无限制计划推出无限制、性能更高的专业付费版本性能更高的专业付费版本。1月11日,OpenAI 总裁兼联合创始人 Greg Brockman 在Twitter 上发布 ChatGPT 专业版问卷链接,根据问卷内容,我们预计ChatGPT将推出专业付费版本。据路透社报道据路透社报道,OpenAI预计今年的收入将达到预计今年的收入将达到2亿美元亿美元,到到 2024 年将达到年将达到10亿美元亿美元。ChatGPT的专业付费版的专业付费版可能是其增收的尝试之一可能是其增收的尝试之一。图:图:针对针对ChatGPTChatGPT专业版的问卷专业版的问卷图:图:针对针对ChatGPTChatGPT专业版的问卷专业版的问卷 70705.2.2 Stability AI:用户数快速增长、:用户数快速增长、AIGC独角兽独角兽资料来源:Stability AI官网,Bloomberg,TechCrunch,中信建投 Stability AI是一家致力于开发开源是一家致力于开发开源AI工具的公司工具的公司。公司由前英国对冲基金经理Emad Mostaque于2020年成立。2022年10月,公司完成1.01亿美元融资,估值10亿美元,投资方包括Coatue、Lightspeed Venture Partners和OShaughnessy Ventures。以以Stable Diffusion开源开源,累计使用人数最多累计使用人数最多,在全渠道有超在全渠道有超1000万用户万用户。公司开发的公司开发的AI工具生产的内容包括图片工具生产的内容包括图片、语言语言、音频音频、视频视频、3D模型模型、与生物学相关的内容等与生物学相关的内容等。目前已推出的主要为图片AIGC模型和工具,分别为:Stable Diffusion:开源的文本转图片:开源的文本转图片AIGC模型模型。模型由公司和德国海德堡大学的CompVis团队、初创公司RunwayML等共同开发完成。用户可以自由下载使用、调整代码,甚至用于商业化用途。DreamStudio:官方推出的基于:官方推出的基于Stability Diffusion的平台和的平台和API。该工具使用户不需要受限于软件安装、编程知识、较高的GPU性能要求。图:图:Stability AIStability AI推出的推出的AIGCAIGC工具工具图片AIGC平台基于Stable Diffusion模型音频/音乐AIGC平台基于Dance Diffusion模型AI和生物学结合的开源研究工具用于DNA测序、蛋白质折叠等机器学习模型 71715.2.2 Stability AI:To C业务仍在早期,业务仍在早期,To B和和To G预计贡献主要收入预计贡献主要收入资料来源:Stability AI官网,Forbes,TechCrunch,The Verge,中信建投 为什么公司已提供开源模型为什么公司已提供开源模型,但客户仍有定制化服务需求但客户仍有定制化服务需求?开源的开源的Stable Diffusion不提供定制化内容不提供定制化内容。训练模型的数据来自于包含英文标签的LAION 5b,用户不可以调出、调入新图片,因此不能重新训练模型并实现定制化。用户需求或有差异用户需求或有差异,需要通过调整模型和训练数据需要通过调整模型和训练数据,从而提供定制化服务从而提供定制化服务。不同类型的公司有不同的素材要求,如游戏公司或要求画风偏二次元,广告公司或对格式有一定要求。因此需要公司对模型进行调整、重新训练模型,从而达到客户对AIGC的要求。目前目前Stability AI已与多个政府和学术机构达成合作已与多个政府和学术机构达成合作,同时通过同时通过DreamStudio服务普通用户服务普通用户。具体情况如下:已有商业模式:已有商业模式:DreamStudio:根据用户对图片像素和操纵步骤需求,每张图片需要消耗0.2-28.2个信用币。新注册的用户可以免费获得200个信用币,此后每100个信用币的费用为1英镑。预期:预期:我们预计随着公司发展和网站访问量的提升,平台内将会落地更多增值服务,或增加广告业务。To B>o C已有商业模式:已有商业模式:据Forbes,公司已与多个政府和学术机构达成合作,为他们提供基于人工智能的技术服务。预期:预期:据TechCrunch,公司计划针对企业客户开展定制化的技术服务。72725.2.3 Midjourney:小型独立研究实验室,:小型独立研究实验室,AIGC偏向绘画作品偏向绘画作品资料来源:Midjourney官网,The New York Times,The Washington Post,Marktechpost,中信建投 Midjourney是一家小型的独立实验室是一家小型的独立实验室。据官网,团队共由11位成员和多位顾问组成,且自筹资金,暂未有融资记录。团队于2022年7月推出Midjourney,是与Stable Diffusion对标的图片AIGC模型。9月,游戏设计师JasonAllen在美国科罗拉多州博览会的美术比赛中,提交使用Midjourney创作的作品“Thtre Dopra Spatial”,在数字艺术/数码摄影单元中获得第一名。Midjourney的具体情况如下:作品类型:创作作品均是绘画作品类型:创作作品均是绘画,而非照片而非照片。Midjourney尤其擅长创作奇幻、科幻类型的风景照片。据公司创始人David Holz介绍,不排除未来会推出创作写实图片的版本。服务方式:服务方式:通过第三方的Discord服务器提供付费服务。用户创作的图片会被分享至公共社区,一方面可以让新用户快速了解创作指令,另一方面其他用户可以进行二次创作。商业模式:主要采用会员费模式商业模式:主要采用会员费模式。C端用户可以基于使用量的需求,选择不同套餐,每月费用在10-50美元之间;B端用户为固定价格,每年费用为600美元。用户数量:用户数量:据The New York Times,在Discord服务器中已累计有超300万用户。图表:使用图表:使用MidjourneyMidjourney创作的图片创作的图片指令:moody,dark,chiaroscuro指令:textured,summertime,warmth,bokeh,lotus on a pond in reflection,cinematic photograph图表:图表:Jason AllenJason Allen获奖作品获奖作品 73735.3 除技术领先的除技术领先的OpenAI外,其他垂直应用初创公司仍获高融资外,其他垂直应用初创公司仍获高融资资料来源:TechCrunch,Harvard Business Review,VentureBeat,ContentGrip.,中信建投 在技术应用层面在技术应用层面,海外的文本海外的文本AIGC工具研发商竞争较为激烈工具研发商竞争较为激烈,已领先图片已领先图片AIGC公司公司,快速实现快速实现C端商业化端商业化。各文本AIGC工具研发商的业务形态较为相似,产品主要基于开源的OpenAI GPT-3开发,业务主要是为用户提供广告文案、博客文章、社媒分享等文本的内容生成服务,用户只需输入简单指令,文本AIGC工具即可生成文本。该子行业参与者较多该子行业参与者较多,竞争较为激烈竞争较为激烈。Jasper是一家为主要为营销从业人员、社媒运营人员等提供基于AI的文本生成工具的研发商,其他同类公司还包括Copy.ai、Copysmith、WriteSonic、Peppertype等。近年多家公司获得高额融资近年多家公司获得高额融资。2022年10月,Jasper完成1.25亿美元融资,估值达15亿美元,投资者包括Coatue、Bessemer Venture Partners、IVP等多家机构。其他同样基于OpenAI GPT-3、业务相近的初创公司获得较高融资,包括Copy.ai、Copysmith等。由此可见由此可见,海外初创公司利用海外初创公司利用OpenAI、Stability AI等公司开发的开源技术等公司开发的开源技术,开发应用并开展开发应用并开展To C业务业务,仍可获仍可获得一定营收规模得一定营收规模,并获得高额融资并获得高额融资。大型大型AI公司在投入人力资源公司在投入人力资源、算力资源开发大规模底层算法方面优势明显算力资源开发大规模底层算法方面优势明显,而中小型公司在垂直应用而中小型公司在垂直应用、客户资源客户资源、灵活适配等方面具有一定优势灵活适配等方面具有一定优势,可与大型公司合作获得算法支持在细分可与大型公司合作获得算法支持在细分领域改进算法领域改进算法,提升用户体验提升用户体验,做出成绩做出成绩。因此预计国内中小型公司在头部互联网公司入局后因此预计国内中小型公司在头部互联网公司入局后,仍能在应用层仍能在应用层面获得发展空间面获得发展空间。图表:图表:JasperJasper、Copy.aiCopy.ai、CopysmithCopysmith近期融资情况近期融资情况JasperJasperCopy.aiCopy.aiCopysmithCopysmith成立时间成立时间202120202020底层底层AIGCAIGC模型模型OpenAI GPT-3OpenAI GPT-3OpenAI GPT-3融资时间融资时间2022.102021.102021.04融资金额融资金额1.25亿美元1100万美元1000万美元估值估值15亿美元-投资机构投资机构Coatue、Bessemer Venture Partners、IVP等Harmony Venture Labs等Wing Venture Capital、红杉、老虎全球等20212021年营业收入年营业收入4500万美元240万美元-74745.4 谷歌:谷歌:DeepMind某些领域表现优于某些领域表现优于OpenAI资料来源:DeepMind,中信建投 DeepMind在在2021年发布了拥有年发布了拥有2800亿参数的大语言模型亿参数的大语言模型Gopher,Gopher在人文科学在人文科学、社会科学社会科学、药学药学、通通用知识用知识、科学技术科学技术、数学等细分类别的大规模多任务语言理解基准性能测试中表现优于数学等细分类别的大规模多任务语言理解基准性能测试中表现优于GPT-3。图:图:GopherGopher表现表现 75755.5 百度:今年已推出多个基于百度:今年已推出多个基于AIGC的数字人、“的数字人、“AI作画”平台等产品作画”平台等产品资料来源:文心一格,腾讯新闻,环球网,经济参政报,中信建投 百度在百度在AIGC领域已有较多布局领域已有较多布局。自2020年9月15日百度推出首个虚拟偶像度晓晓以来,目前已有多位数字人,包括2月推出的首个实现AIGC的数字虚拟偶像希加加。今年百度的AIGC相关产品、数字人情况如下:AIGC技术创作高考作文:技术创作高考作文:度晓晓挑战高考作文,利用AIGC能力,在40秒完成40篇作文。“AI作画作画”文心文心 一格:一格:8月19日,百度在成都CCIG 2022大会发布AI艺术和创意辅助平台文心 一格,即系统通过用户输入中文关键词创作图片。百度输入法正式推出国内首款情感陪伴型虚拟博主林开开和叶悠悠百度输入法正式推出国内首款情感陪伴型虚拟博主林开开和叶悠悠。8月17日,两位博主将上线百度输入法的AI侃侃功能,为用户提供24小时在线陪伴对话,可支持文字、语音、表情包聊天互动。百度的数字人家族在快手发布首个入驻视频百度的数字人家族在快手发布首个入驻视频。11月15日,百度数字人家族四位成员分别为希加加、度晓晓、林开开、叶悠悠。未来数字人家族将参与一系列活动,包括加入爱奇艺出品的闯关游戏真人秀元音大冒险,以及在快手进行24小时AI直播等。图表:百度数字人家族入驻快手图表:百度数字人家族入驻快手图表:用户在“图表:用户在“AIAI作画”平台文心作画”平台文心一格上创作的国风作品一格上创作的国风作品 76765.5 百度:技术积累构建百度:技术积累构建AI基础设施基础设施资料来源:百度,中信建投 百度通过多年在人工智能领域的高投入百度通过多年在人工智能领域的高投入,形成技术积累形成技术积累。据11月9日李彦宏在“2022联想创新科技大会”时的介绍,百度过去十年累计投入研发资金超过1000亿元,连续四年在AI专利申请量和授权量上保持国内第一,凭借丰富技术积累推出了文心大模型。图:百度文心大模型图:百度文心大模型 77775.6 小冰公司:参与底层小冰公司:参与底层AIGC技术研发,赋予虚拟人创作能力技术研发,赋予虚拟人创作能力资料来源:IT桔子,科创板日报,澎湃新闻,wind,中信建投 前微软团队独立出的小冰公司完成前微软团队独立出的小冰公司完成10亿元融资亿元融资。据科创板日报,11月7日,小冰公司宣布完成本次A 轮融资,投资方为高瓴投资、IDG资本,将用于加速AI Being小冰框架技术研发,推动数字员工普及。公司的业务情况如下:小冰公司目前运营多位小冰公司目前运营多位B端和端和C端端AI Being。AI Being是公司对虚拟人的称呼,目前已在运营的AI Being包括红杉中国虚拟分析师“H ng”、虚拟歌手“洛天依”、万科集团数字员工“崔筱盼”等。AIGC技术是技术是AI Being获得创造力的重要部分获得创造力的重要部分。根据公司公告,近期其将对人工智能数字员工(AI BeingEmployee)产品线升级,包括大模型对话引擎、3D神经网络渲染、超级自然语音、AIGC人工智能内容生成。其中部分新技术已提前在招商局集团“招小影”、冬奥数字教练“观君”等数字员工中交付。公司推出的虚拟人以面向公司推出的虚拟人以面向B端为主端为主,预计预计B端贡献主要收入端贡献主要收入,但随着虚拟偶像的发展但随着虚拟偶像的发展,预计预计C端收入将逐渐端收入将逐渐提升提升。图表:小冰公司融资历史图表:小冰公司融资历史融资时间融资时间轮次轮次金额金额投后估投后估值值投资方投资方2020.11.242020.11.24Pre-A轮数亿元50亿元北极光创投、网易2021.7.122021.7.12A轮数亿元70亿元高瓴投资、五源资本、Neumann Advisors、IDG资本、GGV纪源资本、北极光创投、网易2022.11.72022.11.7A 轮10亿元150亿元高瓴投资、IDG资本图表:图表:20222022年年7 7月,人工智能小冰框架与月,人工智能小冰框架与VsingerVsinger达成合作,启达成合作,启动为虚拟歌手洛天依定制的歌声、语音多个动为虚拟歌手洛天依定制的歌声、语音多个AIAI声库的制作企划声库的制作企划,通过,通过AIGCAIGC技术赋予虚拟人创作能力,完成从虚拟歌手向真正技术赋予虚拟人创作能力,完成从虚拟歌手向真正的的AI BeingAI Being的转变的转变 78785.7 其他互联网公司:积极参与底层技术研发,其他互联网公司:积极参与底层技术研发,资料来源:字节跳动,腾讯新闻,量子位智库,中信建投 国内头部互联网公司正在积极布局国内头部互联网公司正在积极布局AIGC业务业务。腾讯、阿里巴巴、网易、字节跳动等国内头部互联网公司及旗下人工智能实验室正在基于自身业务情况,研发文本、图片、音乐等内容的AIGC技术和工具。其中,阿里巴巴的部分技术已运用至产品中,实现提升用户使用体验的目的;腾讯将AIGC的底层技术应用至游戏中,基于自有产品的玩家的操作数据,模拟真人玩家操作,预计未来也可用于创作虚拟玩家。各公司AIGC布局具体情况如下:公司公司业务进展业务进展腾讯腾讯文本文本AIGCAIGC:腾讯人工智能实验室开发了一款创作辅助工具Effidit,提供智能纠错、句子补全、短语润色、例句推荐、论文搜索、短语补全以及云输入法功能,有效提高写作的水平质量。游戏:游戏:该实验室基于自有多模态学习及生成能力,在游戏领域进行全流程布局。以“绝悟”为代表,强化学习的方法来模仿真实玩家,包括发育、运营、协作等指标类别,以及每分钟手速、技能释放频率、命中率、击杀数等具体参数,让AI更接近正式服玩家真实表现。阿里巴巴阿里巴巴图片图片AIGCAIGC:阿里巴巴智能设计实验室自主研发的AI视觉物料生成系统鹿班。基于图像智能生成技术,鹿班可以在短时间内完成大量banner图、海报图和会场图的设计,提高工作效率。主要功能包括了一键生成海报、智能排版、设计拓展、智能创作等。图片图片AIGCAIGC:2020年12月,阿里巴巴在原创保护平台推出虚拟模特“塔玑”。塔玑可以利用算法生成“独一无二的虚拟人脸”,商家只要提交服装平铺图,就可以选择喜欢风格、人脸、表情、妆容、身型、背景图,让模特“穿上新款”,从提交完成到生成模特图,最快仅需1天。网易网易音乐音乐AIGCAIGC:1月25日,网易推出一站式音乐创作平台网易天音。用户输入祝福对象,选择祝福语,就可以自动生成拜年歌曲。用户可以更换歌词、伴奏、歌手或重写,在设定歌名、选择模板、点击发布后,将作品分享给好友或分享到朋友圈。字节跳动字节跳动智能创作团队:智能创作团队:定位为AI&多媒体技术中台,在计算机视觉、音视频拍摄编辑、特效处理、语音等角度支持抖音、TikTok、剪映、西瓜等公司内众多产品线。7979目目 录录第二章第二章第一章第一章AI:从判别决策到创造生成:从判别决策到创造生成生成式生成式AI:范式升级:范式升级,应用多元应用多元第三章第三章生成式生成式AI应用:内容制作应用:内容制作,从辅助人到从辅助人到“替代替代”人人第五章第五章海内外发展:多家科技巨头海内外发展:多家科技巨头、初创公司积极布局初创公司积极布局第四章第四章生成式生成式AI应用:多行业垂直应用应用:多行业垂直应用第六章第六章综合应用:游戏行业的案例综合应用:游戏行业的案例 80806.1 游戏:市场规模近游戏:市场规模近2000亿美元,玩家数量达亿美元,玩家数量达30.6亿近全球总人口的亿近全球总人口的40%资料来源:Newzoo、中信建投 全球游戏市场规模不断扩大全球游戏市场规模不断扩大,预计预计2022年将达年将达1968亿美元亿美元。据Newzoo,全球游戏市场规模由2016年的1011亿美元增长到2021年的1927亿美元,五年市场规模增长近一倍,预计2022年将达1968亿美元,2025年将增长至2257亿美元。游戏玩家数量不断增长游戏玩家数量不断增长,预计预计2022年达到年达到32亿亿,占全球总人口的占全球总人口的40%。据Newzoo,2021年全球游戏玩家数量为30.6亿人,预计2022年将达32亿人,以目前全球总人口80亿计算,游戏玩家占全球总人口的比例达到40%。预计2025年全球游戏玩家数量将增长至35.3亿人,2020-2025年复合增长率为4.2%。图:全球游戏市场规模及增长率图:全球游戏市场规模及增长率图:全球游戏玩家及增长率图:全球游戏玩家及增长率0.0%5.0.0.0 .0%.00010001500200025002016201720182019202020212022E市场规模(亿美元)增长率0.0%1.0%2.0%3.0%4.0%5.0%6.0%7.0%8.0%9.0.0%0.05.010.015.020.025.030.035.02016201720182019202020212022E玩家数量(亿)增长率 81816.2 游戏制作:游戏产业的基础,受不可能三角的限制游戏制作:游戏产业的基础,受不可能三角的限制资料来源:venturebeat,Rockstar games,Take-Two,Roberts Space Industries,中信建投 游戏行业的竞争主要集中在制作环节和营销环节游戏行业的竞争主要集中在制作环节和营销环节,优良的游戏制作是营销的基础优良的游戏制作是营销的基础。传统游戏制作存在传统游戏制作存在“质量质量、速度速度、成本成本”中只能有两个的不可能三角中只能有两个的不可能三角。在保证游戏质量的前提下,游戏制作只有两条路径可选,一是大量开发人员同时制作一款游戏,而大型团队管理、开发效率较低,开发成本势必提高;二是精简团队成员,制作周期长达几年甚至十几年。通常优质通常优质3 3A A大作的开发时间成本和金钱成本均很高大作的开发时间成本和金钱成本均很高。以销量超4600万份的荒野大镖客:救赎 2为例,游戏拥有超过28平方英里接近真实景象的地图和1000个NPC,即使专职开发人员超1200人,也用了8年完成,成本近3亿美元。专职开发人员少于荒野大镖客:救赎 2的星际公民,已开发10年之久,仍处于Alpha版本测试阶段,预计还需要较长时间才能完整上线。图:传统游戏制作的不可能三角图:传统游戏制作的不可能三角表:大型表:大型3A3A游戏规模及制作成本游戏规模及制作成本质量质量成本成本速度速度贵贵差差慢慢游戏游戏荒野大镖客:救赎荒野大镖客:救赎 2 2星际公民星际公民地图规模地图规模28平方英里陆地面积超100万平方公里NPCNPC数量数量超1000个-发售时间发售时间2018年暂未发售制作周期制作周期8年10年以上贡献人员贡献人员超3000人151开发人员开发人员(不含外包)(不含外包)约1200人已超700人开发成本开发成本(不含营销)(不含营销)2.4-3亿美元已众筹5.3亿美元销量销量4600万份-82826.2 游戏制作:流程复杂,要素齐全游戏制作:流程复杂,要素齐全资料来源:game test cases library、中信建投 游戏制作流程复杂游戏制作流程复杂,设计开发环节最为关键设计开发环节最为关键。游戏的制作一般包括“产品立项-目标规划-设计开发-发布运营”四个环节,制作周期一般以年为单位,制作流程的复杂程度和时间成本远超娱乐媒体领域的其他内容。在游戏的制作流程中,设计开发环节决定了规划的落地程度,极大程度上影响游戏质量以及玩家体验,是最为关键的一环。图:游戏制作流程图:游戏制作流程产品立项产品立项设计开发设计开发前景规划前景规划市场调研市场调研DemoDemo预演预演框架玩法框架玩法风格规范风格规范版本计划版本计划方案设计方案设计程序编码程序编码美术绘图美术绘图配置联调配置联调渠道渠道SDKSDK运营活动运营活动宣传推广宣传推广目标规划目标规划发布运营发布运营版本周期版本周期 83836.2 游戏制作:流程复杂,要素齐全游戏制作:流程复杂,要素齐全资料来源:vcgamers,游戏科学,中信建投 游戏是娱乐及媒体行业中最复杂的形式游戏是娱乐及媒体行业中最复杂的形式,构成要素包含娱乐媒体领域内容的所有形式构成要素包含娱乐媒体领域内容的所有形式。游戏包含文本、图像、音效、音乐、3D模型、动画、电影、代码等多种类型的资源,涵盖了娱乐及媒体行业所有的内容形式。图:游戏图:游戏构成构成要素要素游戏引擎游戏引擎3D模型模型文本文本图像图像动画动画音频音频 84846.3 生成式生成式AI将影响游戏制作,有望打破不可能三角将影响游戏制作,有望打破不可能三角资料来源:vcgamers,a16z,中信建投 游戏是娱乐及媒体行业中对实时交互要求最高的形式游戏是娱乐及媒体行业中对实时交互要求最高的形式。游戏强调玩家交互的实时体验,要求即时反馈,是所有娱乐形式中综合复杂程度最高的。游戏的要素复杂游戏的要素复杂、制作门槛高也决定了生成式制作门槛高也决定了生成式AI对游戏制作的影响是其他娱乐及对游戏制作的影响是其他娱乐及媒体领域的合力媒体领域的合力,创造的机会也是最大的创造的机会也是最大的。生成式生成式AI带来的生产力提升带来的生产力提升,将打破游戏制作的不可能三角将打破游戏制作的不可能三角。生成式AI能够根据已有文本进行续写、根据文本生成语音、根据主题生成音乐、根据文本生成图像、根据二维图像生成三维模型、根据文本生成代码等,对游戏的策划、音频、美术、程序等环节的工作均带来极大的生产力提升,大幅降低游戏制作成本,打破不可能三角。以二维游戏原画为例,传统原画师根据策划内容完成设计稿需要花费数周时间,而使用生成式AI仅需要输入关键词便能得到大量设计初稿,后续进行筛选、修改即可,时间降低至几个小时。图:生成式图:生成式AIAI对游戏制作的影响是所有娱乐媒体内容领域最大的对游戏制作的影响是所有娱乐媒体内容领域最大的书美术电视节目动画电影真人电影游戏音乐新闻复杂程度实时性 85856.4 生成式生成式AI突破专业技术、经验的限制,大幅降低游戏制作门槛突破专业技术、经验的限制,大幅降低游戏制作门槛资料来源:LatePost,科创板日报,Innersloth,中信建投 游戏的综合复杂程度决定游戏开发具有很高的专业技术游戏的综合复杂程度决定游戏开发具有很高的专业技术、经验门槛经验门槛,资金投入和传统资金投入和传统AI算法积累的重要性降低算法积累的重要性降低。以字节跳动为例,字节2018年组建大中型游戏研发团队,公司在推荐算法、用户数据积累、资金、流量渠道等方面的优势未能让其在游戏制作领域复刻抖音、今日头条的成功,即使投入了数百亿资金,虽然推出了表现不错的航海王热血航线,但仍未有自研S级游戏面世。我们认为主要原因是公司后期进入游戏市场,缺乏游戏制作经验丰富、技术专精的管理人员和技术人员,据报道,公司试图以技术优势建立游戏中台加速游戏研发,但其开发人员对游戏不够熟悉导致中台偏代码思维,在便利性、使用效果方面不及网易的编辑器。生成式生成式AI制作游戏内容价格很低且不需要大量的专业技术人员制作游戏内容价格很低且不需要大量的专业技术人员,大幅降低游戏制作门槛大幅降低游戏制作门槛,微型游戏制作工作室微型游戏制作工作室走进现实走进现实,同时缩短游戏制作周期同时缩短游戏制作周期。生成式AI制作游戏内容具有一次开发调试能够多次长期复用的特点,并有专业生成式模型开发公司提供B端产品,将设计人员的创意转化设计初稿,大幅度降低内容制作的时间和金钱成本,同时减少对专业技术人员的需求,微型游戏制作工作室成为现实。5人组成的Innersloth工作室开发出了AmongUs,Steam销量超2000万,全球玩家约5亿人。随着生成式AI的不断发展,微型游戏制作工作室的数量和能够开发的游戏规模将不断上升。图:图:5 5人开发的人开发的Among UsAmong Us图:生成式图:生成式AIAI降低游戏制作门槛降低游戏制作门槛1234技术、经验要求技术、经验要求开发人员数量开发人员数量极高大幅降低数百甚至上千低至个位数 86866.5 游戏创新:游戏创新:AI生成内容降本增效,生成内容降本增效,产能提升实现既有创意产能提升实现既有创意资料来源:blackshark.ai,4Gamer,原神,中信建投 游戏的创新表现在多个方面游戏的创新表现在多个方面,主要受到创意和产能两个因素的限制主要受到创意和产能两个因素的限制。策划是游戏的起点策划是游戏的起点,美术设计是到游戏形美术设计是到游戏形象象、画面的关键画面的关键,游戏创新依赖于策划、美术人员的创意,而从创意到成品要经过漫长的开发过程,产能也是限制游戏创新的关键一环。生成式生成式AI提高生产力突破产能限制实现游戏创新提高生产力突破产能限制实现游戏创新:AI生成生成3D模型助力飞行模拟器实现模型助力飞行模拟器实现3D高清全球地图:高清全球地图:微软的飞行模拟器计划开始于1976年,一直在向着高清、3D、全球地图努力,最新版本通过与blackshark.ai合作,使用AI从2D卫星图像生成3D模型,构建了超过15亿的3D建筑模型,突破了产能的限制,飞行区域包括整个地球、超过24000个机场,且主要地标和热门城市的地景越来越丰富。AI赋能赋能NPC打造原神高品质开放世界:打造原神高品质开放世界:开放世界游戏在上世纪80年代便出现,原神开发中使用AI赋予了每个NPC不同的个性及特殊能力,打造了更为完备的高品质开放世界,获得成功。图:飞行模拟器真实图:飞行模拟器真实3D3D地图地图图:原神图:原神 87876.5 游戏创新:游戏创新:AI创作突破个人创意局限,拓宽策划设计边界创作突破个人创意局限,拓宽策划设计边界资料来源:Open AI,Dungeon and Platformer Level Blending and Generation using Conditional VAEs,中信建投 生成式生成式AI通过转型性创作通过转型性创作、组合性创作等方式突破个人创意的局限性组合性创作等方式突破个人创意的局限性,拓宽游戏策划设计的边界:拓宽游戏策划设计的边界:继续性创作:继续性创作:学习部分完成的要素的特征,进行继续性创作,最常见的是AI续写文案、生成同一风格系列的图片等,适用于游戏策划、设计完成部分但是想象力枯竭的情况,能够通过大量继续性创作扩展人的想象力。组合性创作:组合性创作:将不同领域、不同维度的原本无关的概念元素进行组合,创造出新的概念元素,能对游戏的关卡设计、地图设计、玩法设计、原画设计等提供全新的思路。目前图像生成算法能够根据输入的文字要素生成各种风格的图像以及超出想象的超现实动物、植物、人物形象,为游戏原画设计打开了想象空间。2021年,AnuragSarkar和Seth Cooper使用变分自编码器(Variational auto-encoder)将不同的游戏关卡进行组合,创造出新的游戏关卡。图:图:VAEVAE生成的一个融合了塞尔达、银河战士、洛克人的关卡生成的一个融合了塞尔达、银河战士、洛克人的关卡图:图:DALLE2DALLE2基于同一要素风格生成的图像基于同一要素风格生成的图像 88886.6 展望:短期内游戏数量、玩法品类增加,长期有望出现定制化游戏展望:短期内游戏数量、玩法品类增加,长期有望出现定制化游戏资料来源:Steamdb。游戏设计理论,中信建投 游戏成功与否的核心是玩家体验游戏成功与否的核心是玩家体验,本质因素则是为玩家带来的情绪价值本质因素则是为玩家带来的情绪价值。从表层看,决定游戏成功与否的关键因素包括游戏的IP、玩法、数值体系、画质、世界观、自由度、交互形式等,但这些因素仅是玩家体验的外在集合,优秀的玩家体验是一款游戏成功的核心,而游戏满足玩家情绪需求带来的情绪价值是玩家体验的本质。生成式生成式AI有望有望带来游戏数量和玩法品类的增加带来游戏数量和玩法品类的增加,增加玩家的选择空间增加玩家的选择空间,带来更好的游戏体验带来更好的游戏体验,长期看可能出现长期看可能出现玩家根据自身经历玩家根据自身经历、情绪状态制作的个人专属游戏情绪状态制作的个人专属游戏,深度满足情绪需求深度满足情绪需求。2021年,全球iOS Google Play上线移动游戏30万款,Steam上新发行游戏11585款,截止2022年11月29日,Steam上2022年发行的游戏数量已经超过2021年的总和。预计未来全球新游戏发行数量将持续增加。图:游戏成功的关键因素图:游戏成功的关键因素图:新发行的游戏数量(万款)图:新发行的游戏数量(万款)情绪情绪价值价值优秀的玩家体验优秀的玩家体验热门IP 玩法新颖高清画质世界观优秀自由度高交互性强010203040506020182019202020212025E移动游戏(iOS Google Play)Steam游戏 89896.7 落地形式:图像、落地形式:图像、3D模型、动画、音频、模型、动画、音频、NPC、玩家角色等均有落地(、玩家角色等均有落地(1)资料来源:Runway,网易互娱、中信建投 图像:网易互娱图像:网易互娱AI Lab已经实现生成式已经实现生成式AI辅助原画线稿上色辅助原画线稿上色、基于人脸线稿生成图像并编辑;基于人脸线稿生成图像并编辑;Runway、OpenAI等实现了有文本生成图像等实现了有文本生成图像、拓展图像拓展图像、为图像增加为图像增加/替换替换/删除元素等删除元素等。图:网易互娱图:网易互娱AI LabAI Lab线稿上色线稿上色图:网易互娱图:网易互娱AI LabAI Lab由线稿生成不同阶段人脸图由线稿生成不同阶段人脸图像像图:图:RunwayRunway由文本生成图像及为图像替换元素由文本生成图像及为图像替换元素 90906.7 落地形式:图像、落地形式:图像、3D模型、动画、音频、模型、动画、音频、NPC、玩家角色等均有落地(、玩家角色等均有落地(2)资料来源:Runway,网易互娱,Open AI,中信建投 3D模型:网易互娱模型:网易互娱AI Lab通过人脸图像生成人头的通过人脸图像生成人头的3D模型模型,批量为游戏生成人头模型;批量为游戏生成人头模型;Runway通过文本为通过文本为3D模型添加纹理模型添加纹理;Open AI开源开源3D模型生成器模型生成器Point-E实现由文字生成实现由文字生成3D模型模型,且可以在单块且可以在单块 Nvidia V100 GPU上在一到两分钟内生成上在一到两分钟内生成 3D 模型模型,速度大大提升速度大大提升。图:网易互娱图:网易互娱AI LabAI Lab由图像生成由图像生成3D3D模型模型图:图:RunwayRunway通过文本为通过文本为3D3D模型添加纹理模型添加纹理图:图:Open AIOpen AI由文字生成由文字生成3D3D模型模型 91916.7 落地形式:图像、落地形式:图像、3D模型、动画、音频、模型、动画、音频、NPC、玩家角色等均有落地(、玩家角色等均有落地(3)资料来源:Runway,网易互娱、中信建投 动画:网易互娱动画:网易互娱AI Lab实现了由视频实现了由视频、音频生成动画音频生成动画,大幅降低了动画捕捉成本;大幅降低了动画捕捉成本;Runway实现了去除视频背景实现了去除视频背景,为动画制作背景替换带来便利为动画制作背景替换带来便利。图:网易互娱图:网易互娱AI LabAI Lab通过视频、音频生成动画通过视频、音频生成动画图:图:RunwayRunway去除视频背景去除视频背景输入视频输入音频 92926.7 落地形式:图像、落地形式:图像、3D模型、动画、音频、模型、动画、音频、NPC、玩家角色等均有落地(、玩家角色等均有落地(4)资料来源:小冰,中信建投 音频:音频:Soundful实现了通过用户自定义输入生成音乐实现了通过用户自定义输入生成音乐。NPC和玩家角色:小冰成立的游戏工作室通过和玩家角色:小冰成立的游戏工作室通过AI技术完成虚拟人的创建技术完成虚拟人的创建、驱动和内容生成驱动和内容生成,并具备感知并具备感知、表达表达等无需人工干预的自动交互能力等无需人工干预的自动交互能力,降低降低NPC和游戏角色创建成本并带来更多的交互性和细节和游戏角色创建成本并带来更多的交互性和细节。图:图:SoundfulSoundful音乐生成音乐生成图:小冰虚拟人图:小冰虚拟人 93936.8 实测效果:二次元主题游戏原画设计及生成实测效果:二次元主题游戏原画设计及生成资料来源:OpenAI,中信建投 生成式生成式AI使得没有任何游戏设计或者经验的人能够制作出游戏原画使得没有任何游戏设计或者经验的人能够制作出游戏原画。ChatGPT强大的强大的AI问答功能问答功能,能够在输入能够在输入要求后要求后给出文字创意给出文字创意,将文字输入将文字输入DALL-E 2后生成游戏原画后生成游戏原画,全过程无需专业设计或者美术技能全过程无需专业设计或者美术技能。二次元主题游戏原画:二次元主题游戏原画:ChatGPT根据需求给出“一个城市的风景,摩天大楼林立,交通繁忙。一个少年手持古剑,身着学生制服,神态憧憬。”的文字设计,将第一部分文字设计输入DALL-E 2即可生成如下游戏原画。图:二次元主题游戏原画文字创意图:二次元主题游戏原画文字创意图:二次元主题游戏原画图:二次元主题游戏原画 94946.8 实测效果:中国传统仙侠主题游戏原画设计及生成实测效果:中国传统仙侠主题游戏原画设计及生成资料来源:OpenAI,中信建投 仙侠主题游戏原画:仙侠主题游戏原画:ChatGPT根据需求给出“中国传统仙侠游戏原画:一个仙侠世界的风景,山川清晰可辨,云雾缭绕,一个仙女站在山顶上,手持青龙偃月刀,脸上露出坚定的表情;古典仙侠游戏原画:一个仙侠世界的景色,碧水蓝天,翠竹绿草,一个道士身着青衫,手持扇子,神情淡然;二次元仙侠游戏原画:一个仙侠世界的背景,月亮悬挂在天空,星辰闪烁,一个美少女手持古剑,身着唐装,神态迷人。”等文字设计,将第一部分文字设计输入DALL-E 2即可生成如下游戏原画。图:中国传统图:中国传统仙侠主题仙侠主题游戏原画文字创意游戏原画文字创意图:中国传统仙侠主题游戏原画图:中国传统仙侠主题游戏原画 95956.8 实测效果:山海经异兽主题卡牌游戏原画设计及生成实测效果:山海经异兽主题卡牌游戏原画设计及生成资料来源:OpenAI,中信建投 山海经异兽主题卡牌游戏原画山海经异兽主题卡牌游戏原画:ChatGPT根据需求给出“山海经异兽卡牌游戏原画:一个古代神话世界的景色,山峰险峻,河流深邃,一个异兽在山间空中盘旋,手持古剑,神态雄健;古典神话卡牌游戏原画:一个古代神话世界的背景,云雾缭绕,水鸟飞翔,一个神仙站在天涯海角,手持权杖,神态慈祥。”等文字设计,将第一部分文字设计输入DALL-E 2即可生成如下游戏原画。普通生成式普通生成式AI创作的上述游戏原画仍存在部分瑕疵且画质需要提升创作的上述游戏原画仍存在部分瑕疵且画质需要提升,但已经能够为游戏策划人员但已经能够为游戏策划人员、美术人员提美术人员提供足够的创意及素材供足够的创意及素材,随着技术的发展随着技术的发展,针对游戏制作的专业生成式针对游戏制作的专业生成式AI将带来更多的创意将带来更多的创意、素材素材,极大提升游极大提升游戏制作的生产力戏制作的生产力。图:山海经异兽主题卡牌游戏原画文字创意图:山海经异兽主题卡牌游戏原画文字创意图:山海经异兽主题卡牌游戏原画图:山海经异兽主题卡牌游戏原画 96966.9 游戏领域生成式游戏领域生成式AI产业链图谱产业链图谱资料来源:公司官网,a16z,中信建投 目前多家国内外公司布局游戏领域的生成式目前多家国内外公司布局游戏领域的生成式AI,包括网易互娱包括网易互娱AI Lab、小冰游戏工作室小冰游戏工作室、Spellbrush等综合型等综合型AI游戏工作室以及专注于游戏工作室以及专注于2D图形图形、3D资产资产、纹理纹理、动画动画、建筑建筑、NPC、聊天机器人聊天机器人、音乐音乐、对话等领域的初创对话等领域的初创公司公司。图:游戏领域生成式图:游戏领域生成式AIAI产业链图谱产业链图谱NPCsAI游戏工作室游戏图形2D图形3D资产纹理动画世界建筑角色聊天机器人音频音乐对话网易互娱AI Lab小冰游戏 9797风险提示风险提示 生成式生成式AI技术发展不及预期技术发展不及预期:算力支持程度不及预期算力支持程度不及预期:数据质量及数量支持程度不及预期数据质量及数量支持程度不及预期;用户需求不用户需求不及预期及预期:技术垄断风险技术垄断风险:原始训练数据存在偏见风险原始训练数据存在偏见风险:算法偏见与歧视风险算法偏见与歧视风险:算法鲁棒性风险算法透明算法鲁棒性风险算法透明度风险度风险:增加监管难度风险增加监管难度风险:政策监管风险政策监管风险:商业化能力不及预期商业化能力不及预期:相关法律法规完善不及预期相关法律法规完善不及预期:版权版权归属风险归属风险:深度造假风险深度造假风险:人权道德风险人权道德风险:影响互联网内容生态健康安全风险影响互联网内容生态健康安全风险:企业风险识别与治理能企业风险识别与治理能力不足风险力不足风险:用户审美取向发生变化的风险用户审美取向发生变化的风险。9898分析师介绍分析师介绍武超则:武超则:中信建投证券研究所所长兼国际业务部负责人,董事总经理,TMT行业首席分析师。新财富白金分析师,2013-2020年连续八届新财富最佳分析师通信行业第一名;2014-2020年连续七届水晶球最佳分析师通信行业第一名。专注于5G、云计算、物联网领域研究。中国证券业协会证券分析师、投资顾问与首席经济学家委员会委员。杨艾莉:杨艾莉:传媒互联网行业首席分析师,中国人民大学传播学硕士,曾任职于百度、新浪,担任商业分析师、战略分析师。2015年起,分别任职于中银国际证券、广发证券,担任传媒与互联网分析师、资深分析师。2019年4月加入中信建投证券研究发展部担任传媒互联网首席分析师。曾荣获2019年wind资讯传播与文化行业金牌分析师第一名;2020年wind资讯传播与文化行业金牌分析师第二名;2020年新浪金麒麟评选传媒行业新锐分析师第二名。研究助理研究助理杨晓玮杨晓玮,评级说明评级说明投资评级标准评级说明报告中投资建议涉及的评级标准为报告发布日后6个月内的相对市场表现,也即报告发布日后的6个月内公司股价(或行业指数)相对同期相关证券市场代表性指数的涨跌幅作为基准。A股市场以沪深300指数作为基准;新三板市场以三板成指为基准;香港市场以恒生指数作为基准;美国市场以标普 500 指数为基准。股票评级买入相对涨幅15以上增持相对涨幅5中性相对涨幅-5%5之间减持相对跌幅5卖出相对跌幅15以上行业评级强于大市相对涨幅10%以上中性相对涨幅-10-10%之间弱于大市相对跌幅10%以上 9999分析师声明分析师声明本报告署名分析师在此声明:(i)以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告,结论不受任何第三方的授意或影响。(ii)本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。法律主体说明法律主体说明本报告由中信建投证券股份有限公司及/或其附属机构(以下合称“中信建投”)制作,由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。中信建投证券股份有限公司具有中国证监会许可的投资咨询业务资格,本报告署名分析师所持中国证券业协会授予的证券投资咨询执业资格证书编号已披露在报告首页。本报告由中信建投(国际)证券有限公司在香港提供。本报告作者所持香港证监会牌照的中央编号已披露在报告首页。一般性声明一般性声明本报告由中信建投制作。发送本报告不构成任何合同或承诺的基础,不因接收者收到本报告而视其为中信建投客户。本报告的信息均来源于中信建投认为可靠的公开资料,但中信建投对这些信息的准确性及完整性不作任何保证。本报告所载观点、评估和预测仅反映本报告出具日该分析师的判断,该等观点、评估和预测可能在不发出通知的情况下有所变更,亦有可能因使用不同假设和标准或者采用不同分析方法而与中信建投其他部门、人员口头或书面表达的意见不同或相反。本报告所引证券或其他金融工具的过往业绩不代表其未来表现。报告中所含任何具有预测性质的内容皆基于相应的假设条件,而任何假设条件都可能随时发生变化并影响实际投资收益。中信建投不承诺、不保证本报告所含具有预测性质的内容必然得以实现。本报告内容的全部或部分均不构成投资建议。本报告所包含的观点、建议并未考虑报告接收人在财务状况、投资目的、风险偏好等方面的具体情况,报告接收者应当独立评估本报告所含信息,基于自身投资目标、需求、市场机会、风险及其他因素自主做出决策并自行承担投资风险。中信建投建议所有投资者应就任何潜在投资向其税务、会计或法律顾问咨询。不论报告接收者是否根据本报告做出投资决策,中信建投都不对该等投资决策提供任何形式的担保,亦不以任何形式分享投资收益或者分担投资损失。中信建投不对使用本报告所产生的任何直接或间接损失承担责任。在法律法规及监管规定允许的范围内,中信建投可能持有并交易本报告中所提公司的股份或其他财产权益,也可能在过去12个月、目前或者将来为本报告中所提公司提供或者争取为其提供投资银行、做市交易、财务顾问或其他金融服务。本报告内容真实、准确、完整地反映了署名分析师的观点,分析师的薪酬无论过去、现在或未来都不会直接或间接与其所撰写报告中的具体观点相联系,分析师亦不会因撰写本报告而获取不当利益。本报告为中信建投所有。未经中信建投事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本报告全部或部分内容,亦不得从未经中信建投书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本报告全部或部分内容。版权所有,违者必究。中信建投证券研究发展部中信建投证券研究发展部中信建投(国际)中信建投(国际)北京东城区朝内大街2号凯恒中心B座12层电话:(8610)8513-0588联系人:李祉瑶邮箱:上海上海浦东新区浦东南路528号南塔2106室电话:(8621)6882-1600联系人:翁起帆邮箱:深圳福田区益田路6003号荣超商务中心B座22层电话:(86755)8252-1369联系人:曹莹邮箱:香港中环交易广场2期18楼电话:(852)3465-5600联系人:刘泓麟邮箱:charleneliucsci.hk

67人已浏览 2023-01-31 100页 5星级


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭