李彦宏:中国版ChatGPT背后的AI“布道者” 您所在的位置:网站首页 北京李大彦 李彦宏:中国版ChatGPT背后的AI“布道者”

李彦宏:中国版ChatGPT背后的AI“布道者”

2024-07-09 21:35| 来源: 网络整理| 查看: 265

ChatGPT问世以来,全球为之侧目。3月16日,OpenAI发布ChatGPT最新“升级版本”GPT4模型的第二天,百度创始人、董事长兼首席执行官李彦宏携同为大语言模型、生成式AI(AIGC)产品“文心一言”亮相发布会,宣布开放邀请测试。

“文心一言”一朝出炉,看似仓促,实则包含着李彦宏对AI(人工智能)的30年情结,以及百度多年来在AI领域的深耕。

“拘谨”的发布会

发布会中,李彦宏演示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成5个场景中的应用情况。

李彦宏说,百度在过去的十几年中,一直在AI的研发上坚持投入,文心大模型的第1个版本在2019年就已发布,此后每一年都有一个新版本发布。因此,“文心一言”的发布,是过去多年努力的自然延续。

关于“文心一言”名称来历,百度首席技术官王海峰给出解释,作为自然语言处理模型,“文心一言”对中国语言文化有着不错的理解。因此,百度结合南朝文学理论著作《文心雕龙》书名,为产品取名“文心一言”。

“文心一言”是怎样做出来的?李彦宏解释,过去,IT的技术栈分为芯片层、操作系统层、应用层或软件层3层。进入AI时代后,IT技术栈从3层变成芯片层、框架层、模型层、应用层4层,“文心一言”就处在模型层。这几年,百度着重发展文心大模型,塑造“文心”模型品牌。除了“文心一言”,百度还曾发布过AI艺术和创意辅助平台——文心一格。

从此次发布会呈现的信息可见,处于框架层的飞浆——产业级深度学习开源开放平台,支撑了“文心一言”从开发训练到推理部署。“文心一言”大模型的训练数据,包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。而飞浆已经凝聚了500多万名开发者,服务了20万家企事业单位,创建了67万个模型。

李彦宏笃信,以后AI时代的应用,都会基于大模型来进行开发。“过去,在服务搜索时,是判别式的语言大模型,‘文心一言’是生成式的语言大模型。生成式AI代表了一种新的技术范式,它会带来市场需求的爆发式增长,其商业价值的释放将是前所未有的、指数级的。”李彦宏说。

作为类ChatGPT产品的“文心一言”,一经发布,就被网友拿来和ChatGPT比较。相较此前版本,ChatGPT新品GPT-4可以实现强大的识图能力,文字输入限制提升至2.5万字,在回答准确性、文本创作等方面,都有了很大提升。这种变化被比喻为从“小学生”升级到“高中生”。因此,多数观点认为,文心一言和ChatGPT存在明显差距。这让原本害怕工作被AI取代的国内网友调侃道:“提前退休的日子要缓一缓了。”

此次发布的录播形式,被“文心一言”关注者诟病。多方声音也指出,此次发布有些“赶鸭子上架”,李彦宏在发布会上表现得“有点拘谨、不自信”。

李彦宏坦承,“我体验到的(文心一言)也不能叫完美。”“要对标GPT-4,这个门槛还是很高的。”

但同时,李彦宏也表现出了基于自身优势的自信,“可以说全球的大厂中,百度是第一个发布(类ChatGPT产品)的。”“全球范围内在(IT技术栈)4层都有领先产品的公司,可以说绝无仅有。百度就是那个唯一。我们的优势非常独特,这个优势,相信未来大家在文心的迭代速度上会有明显的感受。”

为何选择现在发布?

李彦宏解释是出于“市场的需求”。他提到,百度的各个产品线,从搜索到智能云、到自动驾驶、到小度,都在等着用这样的技术。“更重要的是我们的客户,我们的合作伙伴,在等着用这样的技术。大家都在催我们,需要尽早把它发布出来。”李彦宏说,“从2月7日百度正式官宣要发布‘文心一言’以来,一个多月的时间内,已有650多家企业,宣布接入‘文心一言’的生态。”

“群雄逐鹿”中“弯道超车”

2022年11月底,美国的OpenAI公司推出人工智能对话聊天机器人ChatGPT。发布仅5天,ChatGPT用户就超过100万人。Facebook当年用了10个月,才达到这样的成就。这引发了全球AI行业及相关领域的“惊涛骇浪”。

ChatGPT同样是生成式AI技术产物。何为生成式AI?

近期,《AIGC:智能创作时代》一书出版。为本书书写序言的经济学家、横琴数链数字金融研究院学术与技术委员会主席朱嘉明认为,AIGC是人工智能经过长期摸索所选择的重要的、正确的发展方向,他将此次智能数字化转型称为“媲美新石器时代的文明范式转型”。

北京理工大学网络与安全研究所所长闫怀志向媒体这样解释:“生成式AI是指使用机器学习等各种AI算法,让人工智能能够利用数据进行学习,进而创建或生成全新的原创内容的一种技术。目前,生成式AI能生成文本、图像、音频、视频或代码等多模态的原创内容。”

生成式AI产品ChatGPT,面对编程、计算、文本创作等繁复工作,只需数秒就能完成,可谓“机”智过人。《财富》杂志认为,ChatGPT之于AI领域的重大意义,就如同当年的Natscape和iPhone在计算机行业具有的里程碑意义一样。

冰冻三尺非一日之寒。

20世纪60年代,世界第一款人机对话机器人“Eliza”问世,80年代,IBM推出语音控制打字机“Tangora”,这被认为是生成式AI萌芽阶段的产物。2007年,世界上第一部完全由人工智能创作的小说《1 The Road》问世,2012年,微软推出语言全自动同声传译系统。20世纪90年代到21世纪的前十年,被认为是生成式AI发展积累阶段。

2015年,特斯拉汽车创始人埃隆·马斯克,格雷格·布罗克曼(OpenAI联合创始人兼总裁)、山姆·阿尔特曼(OpenAI首席执行官)、彼得泰尔(Paypal创始人)以及伊利亚·苏特斯科夫(师从神经网络之父杰弗里·辛顿,OpenAI首席科学家)等数位硅谷大佬拿出了10亿美元,创立OpenAI。

OpenAI于2018年发布第一代大型模型GPT-1,2019年发布GPT-2,2020年发布GPT-3。2021年,OpenAI推出生成图像的人工智能产品“DALL-E”。

一石激起千层浪。

2022年,全新版本的ChatGPT甫一推出,就猛烈地掀起一股新科技浪潮。一批互联网科技巨头,纷纷宣布加入新一轮的AI“军备竞赛”。

率先入场的谷歌,在今年2月,发布了人工智能聊天机器人Bard。但在巴黎首秀中,Bard回答问题时犯下了事实性错误,遭遇惨烈“翻车”。这让谷歌母公司Alphabet股价重挫8.28美元,市值缩水1059.14亿美元。

谷歌“翻车”之后,微软“趁势而起”,发布了由OpenAI提供技术支持的新版Bing搜索引擎和Edge浏览器。业界认为,微软此举,是要撼动谷歌在搜索引擎领域的“垄断”地位。

国内互联网大厂不甘落伍。

2月7日,百度官宣“百度版ChatGPT”“文心一言”将于3月份完成内测并对外开放。同日,360公司表示,其在2019、2020年左右就看到了技术变革的可能,并成立人工智能研究院,投入人力、算力做AI场景,但类ChatGP测试版的推出时间以及实际效果均存在重大不确定性。

2月8日,阿里巴巴技术专家爆料,阿里达摩院正在研发类ChatGPT对话机器人。同日,京东集团副总裁何晓冬表示,未来,京东会结合ChatGPT,推动人工智能产业落地。

2月9日,腾讯相关人士称,腾讯目前也有ChatGPT相似产品和AI生成内容的计划。

在ChatGPT先声夺人之后,全球科技大厂站上了同一赛道,并纷纷抢跑,第一个“弯道超车”且斩获颇丰的正是百度。

有了谷歌新品问世的前车之鉴,百度的“文心一言”发布,自然显得异常谨慎、低调。

尽管如此,“文心一言”发布后,百度集团股价也随即闪崩,一度跌逾9%。但到了17日,百度集团股价开盘又冲高,这表明部分投资者对“文心一言”重拾信心。而在文心一言官网,等待体验的用户,已经排起了百万人的长队。

“AI先生”的30年

“群雄逐鹿”的AI竞技中,百度的“弯道超车”,绝非偶然。李彦宏将“文心一言”的诞生,总结为“十月怀胎,一朝分娩”。

公开资料显示,李彦宏个人与AI结缘已有30年。

李彦宏在其编著的图书《智能革命》中指出,AI的历史早于互联网,与计算机历史相伴。1956年,达特茅斯会议召开,AI被正式提上日程。那时候一台计算机的体积有一栋房子那么大,计算能力低下。当时,明斯基已经造出第一台神经网络计算机,不久后写出了论文《神经网络和脑模型问题》。这篇论文日后成为AI技术的鼻祖。图灵则在1950年就提出了如今人尽皆知的图灵测试理论以及机器学习、遗传算法、强化学习等多种概念。

图灵去世两年后,在达特茅斯会议上,麦卡锡提出AI概念。参与会议的十位年轻科学家,后来成为世界各国人工智能领域领军人物。人工智能迎来短暂春天。

20世纪90年代,AI出现新的研究高潮。此时,李彦宏和AI结缘。

2020年,李彦宏在社交媒体发出一则图文,其中写道:“居然翻出了30年前在北大学人工智能课的笔记。”配图显示,在笔记本上,李彦宏竖写着“人工智能”四个字。那时的李彦宏,在北京大学图书情报专业就读。1991年,李彦宏到美国布法罗纽约州立大学入读计算机系。

留学期间,李彦宏曾选择人工智能课程,还发布了相关论文。但导师告诉他这个行业赚不了钱。

后来,李彦宏在作为美国搜索引擎先驱的Infoseek公司工作,切身感受到了互联网商战气氛,感受到了美国人对新科技浪潮的昂扬热情。1998年,他据此写出《硅谷商战》一书。1999年,李彦宏回国,于北京一家宾馆房间创办百度公司。

2005年,百度在美国纳斯达克上市。此后多年,掩映在百度掌门人光环下的李彦宏,迎来另一个身份——“AI先生”。

始于信仰,成于坚持。李彦宏很早就开始了AI布局。

早在2010年,百度就成为中国最早深度布局AI的先行企业。

2012年,一位高管向李彦宏演示了深度学习技术对于搜索的改进。李彦宏因此写了一封邮件,鼓励全百度产品经理了解AI技术最新趋势。

2013年1月,百度年会上,李彦宏宣布深度学习研究院成立,并自任院长。李彦宏认为,“这应该是全球企业界第一家用深度学习来命名的研究院”。

2014年4月,百度成立了大数据实验室,同年5月又成立硅谷人工智能实验。

2017年,百度又增加了商业智能实验室、机器人与自动驾驶实验室……完成了在AI各个细分领域的研究布局。

2017年7月5日,发生了李彦宏“以身试法”推广AI技术的一幕:

这一年的百度AI开发者大会上,李彦宏乘坐百度Apollo无人驾驶平台开发的无人驾驶汽车,从北京五环路驶向会议现场。李彦宏乘坐无人驾驶汽车的视频流传网络后,被“老司机”们发现了多项违章。同月11日,李彦宏在山西大学的一场人工智能专题报告上表示:“当无人驾驶的技术成熟之后,一定比人类司机要更安全。”

在2020世界人工智能大会上,李彦宏重申,无论当年对互联网的信仰,还是今天对AI的信仰,自己都没有一丝丝改变。“我仍然认为,AI是堪比工业革命的技术浪潮,一定会彻底改变今天每一个行业……人工智能不再遥远,就在我们身边,延长了我们的双手,强大了我们的大脑,丰富了我们的视觉,消除了时空的障碍。”李彦宏说。

AI乐观主义者

“机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管;机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外;机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存。”——20世纪中期,世界科幻小说三巨头之一的阿西莫夫,在其科幻小说中提出“机器人三大法则”。该法则虽在科幻小说中提出,却是解决“人工智能恐惧症”的一张“处方”。

但时下,随着AI技术日新月异,人们对其取代或淘汰,乃至“终结”人类,有着不少担忧和警惕。相较于警惕、恐慌等负面情绪,李彦宏对AI抱乐观态度。

2019年,在乌镇第六届世界互联网大会上,针对“人工智能会毁灭人类”的观点,李彦宏给出反驳:“人工智能不仅不会毁灭人类,反而可以让人们获得‘永生’ ”。“每一个人说的每一句话,干的每一件事儿,甚至你的记忆、情感、意识等都可以数字化存储下来,放在网盘或者其他的云端,你的思维方式可以被机器学习出来,遇到新问题,通过技术进行现实还原,就可以与后人进行超越时空的对话。”

随着AI技术的不断发展,关于人机关系、AI伦理的探讨也越来越多。李彦宏也在推动AI伦理方面的研究。他曾在两会期间接受采访时表示:“我觉得AI应该做的是让它去帮助人和服务人,不应该做的是让它去伤害人和控制人。”他建议,相关部门应该加强人工智能伦理研究,处理好机器与人的新关系,避免技术“跑偏”。

他乐观预测,未来20年,人们对手机依赖程度不断降低。在智能经济时代,智能终端会远远超越手机的范围,人们将会以更自然的方式和机器、工具进行交流。

李彦宏的乐观,还在于对AI行业的前景展望。

李彦宏回国创业之时,正是互联网泡沫破裂之际。在许多人出走互联网领域的形势下,李彦宏坚持了下来。之后,中国互联网迎来黄金发展期,李彦宏和百度迎来了丰厚的市场回报。百度也塑造了国人上网习惯:“有问题,问百度。”

前几年,AI行业的悲观情绪也在弥漫。李彦宏则拿出创立百度之初的情境,鼓励行业坚定AI发展信心。2022年,李彦宏再次乐观表示,随着技术应用门槛不断降低,创造者们将迎来属于人工智能的黄金10年。

此前,他将AI发展分为技术的智能化、经济的智能化、社会的智能化三个大历史阶段。同时,他将第二阶段分为前后两个阶段。李彦宏说,目前,人工智能正处在经济智能化前半段向后半段过渡时期。当到达第三阶段,人类终将进入智能社会。

狂热的“布道者”

每逢重要场合,李彦宏便化为AI狂热“布道”。

这从近些年李彦宏的公开发言可见一斑:移动互联网的机会已经不再有了,新的机会属于人工智能,这不是移动互联网的延续,是一次新的工业革命;我跟以色列总理内塔尼亚胡在会谈的时候提出一个观点,互联网只是前菜,人工智能才是主菜;将来“中国制造”要想变得有竞争力、要想真正转型升级的话,最需要依靠的是人工智能技术,而不是大数据、云计算、物联网……

作为全国政协委员,李彦宏在连续8年的“两会”中,提出了13份AI相关提案。

有人统计过,在AI大潮袭来的2016年,李彦宏在公开场合提到“人工智能/AI”500多次。但凡对AI有兴趣者,无论是国家领导、相关企业,还是极客、学生,李彦宏都要向他们“安利”AI,不放过任何科普AI的机会。

2019年,另有媒体统计,3年间,李彦宏的40次演讲,共计15万字,都涉及AI,构筑起了李彦宏的“AI简史”。

“布道”之余,是年复一年的投入。

2020年5月,李彦宏接受采访时透露,这些年(百度研发投入占比)基本上都在15%左右。“最近几个季度,核心研发费用占百度核心收入比例超20%。”

2022年,百度核心研发费用214.16亿元,占百度核心收入比例达到22.4%。该年四季度,百度研发投入为56.58亿元。

目前,百度在AI上投入超10年,研发投入超1000亿元。

李彦宏多次说:“即便只有1块钱 我们也投到技术。”他表示,百度以高科技公司为定位,应该保持这个投入。即便投入不是两三年就有回报,“但是如果你信这个东西,你就可以七年、十年坚持投下去。”他说。

巨大的投入下,是肉眼可见的产出。

2018年,中国社会科学院社会学研究所发布的一份报告指出:“百度催生了一个新的社群和劳动力市场。培养了近55万名人工智能相关人才,相当于建立了10所专门的人工智能大学。”

李彦宏在2020年,对于AI设定了具体目标:用5年时间,为全社会培养超过500万个AI人才。今年1月10日,李彦宏在百度Create AI开发者大会上表示:“目前已培养了超过300万。”李彦宏的另一个目标则是:到2030年,智能云服务器数量达到500万台。

这些年,在AI领域,中国一改核心技术落后被动局面,AI专利申请量已超美国。而百度AI专利申请量、授权量、专利质量在中国领先。百度的深度学习专利申请量全球第一。

2022年12月出炉的《中国人工智能专利技术分析报告(2022)》显示,百度AI专利申请量16754件,AI专利授权量5705件, AI专利申请和授予量连续五年全国第一,专利质量评测得分92.21,再次位列全国第一。

在《哈佛商业评论》公布的“2019全球AI公司五强”榜单上,百度位列第四,成为唯一进入全球五强的中国企业。2019年1月,世界知识产权组织(WIPO)曾经发布《WIPOTechnology Trends 2019 ArtificialIntelligence》,百度、中国科学院等崭露头角,其中百度是进入全球前30名的唯一中国公司,深度学习专利申请全球排名第二。

百度打造的深度学习平台飞桨,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。与此同时,百度表示,基于AI布局,它希望成为元宇宙的“基建狂魔”……

“人类的存在就是‘在路上’”

今年2月22日,百度发布第四季度及全年未经审计财务报告。财报发布后,李彦宏发出内部信。这成为“文心一言”发布前的一次总动员。

内部信历数百度的AI领域“战果”。例如2022年,百度智能云连续四年稳居AI云服务市场第一;百度完全无人驾驶运营取得了突破,开始在武汉和重庆提供全无人出行服务,并获准在北京开展全无人驾驶测试……内部信同时提到:“AI技术已经发展到一个临界点,各行各业都不可避免地被改变”,“百度作为中国人工智能市场长期增长的最佳代表,正站在浪潮之巅。”

李彦宏说,最近这几年,他不断跟团队讲困难、挑战,为的是当机会来临时,能够抓住机会。他号召:“‘用科技让复杂的世界更简单’,坚持做正确的事,帮助实现人工智能的终极理想,‘为人类带来更多的自由与可能’。”

显然,发布“文心一言”,就是李彦宏所说的“抓住机会”。

需要“抓住机会”的不光是李彦宏和百度,还有AI产业和相关创业者。

李彦宏认为,随着“文心一言”而来的大模型时代,将产生三大产业机会:第一类是新型云计算公司,第二类是进行行业模型精调的公司,第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。

对于大部分创业者和企业来说,真正的机会是基于通用大语言模型,抢先开发重要的应用服务,而非从头开始做ChatGPT和文心一言这样的基础大模型。李彦宏认为“这很不现实,也不经济”。“就像移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等各种超级应用。”李彦宏说。

当地时间3月23日,OpenAI宣布ChatGPT支持第三方插件接入,这将帮助ChatGPT访问最新信息、运行计算或使用第三方服务。同时,OpenAI推出了网络浏览器和代码解释器两款自有插件。此外,OpenAI还开源了知识库检索插件代码,使得任何开发者都可以自行托管信息,从而增强ChatGPT。目前,ChatGPT正在创建自己的生态系统。

李彦宏近日在极客公园的直播中表示,文心一言确实不如现在最好的ChatGPT版本,但差距也不是很大,可能就是一两个月的差别。文心一言目前差不多是ChatGPT今年1月份的水平。

面对ChatGPT的持续“狂飙”,有观点认为,文心一言能否在中文领域给予用户惊喜,甚至在中文领域超越竞争对手,值得期待。“但也不宜期待过高,毕竟文心一言和ChatGPT在算力、算法、数据上的差异摆在那里。”此前,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林向媒体表示。

万博新经济研究院院长滕泰也针对“文心一言”发表了自己的观点。他认为,作为新产品,“文心一言”必然有各种各样的不完美。但它是仍然是中国人工智能发展的重要里程碑。

更普遍的观点则认为,ChatGPT 发布至今不过4个月,很少有科技公司能在如此有限的时间内,真正做出对标产品,但百度做到了。尽管它不够完美,但能在科技巨头的集体焦虑中脱颖而出,这本身就令人鼓舞。“文心一言”的发布,仅是开端。产品的全貌,以及后续的完善、优化,需要在不断的使用反馈中进行。

李彦宏主导编著的《智能革命》一书,在最后一个章节最后一段这样写道:“在未来漫长的智能岁月里,即便诸如百度、谷歌这样的人工智能公司,可能也只是浩瀚历史中的一个过客……古人说‘不以物喜,不以己悲’‘担当身前事,何计身后评’,正是我们人类担当精神的体现。我们能做的就是抓住当下。人类的存在就是‘在路上’。百度要为美丽新世界铺垫好最初的基因,中国要从大国变成伟大的智能文明国家,每个人也都应该不甘落后于机器,努力做更好的人,知道更多,做到更多,体验更多,一起向着美好但不确定的未来进发。”(文/《丝路文明》吴军礼)



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有