科大讯飞19年的产学研创新之路 您所在的位置:网站首页 科大讯飞人工智能语音 科大讯飞19年的产学研创新之路

科大讯飞19年的产学研创新之路

2024-07-06 02:37| 来源: 网络整理| 查看: 265

1999年,6个大学生和12个员工,号称“十八罗汉”,一起成立了科大讯飞(胡国平是6个大学生之一)。成立两年后,讯飞的创始团队还没有找到盈利之道,可谓创业维艰。2001年,讯飞团队召开了“半汤会议”,会议结论是,虽然现在还不知道怎么挣钱,但要坚守智能语音研发的路线。这是讯飞历史上的一次关键会议,如果当时的结论是可以放弃现有路线,那么现在的科大讯飞,可能已经成为了一个房地产公司。到2004年,科大讯飞终于实现了盈亏平衡。2005年,讯飞成立了研究院;2008年,科大讯飞上市,这是讯飞发展史上的一个重要里程碑;2009年,获批成立语音及语言信息处理国家工程实验室;2010年,是又一个里程碑节点,讯飞发布了讯飞语音云、讯飞输入法,从一个行业公司转成了一个为大众所知的公司;2011年,在深度学习最开始的时候,讯飞就已经开始投入很多的资源去做深度学习方法;2014年,启动了讯飞超脑计划;2017年,成为智能语音国家新一代人工智能开放创新平台;2018年上市10周年之际,讯飞市值翻了24倍。有人专门统计了在上深交所或者在整个中国股市上市的3000多家企业,连续十年每年增长10%以上的企业,只有十家,科大讯飞是其中之一。

科大讯飞一直是一个技术支撑型的公司,从创始至今经过了6个主要的技术台阶。1999年讯飞做语音合成让计算机去开口说话;2002年开始做语音评测,就是评价一个人的普通话水平,进入了教育领域;2005年,做语音识别,要做到让机器人说话,更要能听懂人说话,从而进入了电信运营等行业领域;2011年开始启动一个新的方向语音云交互,紧随了移动互联网时代发展;2014年,启动了讯飞超脑,进军认知智能领域,就是让计算机能理解会思考,掌握知识学习和推理能力。认知智能的研究推动了讯飞进入了各行各业,包括最近两三年开始做的医疗、司法等行业。

胡国平分享的第一条创新经验,就是论技术台阶的重要性,要成为先驱不要成为先烈!1999年和讯飞同期成立的创业公司中也有做语音识别方向的,但是那些公司已无一存活,原因在于那个时候的语音识别技术还没有达到实际可用。讯飞是先做的语音评测才做语音识别。语音评测是在文本相对固定的情况下,人读一遍,然后机器去评价这个人发音的标准程度,它的整个技术原理和语音识别几乎没有区别,但是任务会更容易更直接。讯飞从2002年开始研究语音评测技术,一直到2012年承担全国的普通话水平测试,可谓十年磨一剑。通过用做语音合成赚的钱来养语音评测技术研发,通过做评测来支持做语音识别,这是科大讯飞前董事长王仁华教授为科大讯飞设计的技术发展战略中最关键的三个台阶。后面的三个台阶由讯飞目前的核心经营层设计。一步一个台阶,是讯飞成功的一个重要因素。

科大讯飞的第二条经验是每上一个大的台阶,依靠的都是产学研合作。在做语音合成引擎时,科大讯飞和中国科大以及声学所达成了很好的合作,做到了技术上领先,应用上落地。在研究语音评测技术时,与安徽语委和自动化所进行了深入合作。在做语音识别时,和清华大学以及加拿大约克大学成立了联合实验室。在认识智能方面,与刘挺教授的团队建立了哈工大讯飞联合实验室。在最新的脑科学研究领域,包括类脑计算、脑保护等方面,讯飞也在与同济大学、中科院心理所等寻求合作。从讯飞的经验来看,一个公司要在技术方面保持持续引领,在合适的时候找到合适的技术研发团队一起合作,去攀登下一个台阶,是非常重要的战略。

胡国平认为,“顶天立地”是讯飞多年来最重要的经验,它有三层含义。第一层是“顶天立地”的追求,“顶天”就是讯飞的核心技术要国际领先,“立地”就是讯飞的产品要进入亿万家庭,亿万用户;第二层是“顶天立地”的方法论,“顶天”和“立地”不可割裂,“顶天”和“立地”是相互支撑的统一整体:国际领先的技术要能够带来产品和业务上的发展,才是真正的国际领先的核心技术,如果只是一篇论文、一个专利,就算很有学术影响力,也不能说是“顶天”;此外,也要能通过“落地”源源不断地得到数据,帮助核心技术持续保持“顶天”,反过来又推动公司持续保持在“落地”上的强大战斗力;第三层是“顶天立地”的行事风格,要设立“顶天”的目标,然后“立地”或者说脚踏实地的去推进和实践。

目前讯飞设定的目标“让机器能理解会思考”、“用人工智能建设美好世界”,到目前来说并没有真正的实现。但是讯飞在一步一步的努力实践,利用“涟漪效应”推动技术进步。一个石头投入一个平静的水面产生的水波纹往外扩散,水波纹的高度会越来越低,类似的,新的技术投入市场,随着不断迭代,技术的错误也会越来越小,总有一天,会实现“顶天”的目标。举例而言,用户在讯飞输入法上能感受到的语音识别技术,从2012年到2017年,错误率每年下降30%左右,使用错误率从14.3%一路下降到2%,或者说正确率从85%一路飙升到98%。因此,当技术还不够成熟的时候,就需要将某些人工智能技术、产品或系统,先推出去,再通过持续的数据积累,获得技术迭代进步。

胡国平指出“核心团队+价值观”是讯飞成功的又一条宝贵经验,他认为在讯飞创业阶段,王仁华教授和刘庆峰博士双方完全互信互补的组合,非常关键。王老师将几十年积累的语音技术授权给刘总用于创业,但刘总拿的股份,差不多是王老师的两倍,正是王老师对刘总毫无保留的信任,自己专注于前沿研究,将市场、项目合作等完全放手让刘总去开拓,才推动讯飞迈出了关键的第一步。现在有些大学教授想出来创业,但在生意场上、在市场中低不下身段,这就会成为阻碍创业成功的重大阻碍,就需要找到合适的合作伙伴帮忙进行商业化运作,自己则专注于技术,并降低对技术的价值预估,让利给合作伙伴。

胡国平说,讯飞拥有一支有钱没钱都一样的核心团队。讯飞从1999年创业之初至今,18人的核心团队中只有一位因为身体等特殊原因离开了,正是核心团队的稳定性使得讯飞能够持续向前。此外,讯飞梳理的价值观中,“成就客户”、“创新”等可能与其他公司的类似,但有一个与很多其他公司不一样的价值观,叫做“坚守”,正是半汤会议确定了要坚守语音方向,而不是迫于投资方的压力,转向房地产等领域,才有了今天的讯飞。

科大讯飞成功的重要经验还包括选好战略投资方。2001年,联想、复兴、英特尔投资了科大讯飞,或者说是科大讯飞基于一些重要考量选择了上述了三家作为投资方。联想对早期的讯飞帮助很大,联想不仅是财务投资,还会利用其丰富的产业化经验和行业影响力,和讯飞共同探讨发展思路,协助讯飞开展经营;复兴多元化以及基于企业发展前景判断的投资理念对讯飞的影响也很大;英特尔的国际化视野也给讯飞的发展带来了很大的启发。所以,在创业之初,选择对企业成长有帮助的投资方,非常重要。

第六条经验是要具备乐观但不盲目乐观的心态。胡国平说,在讯飞外墙上,有两段话,一是“我们热爱讯飞,不是因为讯飞完美,而是因为完美的讯飞将由我们来创造”,这表明讯飞的乐观态度,即使现在还不完美,但是有追求完美的信心;二是“燃烧最亮的火把,要么率先燎原,要么率先熄灭”,这在时刻提醒经营层,在经营公司、经营团队的时候,需要辩证思考,不要盲目乐观、盲目投入。

讯飞董事长刘庆峰有“三问”。一问“为什么值得做”?二问“为什么是讯飞做”?三问“具体目标和计划是”?第一个问题,一般人都会去问,但很多人忘了问第二个问题,为什么这个事情值得你做?或者要由你来做?这句话一定要问,只要问清楚了想清楚了,确实在这件事情上,我最有优势、最有机会,否则就算有百亿市场空间,如果没有想清楚为什么要由你来做,也会有很高的失败概率。第三问也很关键,不能走一步看一步。不论是创业、做研究还是做管理,学会这三问,都会很有用。

胡国平介绍了讯飞在研究方向上的选择原则。讯飞研究院将20%的投入用于前瞻研究,80%投入要“立地”,要产生效益。讯飞非常强调前瞻,但不是任意的盲目的前瞻,要具有颠覆效应,同时做前瞻研究必须要引入牛人。在“立地”的研究上,要用好八字诀“刚需、代差、量大、可达”,要有真实需求、量大面广的基础,和别人相比能做出技术代差,以及一定要评估技术能在何时达到一个可用的水平。

面对当前的人工智能浪潮,胡国平认为我们有必要认清整个产业所处的态势。人工智能智能技术主要有三个不同的台阶,即运算智能、感知智能、认知智能。计算机在运算智能方面已经完全超越了人类,在感知智能上基本可以达到与人类媲美的地步,在认知智能方面与人类相比则还有较大差距。

2016年人工智能60周年刚热的时候,有三个关键词: 算法,算例和大数据;到2017年,很多人想,有了这些技术,接下来做什么?有了这个锤子,就要去敲钉子,于是场景就成为2017年的关键词。到2018年,大家更强调的则是价值。我们要选择一个有价值的场景,然后堆积相关的算法、算例和大数据来支撑,这成为现在的人工智能产学研和人工智能创业的一个关键的方法论。

人工智能是一种典型的赋能型技术。人工智能从技术应用落地来说,不外乎两个应用场景:一是自然交互改变生活,让机器能听懂人说的话,看懂人的表情和手势,把机器变得更聪明,能够实现更自然的人机交互;二是要寻找人们日常工作生活中重复性的脑力劳动,能提升这部分脑力劳动的效率或者替换这些脑力劳动,就成为人工智能应用落地的关键场景,譬如在教育领域帮助老师改卷子,在医疗领域帮助医生读医学影像等。

对于人工智能的应用落地,胡国平认为主要有四个明显的趋势。第一个趋势是对于to C的产品,硬件化的趋势是非常明显的,原因是操控简单,用户体验好,另外硬件化的方式具有很清晰的商业模式。譬如讯飞以前做了一个翻译APP,虽然也推广了大概一千万用户,但没有挣一分钱,而做了翻译机之后,就有了不错的利润。对于创业公司,非常有必要探索能可持续盈利的商业模式。

第二个趋势是大家都在讨论的深度进入垂直行业。和“人工智能+行业”相比,更应该做的是“行业+人工智能”。要懂教育、懂医学、懂医疗、懂司法……,要尊重传统行业中的专家,和他们形成良好的互动,才能真正地进入相应的行业。科大讯飞在过去的三年里签了很多战略合作协议,建立了很多联合研究中心,就是讯飞要和行业顶尖机构、顶尖人才形成深度合作。

第三个趋势是数据日趋重要。胡国平说,“科大讯飞语音识别从85%飙升到98%这样一个识别率的背后,我们大概测算一下60%靠算法,40%靠数据”。如果要做产业、做产学研,不能只关注算法,也要关注数据。

第四个趋势是,从国家规划、技术发展、重大投资等各个角度看,人工智能的热度应该还会持续很长时间,这是一个长跑的过程,但同时只有持续跑得快才能最终跑得赢,这是一个人工智能大热的情况下必须采取的基本态度。

人工智能应用落地的挑战在于人类智能对人工智能的“打击”无处不在,我们做人工智能技术,做人工智能落地,面对的竞争对手不仅是别的技术提供商,还有人类自身。

胡国平提出相比于人类智能,人工智能的优势有四点。一是可以作为其他系统的人机接口,像停车场的车牌识别,可以用于收费管理,我们可以在很多场景下找到类似的必要的或者非常方便的接口,成为人工智能技术落地的很重要的应用;二是使用传感器和大数据来达到超过人类的能力,比如天气预报就是典型,现在天气预报会告诉你哪个小时会下雨,那就是因为它有足够的传感器,足够的计算能力,又比如自动驾驶可以用毫米波探测器、夜视仪等形成一系列人类所不具备的能力,因此未来能比人做得更好;三是相对稳定性和可传承性,人与人之间存在着不一致性,有很多主观性,譬如不同的普通话评测员,对同一个考生,评分可能不一致,会需要仲裁,而机器则更加客观,更加稳定,更加一致,使得它最终能够超过人工;四是面对海量任务可以做到不知疲倦,不管多大的任务量过来,都会忠实地把它完成。

胡国平建议在把控人工智能应用落地的方向和节奏时,要优先对准现实中大量重复性脑力劳动,设置合理的“技术任务台阶”,可以志向高远,但是台阶得一个一个的爬,以及优先考虑人机结合的落地方式,不要一上来就要全自动,全部由机器来做。

胡国平建议在做产学研时,首先要清楚从技术到市场有多远,心中要有一张“全景图”。从最初的理论到技术实现,到形成引擎,出产品、造商品,构建商业模式,形成商业价值,有一个完整的链条,如果只有核心技术,那么至少还有一大半是缺失的,要寻找合作伙伴把它补齐。

胡国平说,从投资方角度,可以从三个方面对技术价值进行评估,即看需求、看技术、看团队。

看需求,就是当前任务是否满足刚需,能带动多少产值,可以理解为这个事情值不值得做。比如对汽车自动驾驶的需求显然比对自行车自动避障的需求大,或者说市场空间会更大,所以自动驾驶会很多人投资,但自行车自动避障技术可能就是做一个秀,不会有太多的价值。此外,评估当前技术问题是不是一个关键问题,有无替代方案,也至关重要。做技术的可能会觉得自己的技术就是无所不能,不可替代,但很可能并不是。譬如聊天机器人,虽然当前在商业上是否成功还没有定论,某些聊天机器人也很火,但是它和客服机器人不一样,客户机器人没有什么替代方案。如果一个人真的愿意聊天,他完全可以找很多人聊天,可以解决聊天的需求,所以聊天机器人是有替代方案的。

第二个是看技术,就是看技术值不值得投资。首先作为相对规模较小的技术团队而言,要通过国内外权威客观的评测来证明自己的核心技术实力。以讯飞为例,从2006年到2018年,语音合成技术获得国际评测13连冠,就说明讯飞的语音合成技术绝对是全球领先。虽然参赛的最新合成技术未必能直接用于现有产品,但能表明团队保持持续国际领先的技术实力和潜力。包括商汤的图像识别技术当年号称首次突破了人类肉眼的水平,也是同理,是它当下大热的重要原因之一。另外很多科研团队都会参加一些国际比赛,这时要特别强调参赛的其他团队是谁,如果是一些不入流的大家都没听说过的,那也无法彰显自身的实力。

其次稍微有点技术背景的投资方,都会关注针对各种实际场景,当前技术是否达到可用。比如讯飞的语音评测、用于输入法的语音听写和用于人与人自由交谈的语音转写,这三类音识别合成,语音评测,语音听写和转写,这三个不同的技术达到可用的时间不一样,投资会按照不同的技术可用时间,找准切入的时机。最后是当前的技术方案是否是主流是否是趋势。譬如以前做低码流率的语音编码,很有技术含量,但是随着网络带宽的持续提升,语音编码的关键不再是低码率,而是高保真、3D重现,现在就不会有人去投资一个低码率编码的项目。另外为了具备更好的信息输入,使得识别更准,麦克风阵列和单麦克增强相比,就是更主流更符合未来发展要求的一种技术方案。

第三就是看团队。现在的投资方评估技术团队,特别看重该团队对技术做到领先有多大的使命感和执着,是否有死活不服别人在比赛上或其他方面超过我的精神。另外就是评估团队对把技术做到有用有多大的成就感和追求。如果这个团队中的人更关注发论文升教授升研究员,那这就不是投资者从技术产业投资角度出发会关注的团队。

对于创业团队而言,需要转变两个观念。第一个是“二八原则”。“二八原则”有着硬币的正反两面,“80%的努力可能只能获得20%的技术提升,但如果你的技术能领先20%,你就有可能获得80%的市场份额和利润”,胡国平说,“这意味着要坚定技术投入并保持领先的决心”。譬如苹果手机可能都没有比安卓手机好20%,但是它的利润大概占据了整个市场利润的80%。所以一分钱一分货,一分努力一分收获,还是要坚定在技术上追求完美,往世界领先的方向努力。

第二是一定要明确自己做的是“破坏性创新(颠覆性创新)”还是“延续性创新”。如果是延续性创新,建议去找现在这个技术领域市场上典型的具备全面优势的企业合作;但如果是破坏性创新,如果要卖给一个相对守旧的没有那么大魄力的成熟公司,可能会抑制技术和商业上的发展,这时可能选择有创新活力的中小企业或团队合作会更好。

胡国平说,人工智能技术从研发走到市场,是一个很漫长的过程。科研人员是最有情结、最有毅力的,大部分的科研人员,都会对自己一直在做的研究领域和技术情有独钟,在很困难的时候,在还没有看到机会的时候,他都会愿意坚守。因此需要创造机会让技术团队参与技术的市场转化,长期分享转化成功的收益,同时共担投入期的风险,使得在整个转化过程中为技术持续进步提供最有效的支撑。

此外要形成产学研用优势互补良性发展的团队,团队中需要有两个人,一个技术带头人,另一个产业带头人,这样的两个人完全互信默契的密切配合,比一个人在所有的场合所有的事情上都要出面,要好的多,而且两个人还能有商有量,相互扶持,相互坚定信心,相互指出可能的风险和问题。

从技术层面来说,还需要一个换位思考。科研人员肯定希望在整个产业化和技术合作过程中不要牵扯太多的精力,最好是一笔交易搞定。但是从技术投资购买者的角度考虑,肯定是希望货比三家。所以科研人员要有耐心,要跟技术购买者去深入沟通。另外如果一个科研团队不是想着把技术简单一卖,而是真的想把技术进行产业化落地,那么一个愿意货比三家,愿意不停地与你讨论技术可行性和技术状态的投资者,对你的团队一定会更有帮助。

胡国平阐述了创业团队如何选择技术购买者或合作方。一是尽量选择对技术的市场潜力判断一致的甲方。如果甲方本身具备对技术的鉴赏力,有感觉,知道从技术到市场有多远,那么双方合作起来就会很高效。二是尽量选择愿意投入更多资源特别是骨干团队精力的甲方。譬如讯飞投资了小牛翻译,讯飞就愿意和它一起规划和设计发展路线,就像当年联想投资讯飞,它会告诉讯飞该怎么经营、该怎么做技术。三是尽量选择综合实力强、大风大浪走过的甲方。当年科大讯飞曾经奋战四天四夜,就是为了解决提供给华为的语音合成引擎的稳定性问题,测完之后讯飞团队痛下决心要重新写代码。如果有机会跟这样的甲方磨合,会是一个快速提升自身团队能力和技术水平的关键动作。四是尽量选择有过技术研发经历但又不是同行的甲方。选择同行作为甲方,那基本就是一锤子买卖,不用奢望和它长期合作。

胡国平认为,在人工智能领域,技术转化不会影响技术领先目标的达成,恰恰是有了收益,有了数据,才可能保持核心技术的持续领先。这可以借鉴讯飞“顶天立地”的方法论。

在何时启动技术成果转化方面,胡国平指出在立项的时候就开始考虑转化时机,不要等到技术成熟定型了,再去找转化的接收方。但如果太早了,可能就会流于空谈,浪费时间,所以可以等到核心技术取得突破可以演示的时候,去找转化的时机。

胡国平建议在这个社会化分工日益精细的时代,首先要找到自己单位或团队的强项。新木桶理论指出要把自己的那块板做得越长越好,其它的短板自然会有人来帮你加长。同时在这个瞬息万变充分竞争的时代要具备危机意识,对本单位的强项,一定要进行有效的标注,同时采用有针对性的应对策略。

胡国平还对四类典型的科研机构如何开展产学研创新,提出了建议。第一类是正在研发颠覆性技术的机构,要科学评估技术的价值,要加大投入具有“挤压效益”(某技术产品一旦有消费者使用,会使得其他消费者主动或被动使用该类产品)的技术;第二类是国家授权开展某类技术和产品研发的机构,要充分利用已经取得的国家授权,打造综合实力和技术积累,同时要有市场意识,加快转化;第三类是已经占据某个行业制高点的机构,要重视人员梯队建设,主持行业标准和会议,不断增强行业影响力;第四类是具备一流技术研发团队的机构,要和具备技术落地的单位进行战略结盟,不要四面出击,有时选定一棵树而放弃一片森林,可能对团队的发展会更有帮助,此外还要清楚技术之外的因素在市场竞争中的重要作用,不要孤芳自赏,高估技术的价值占比,譬如在微信中,游戏推广收入的70%归微信,这就是渠道优势,就是商业模式的价值。

胡国平建议要从现实出发,区分不同的市场化客户选择。to G、to大B,相比to C、to小B会更容易一点。另外,自己拿着技术出来创业,其实是很难的一个事情。建议可考虑以技术入股的方式和大的企业合作,或者和别人共建一个合资公司,这样能最容易补齐从技术到市场的各个缺失环节,使技术能快速的实现应用落地。

胡国平介绍了科大讯飞的平台+赛道发展战略。科大讯飞通过人工智能开放平台,将自身研发的以及引入和整合的合作伙伴的核心技术,用于已经形成很好市场占有率和市场领先度的行业赛道以及消费产品赛道,包括教育、医疗、政法、城市等诸多行业,以及汽车、玩具、翻译等各类领域,使更多的技术更快速地投放市场。

目前科大讯飞的智能语音和人工智能开放云平台已经有18亿用户,每天超过46亿次访问,聚集了80万开发团队。平台上有科大讯飞自己的也有集成第三方的80多个技术引擎。讯飞欢迎更多的第三方能把技术放到云平台上,为中科院等科研院所的人工智能核心技术提供应用落地的出口,形成商业价值,同时把相应过程中所获得的数据脱敏之后还给技术引擎的提供者实现技术迭代升级。

具体到医疗领域,科大讯飞建设了人工智能在线辅助诊疗平台。目前平台上有对肺结节等疾病的医学影像识别技术,讯飞希望通过开放的方式和利益分成共享的商业模式,集成更多的包括中科院院所在内的第三方科研机构针对特殊病种研发的医学影像识别在线引擎,同时助力科研团队形成技术进步的“涟漪效应”。在演讲的最后,胡国平表示,作为中科院孵化出的人工智能企业,科大讯飞期待与中科院院所和企业携手并肩,共同在中国用人工智能建设美好世界!

本期责任编辑: 丁 效

本期编辑: 蔡碧波

主编:车万翔

编辑: 李家琦,赵得志,赵怀鹏,吴洋,刘元兴,蔡碧波,孙卓返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有