微软的“牛头怪时刻” 您所在的位置:网站首页 openaigithub 微软的“牛头怪时刻”

微软的“牛头怪时刻”

#微软的“牛头怪时刻”| 来源: 网络整理| 查看: 265

下面,我将深入分析微软在这两方面的特长。

半人 OpenAI和 ChatGPT

通过对ChatGPT的发明方OpenAI的战略投资和独家授权合作,微软巩固了其在人工智能领域的霸主地位。该合作关系官宣于2019年,微软可以利用OpenAI的前沿研究和新开发的AI技术,并将其驱动和集成到包括Azure AI服务、Cortana、以及Office 365等自家的产品和服务中,推动了微软AI生态系统的发展。值得一提的是,OpenAI对Office 365的集成范围和速度,在某种程度上,让微软快速捕获了全部的人类语言、知识、以及推断性的智慧(微软研究人员在此称为“a spark of AGI”)。

你可能会说:Google和Meta已经开始挑战OpenAI加微软组合的垄断地位了。不过,目前看来,它们的大语言模型--Bard和LLaMA似乎仍落后OpenAI“一个身位”。此外,随着OpenAI从一个非营利组织发展成为一个有限盈利组织。微软已计划向OpenAI注入超过100亿美元。可见OpenAI和微软之间的共生关系还将延续下去。

半牛 - GitHub、Codex和Co-Pilot

2018年,微软收购和整合了领先的软件开发与协作平台--GitHub,进一步扩大了对于整个人类智能的控制。GitHub可谓所有领先开源项目的中心。您可以将其视为以计算机语言表达的、人类智慧的聚合存储库。

而OpenAI的Codex是一种通过与GitHub Co-Pilot相集成,对软件开发领域产生深远影响的高级语言模型。Codex是GPT-3模型系列的一部分,能够理解和生成类似人类的文本,当然也包括编程代码。具体而言,它能够解释自然语言,查询并生成准确且与上下文相关的代码片段。这些能力使之成为了开发人员的宝贵工具。

GitHub的Co-Pilot利用Codex的能力,扮演了AI驱动的编码助手角色,通过提供实时的建议、以及自动完成的代码段,来帮助开发人员更高效地编写出程序代码。因此,Co-Pilot与Codex的集成,通过减少编写代码所需的时间和精力、最大限度地减少了错误,并使得开发人员能够专注于更高层次的设计和解决问题的任务。

作为一名产品经理和联合创始人,我通过将GitHub Co-Pilot与ChatGPT v4结合使用,编写了一个简洁的需求,然后让ChatGPT输出优质的样板文件。接着,在带有GitHub Co-Pilot的Visual Studio Code中,我按需修改函数与参数,微调各种控制流和业务逻辑。一个工作原型就这样在数小时内完成了。据说,对于那些经验丰富的软件工程师而言,通过GitHub Co-Pilot和ChatGPT v4的结合,他们的生产力能够提高3至10倍。

通过GitHub的巨大存储库,此类的工具可以轻松找到设计模式,并将其植入适合开发人员当前正在使用的软件系统的环境。据此,整个开发过程,不但节省了大量的搜索时间、以及针对输入与错误的检查,也自动化了大量的文档和测试过程。难怪有工程师感叹:在GitHub Co-Pilot离线几个小时的时候,他就像失去了一只手臂一般。

牛头怪的潜在危险

Google一直号称其使命是“组织全球信息,使人人皆可访问,并从中受益”。它的实践便是通过在各个网站上进行基本的页面排名(PageRank),并为它们建立一个巨大的索引,进而实现其愿景。

但是,有了微软和OpenAI的GPT大语言模型、以及GitHub Codex,全世界的信息可能会被浓缩成为数十亿、甚至数万亿的权重(形象地说,应该是统计重要性的数字)。而正是微软与OpenAI根深蒂固的关系,引发了人们对该公司利用其整合能力,对人工智能领域创造力予以垄断的可能性担忧。微软似乎就此进入了“牛头怪时刻”。

不可否认,OpenAI的GPT-4语言模型,是当今世界上最强大的人工智能系统之一。而GitHub则是世界上最大的代码托管平台。试想,如果微软使用此类工具去扼杀竞争,那么就可能会对人工智能、乃至整个科技行业的发展,产生重大影响。当然,这只是一个假设性的担忧,目前并无证据表明,微软打算以垄断的方式使用其整合能力。

忒修斯的希望

如果我们把初创公司看作挑战牛头怪的忒修斯。那么他们该如何站在巨人的肩膀上,利用大公司的平台,以及这些平台提供的资源、基础设施和用户群,在自己的新产品上进行创新呢?下面是两个典型的成功案例:

可见,有了大公司的平台,各项资源和用户群已不再是奢望,初创公司可以在竞争的市场竞争中快速获取成功的机会。不过,在第三方营利性平台上构建服务的主要风险之一,便是该平台可能会发生变化、消亡,甚至与自己的生态系统合作伙伴存在竞争关系(例如:Facebook与Zynga)。当然,政府和监管机构也可能会出手来阻止各种恶意竞争与垄断行为。

开放领域的竞争

一直以来,开源总是对抗大型闭源系统的可靠武器。鉴于OpenAI已经对其GPT-3和GPT-4模型进行了闭源,Meta开源了自己名为LLaMA的大语言模型。作为迄今为止最先进的开源大语言模型,它在1.4万亿个单词的基础上,训练出了多达650亿个权重。其中,7、13和330亿权重模型也得到了Meta的开源。这些较小的大语言模型能够方便各个研究团队基于LLaMA,提出自己的微调模型。这里不乏:斯坦福大学的Alpaca、伯克利大学的Vicuna和Koala、以及GPT4All等典型用例。通过使用人类反馈式强化学习,这些研究声称他们已达到了商业ChatGPT 3.5(1750亿权重)的90%到95%性能,而权重仅为70亿或130亿。

当拥有这些较小的大语言模型和优化的C++实现时,您便可以在笔记本电脑上本地运行它们,例如调用.cpp智能助手,而不必依赖于云服务,且无需任何费用。当然,目前LLaMA模型仅用于研究,因此您不能将它们用于商业用途。同时,您也可以关注如下实用的新模型:

在迷宫之外思考

让我们说回到迷宫。据我看来,Office 365很可能就是微软自己的迷宫。为什么要这么说呢?从收入和利润的角度来看,Office 365占微软2022年总收入的23%(来源https://www.kamilfranek.com/microsoft-revenue-breakdown/?ref=hackernoon.com#:~:text=The%20vast%20majority%20of%20Office,grew%20by%2018%25%20in%202022.)。微软或许能够将OpenAI的新功能添加到Office 365,但它可能只是一种增量更新,而不是根本性的改变。毕竟,Office 365的典型客户群是那些趋向于规避风险和变化缓慢的企业客户。他们不愿接受对现有产品的颠覆性的创新。所以在某种程度上,Office 365也就成了微软的枷锁。

对此,年轻的创业者则可以另辟蹊径,构建出超越现有工具的新沟通方式。例如:Slack和Notion就超越了电子邮件,Figma就超越了传统的Adobe创意套件。我们可以想象一下,如何让更新的人机界面在商业环境中工作。例如:Elon Musk的Neuralink就是采用了人和机器的电气连接,旨在人脑和机器之间建立直接通信,为重新构建商业环境中的通信,开辟了令人兴奋的可能性。

以下是可能超越微软Office套件等传统工具的几种典型技术与实现方式:

虽然以Neuralink为代表的技术在开发和实施上仍然任重道远,但它们在商业环境中改变通信的潜力是不可否认的。可以说,通过实现更直接、高效、更具同理心的交流形式,脑机接口将彻底改变我们在工作场所中的协作、决策和知识共享等方式。

未来可期

虽然我对微软的OpenAI和GitHub组合所带来的新生产力的提升,感到无比兴奋和喜悦,但也担心一家公司可能对整个人类的集体智慧拥有过大的掌控权。希望年轻的忒修斯们能够拿起开源之剑,在迷宫之外开辟新的道路,让人类的智慧更加自由繁荣。

译者介绍

陈峻(Julian Chen),51CTO社区编辑,具有十多年的IT项目实施经验,善于对内外部资源与风险实施管控,专注传播网络与信息安全知识与经验。

原文标题:Microsoft’s Minotaur Moment,作者:Bruce Li返回搜狐,查看更多



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有