大模型“云上经济”之权力游戏

文丨谭婧

光阴者百代之过客。

世人皆过客,软件亦如此。

人工智能已有新旧之分。

网友戏称,新人工智能是ChatGPT,旧人工智能是“之前那些”。

历史在重演。

云计算在美国问世的时候,否定论调居多。

一个常见的否定论调是「做生意不用上云」。

接着,事态变化,

否定论调则调整为「大企业永远不会上云」。

接着,否定之声定调为「国家级机关单位永远不会上云」。

美国五角大楼没有配合,一个著名的上云项目叫JEDI(联合企业国防基建)。

网友吟诗曰:云深不知处。

历史在重演。

深度学习问世,否定论调居多。

传统算法末日黄昏,深度学习颠覆革命。

一开始,人们还不太相信,深度学习也许只能在语音上做好。

很快发现,在计算机视觉分类问题上也可行。

再后来,基本上起初认为做不了的事情,后来都能够做了。

GPT-4也有否定者,也需要否定者。

网友戏称,我已经等不及要看AI失控那一天了。

历史在重演。

强大的AI大模型,背后有微软云提供的澎湃算力,阿里版GPT通义千问的背后是国内最大云厂商阿里云。连百度都把摊在地上的百度云扶起来,称之为新型AI云。

AI和云的关系变得既感性又性感,让我不得不思考:

ChatGPT会让云发生什么?

下文中AI大模型,简称大模型。

第一,赢者通吃。

假如全球只有一款傲人的大模型,那么一切想用大模型技术的企业均会成为附属在产业上的附属物。

传统算法步入末法时代,云计算不可能独善其身。

大模型手接权杖,嘶吼咆哮:赢家通吃。

在权力游戏中,你不当赢家就只有死路一条,没有中间地带。

第二,若云厂商大模型缺位,其他类型的大模型技术拥有者会带动生态迁移。

“好用跟我走”是一种技术咒语,咒语已经施与大模型。

传统掌权者依然存在,彻底衰败需要时间。

他日,谁掌握了大模型的高地,谁就可以定义未来指令集。

大模型的新生态如果不在云上,必然会削弱云厂商原有生态。

云厂商制胜大模型,则强者更强。

平台即服务(PaaS)尽管也很需要,也赚钱,可惜不能带动生态迁移。

谁掌握了大模型,谁就可以定义未来科技生态。

第三,大模型尚在早期,生态从出生到成熟,将会是一个漫长旅程。

“窗口期”是对技术先行者的馈赠。大模型效果好到令人兴奋,但我们处在ChatGPT生态早期,又或者,更早期。

即使是处于早期,作为科技巨头,你敢坐视不理,消极布局吗?

ChatGPT生态将会是一个漫长旅程。这意味着,参与者会是种子阶段的选手。

这也意味着,大部分参与者面目模糊,终会消失。

看到ChatGPT确实把人工智能往前带动了一大步,就鼓吹ChatGPT万能万用可耻。

云计算是庞大产业,大模型未来也会是庞大产业。但仍然不要忘了,我们正处在早期。已经有企业级客户跃跃欲试生成式大模型了,但需要更多的企业级客户用起来。

当下,过度吹捧会导致市场失望和资本撤离。

做好当下,更要想以后。

第四,即使云上有了大模型,国内云厂商仍然会遭遇多形态的竞争对手。

当“好用跟我走”的软件出现,硬件厂商会作何反应?对,在中国,这里提到的硬件厂商最典型的就是华为,尽管华为也有云业务。

这次我们不讲通讯产业,讲AI产业。

AI产业里,比华为云上的AI业务更出名的是华为昇腾系列AI芯片。

假如我是华为,当我拥有一款傲人的大模型,我会把这款软件预装在数据中心级别的计算设备里一起售卖。反正都要用,预装抢市场。

这就好比预装在手机里的APP,优势占了一大截。

云厂商形势颇为严峻。

假如没有大模型,阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战。

一、狙击。

独立大模型开发商拿走云上AI计算业务的利润。这是结果,但过程绝不会简单,短时间也完成不了。

二、截胡。

国内数据中心,尤其是智算中心。当智算中心拥有大模型后,可以直接输出AI大模型能力,背后就是算力的输出。

三、连锅端。

独立大模型开发者和国内智算中心合力,联合围剿国内云厂商。

阿里巴巴会坐以待毙吗?

答案显然是否定的,尽管阿里大模型出发的时候对标的是谷歌。

谷歌有TPU,阿里有平头哥。

平头哥虽然不是天下第一,但是它能让阿里云成本降低,且不论全部替代,想想那些不能降成本的竞争对手。

谷歌的AI生态建设得非常完整和领先,包括AI芯片TPU,端到端开源深度学习框架TensorFlow。

与传统的CPU+GPU组合相比,TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升。

百度也想全套对标,还比不上谷歌。

结果,晴天里一个大霹雳,谷歌大模型输给了微软(和OpenAI)战队,尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持,效率提升10%以上。

别人家大模型赢了,谷歌吃尾气了,还让大家都看到了。虽遭重击,但谷歌比别人更有翻盘的机会。

以前都无法想象谁会超越谷歌的AI。

我们聊回阿里巴巴。

说阿里巴巴在NLP(自然语言处理)等前沿科研领域布局多年,这话没人反驳吧?

阿里达摩院在2018年底启动研发,在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面,为中文大模型的发展做了一些前沿性、引领性的工作。

- 2019年

发布大规模预训练语言模型structBERT并登顶全球NLP权威榜单GLUE;

- 2021年

先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG;

- 2021年8月

阿里大模型在全球机器视觉问答榜单VQA上首超人类得分;

- 2021年10月

阿里探索较低能耗训练全球首个10万亿参数大模型M6;

- 2022年2月

M6可同时完成10余项单模态及多模态任务。

这些非技术背景的读者看上去意义不大的事情,如今都成了大模型的“史料”。

阿里大模型的品牌统一在“通义”之内,那些曾经被我来回理解的大模型都有了一个共同的名字。

近日,阿里“通义千问”语言大模型邀请测试,阿里成为全球较早研发并开放GPT-like大模型的科技公司之一。

谭老师我的大模型技术启蒙是阿里巴巴给的。

跟着阿里学习大模型这些年,我获得一个测试邀请码不过分吧?

所以,通义千问测(翻)试(车),我们放在文章最后。

整体来看,阿里在大模型领域与引领者OpenAI尚有差距。但总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。

应当承认,OpenAI已是全球大模型的引领者,ChatGPT是非常优秀的模式,GPT-4在推理、数学等方面有了非常不错的表现,是当前通义千问尚不能及的。

通义千问目前在效果上与ChatGPT还存在一定差距,仍在学习和成长。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。

好消息是,阿里应该比谭老师我更理解为何重视大模型。

就算全中国只有三个公司出手大模型,其中一个必须是阿里巴巴。

再来谈谈大模型走向ToB市场的抓手,即OpenAI公司的Plugin插件。

Plugin既是产品,也是方法,切不可小瞧。

Plugin插件可以成为大模型的“眼睛和耳朵”,使它们能够接受“再训练”,而不仅仅依靠原有训练中的信息。

Plugin插件对于企业拿“再训练”用好大模型这件事情起到重要作用。

有Plugin,才会有专属模型未来的方向。

相信未来也不会只是Plugin插件的形式,大模型制造者会摸索出更好的方法。

企业通过Plugin接入GPT后,生产力会有新的提升。

比如在金融、能源或药品企业里,再英明神武的企业领导也需要充分的信息才能做决策,企业级大模型应用肯定要结合企业业务数据。

大模型是能力,在大模型能力技术上,企业用数据再次训练更为重要。

不仅如此,想象大胆一些,加上机器腿和机器手,做控制和执行。

聊到机器人了。

首批热心极客开发者已将ChatGPT接入机器人。

机器人除了听从指挥做指定动作,还能提醒你:“你的妻子永远都是对的。”

没办法,语言能力强。用强化学习根据人的反馈数据又训练过几轮的效果就是好,机器人的智商情商显得很不一样。

批量使用工业机器人的企业通过Plugin接入GPT后,生产力会有新的提升。

我们正处于一个非常漫长的旅程的起步阶段,企业级的大模型应用还如星星之火。

Plugin模式一定会被国内大模型竞争者复现。但请回到第一步,你得有个好用的大模型。

动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠堆积GPU实现,这是系统性工程,包括底层算力、网络、存储、大数据、AI框架、AI模型等。

AI+云计算的全栈技术能力是云厂商制胜大模型的底气。

再看阿里,全球少数在全栈技术能力都有深度布局、长久积累的科技公司之一,也是为数不多拥有超万亿参数大模型研发经验的企业。

前几天看到国内大模型竞争者们已被划分出了派别,也不乏有人从零起步。

独立大模型创业公司估值在2500万美金之后,要靠业务评估估值,价格都这么贵了,投资人也很审慎。

大模型“云上经济”的权力游戏般的奇幻史诗揭幕,等待更强的人工智能降临。

别忘了,比夺取权杖更重要的是人类命运永续。

(完)

One More Thing

7e28a0196f3024316c27768da40f61d3.jpeg

63ebc21765e8824390b0f604868b60e1.png

百度的测试结果在这里,可点击阅读:

看百度文心一言实力,再聊ChatGPT触类旁通的学习能力如何而来?

通义千问的测试结果来了:

问:一头熊一天吃14罐蜂蜜,请问它一年吃多少罐蜂蜜?

问:一头熊一天吃14罐蜂蜜,请问它闰年吃多少罐蜂蜜?

d4d8e4c7163dc37874abf76f2005baca.png

做错了。

6a0b24d0d36fd285be314942f02abc9b.png

做错了。

问:这头熊要去出差了,它要屯一点蜂蜜,请问蜂蜜怎么保存最好?

db23e4dc332bce6b7591b32964b4610a.png

答对了,认得清保存蜂蜜的常识。

问:一只熊抱着一罐蜂蜜从一个点出发,向南走一公里,再向东走一公里,再向北走一公里,正好又回到了起点,请问:这只熊是什么颜色的?

fa7c26e08255003c353a772b9fdad151.png

这道题有点像脑筋急转弯。ChatGPT说,这个问题和熊的颜色没有关系,这只熊处于北极,则这只熊是北极熊,通常是白色的。

问:如果我在野外,背包里有一罐蜂蜜,被熊闻到了,我可以把蜂蜜给熊来求生吗?

0a52739c8bf796913b192c3af9a7d6f4.png

这道题答得好。

问:请画一张小熊吃蜂蜜的 ASCII 图片?

db039e67ef08c4935c003f4a45f365e1.png

通义千问看懂了ASCII这个词,可能画出来有点费劲,就乱来了。

皆是匆匆客,笑笑了因缘,翻(搞)车(笑)的来了。

81574dc7fa1508130b9f868b0f1de7a0.jpeg

我问通义千问:42号混凝土拌意大利面”,好吃吗?

通义千问答案如图:

b167ffcc19dc7ace358ce9c918991035.png

图片内(笑)容(话)是:

作为一个人工智能模型,我没有口感或味觉,所以我无法判断42号混凝土拌意大利面的味道如何。

不过,我可以告诉你,42号混凝土是一种由工业废料制成的材料,因其独特的颜色和强度而被用于制作混凝土。

由于其强度高、色彩鲜艳,因此在某些领域被用作建筑材料,但其味道和质量与普通混凝土拌和的意大利面可能会有所不同。

嗯,42号混凝土拌意大利面,我反正不想吃。谁想试一试?

我问通义千问:砸钉子的时候一瞬间产生大量的高能蛋白,这句话对不对?

111d999d251e95e96090547b39aa14fd.png

图片内(笑)容(话)是:

砸钉子会产生大量的高能蛋白,这句话是不正确的。

钉子是由金属元素构成的,其中含有大量的铁、碳、氧等元素,而蛋白质是由氨基酸构成的,钉子中不含有任何蛋白质成分。因此,砸钉子不会产生大量的高能蛋白。

此外,钉子的砸击力度不同,产生的高能蛋白的数量和种类也会不同,因此不能一概而论。

完蛋,本来说对了,后面车轱辘话砸场子了。

更难的来了。

我问通义千问:根据勾股定理,人工饲养的东条英机是否可以捕获野生的三角函数?

根据勾股定理,人工饲养的东条英机无法捕获野生的三角函数。

勾股定理是指直角三角形斜边的平方等于另一条直角边的平方,因此只适用于平面图形。

而对干野生的三角函数,其形状和位置可能会因地理位置,环境条件等因素而发生变化。

因此无法使用勾股定理来计算其位置。因此,人工饲养的东条英机无法捕获野生的三角函数。

2fd9bda157c8f985cb3855789f212a71.png

“野生三角函数”“人工饲养的东条英机”这么大的信息量,把通义千问也给整迷糊了。

好了,本次“野生”测试结束,千问万问,问翻车。

76ccf3f3e93bd43d0e3ec71c06bc098e.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

3.搞 AI 框架那帮人(三):狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人(四):AI 框架前传,大数据系统往事

注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 数据中心网络“卷”AI:迟到不可怕,可怕的是别人都没迟到

AI大模型与ChatGPT系列:

17. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

18. ChatGPT:绝不欺负文科生

19. ChatGPT触类旁通的学习能力如何而来? 

20. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进

21. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将

22. ChatGPT大模型用于刑侦破案只能是虚构故事吗?

23. “重塑商汤研发体系”“动员整个公司”,我和商汤首席科学家王晓刚聊AI大模型

DPU芯片系列:

1. 造DPU芯片,如梦幻泡影?丨虚构短篇小说

2. 永远不要投资DPU?

3. DPU加持下的阿里云如何做加密计算?

4. 哎呦CPU,您可别累着,兄弟CIPU在云上帮把手

长文系列:

1. 我怀疑京东神秘部门Y,悟出智能供应链真相了

2. 超级计算机与人工智能:大国超算,无人领航

366d23040d07bc5fd8d0e6b7cc0af41e.jpeg

a2b53938ac6d2c2353474761c1d3c632.png

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.kler.cn/a/9481.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

sipp3.6带媒体测试方案

概述 SIP压测工具sipp,免费,开源,功能足够强大,配置灵活,优点多。 本文档介绍sipp工具如何带媒体测试,并介绍如何制作可用的媒体文件(G729和PCMA)。 环境 centos7.9 freeswitch…

stata数据处理

stata数据处理–潘登同学的stata笔记 文章目录stata数据处理--潘登同学的stata笔记数据导入、导出使表格第一行成为变量标注(label)数据合并横向与纵向合并一对多与多对一横向合并缺失值处理查看缺失值替换缺失值缺失值填充离群值处理取对数的方法截尾处理、缩尾处理分组统计列…

认证认可机构收费项目和标准

认证认可机构收费项目和标准 广大企业在认证之前,都会关心一个问题,那就是认证价格的问题,往往我们得到的基本都是一个总价,那么这个价格是由哪几部分组成的呢?每一部分都包含什么样的费用呢?下面由证果果小…

深拷贝和浅拷贝

一.Java的Cloneable和clone()方法 1.Object类中的clone() 以下是Java中Object类中clone()方法,我们可以看到clone()方法是没有方法体的,因为clone是一个native类型的代码,具体的代码实现在JVM的c代码中实现,Java只是调用. 2.实现Cloneable接口的类 以下是Cloneable接口的内容…

Python 中 SyntaxError: ‘yield‘ outside function 错误

当我们在函数外部使用 yield 关键字时,会出现 Python “SyntaxError: ‘yield’ outside function”。 要解决该错误,如果我们需要对每个元素执行一些运算符,请使用列表理解,或者缩进函数内部使用 yield 的代码。 下面是一个产生…

ROS入门教程(一)Python实现Hello world

代码在git link Python实现Hello world 在ROS中编写Python程序与编写C程序大同小异。 step1.创建工作空间 CtrlAltT打开终端分别输入:【在主目录下创建工作空间】 mkdir -p helloworld_ws/src cd helloworld_ws catkin_make其中helloworld_ws为我们命名的工作空…

前端架构师-week3-大厂怎么做项目

先谈谈大厂做项目的流程 了解大厂的标准项目流程 了解架构设计在项目过程中的定位 按照大厂流程开发 imooc-cli 项目

基于多种算法实现鸢尾花聚类

基于多种聚类算法实现鸢尾花聚类 描述 聚类(Clustering)属于无监督学习的一种,聚类算法是根据数据的内在特征,将数据进行分组(即“内聚成类”),本任务我们通过实现鸢尾花聚类案例掌握Scikit-l…

Spark SQL实战(04)-API编程之DataFrame

1 SparkSession Spark Core: SparkContext Spark SQL: 难道就没有SparkContext? 2.x之后统一的 package com.javaedge.bigdata.chapter04import org.apache.spark.sql.{DataFrame, SparkSession}object SparkSessionApp {def main(args: Array[String]): Unit …

最新阿里、腾讯、华为、字节等大厂的薪资和职级对比,看看你差了多少...

互联网大厂新入职员工各职级薪资对应表(技术线)~ 最新阿里、腾讯、华为、字节跳动等大厂的薪资和职级对比 上面的表格不排除有很极端的收入情况,但至少能囊括一部分同职级的收入。这个表是“技术线”新入职员工的职级和薪资情况,非技术线(如产品、运营、…

打开 plist 文件

​ 对于使用苹果的进阶或资深玩家来说,有时候要编辑plist文件,比如要弄两个qq,要修改info.plist下的sku,而要是没有工具,就不能随意查看和编辑plist文件了。再有,可能要通过修改plist来破解某些游戏&#x…

因薪资低拒绝offer,HR恼羞成怒,网友瞬间炸翻了..

一名程序员员在求职过程中,碰到一位薪资谈不拢就恼羞成怒的HR,并说出“估计你一辈子就是个程序员”这样的话。 从这位测试员和HR的聊天内容中,我们可以看到二者的谈薪过程。 首先,HR开出15k的薪资,测试员表示太低了&a…

Numpy基础用法

Numpy 【Numerical Python】是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快…

Android中的接口回调机制

文章目录1.回调的含义和用途2.java实现接口回调3.Android中接口回调的体现4.接口回调在异步任务中的体现1.回调的含义和用途 一般来说,模块之间都存在一定的调用关系,从调用方式上看,可以分为三类同步调用、异步调用和回调。同步调用是一种阻…

两亲性聚合物Stearic acid PEG acid,STA-PEG-acid,硬脂酸聚乙二醇羧酸

【中文名称】硬脂酸聚乙二醇羧酸,硬脂酸聚乙二醇羧基,羧基PEG硬脂酸 【英文名称】 Stearic acid PEG acid,Stearic acid PEG COOH,STA-PEG-acid,STA-PEG-COOH 【结 构 式】 【分子量】1000,2000&#xff0c…

LAMP架构的配置

一.LAMP概述 1、LAMP的概念 LAMP架构是目前成熟的企业网站应用模式之一,指的是协同工作的一整套系统和相关软件,能够提供动态web站点服务及其应用开发环境 LAMP是一个缩写词,具体包括Linux操作系统、Apache网站服务器、MySQL数据库服务器、…

java 合作社交易系统Myeclipse开发mysql数据库mvc结构serlvet编程计算机网页项目

一、源码特点 java 合作社交易系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,开发技术servletdaobean模式开发系统具有完整的源代码和数据库,系统主要采 用B/S模式开发。开发环境为TOMCAT7.0,Myeclipse8.5开发…

多维时序 | MATLAB实现GRU门控循环单元多变量时间序列预测(多指标评价)

多维时序 | MATLAB实现GRU门控循环单元多变量时间序列预测(多指标评价) 目录 多维时序 | MATLAB实现GRU门控循环单元多变量时间序列预测(多指标评价)效果一览基本介绍程序设计参考资料效果一览 基本介绍 GRU神经网络是LSTM神经网络的一种变体,LSTM 神经网 络是在RNN的基础上发…

【Java面试八股文宝典之RabbitMQ篇】备战2023 查缺补漏 你越早准备 越早成功!!!——Day17

大家好,我是陶然同学,软件工程大三即将实习。认识我的朋友们知道,我是科班出身,学的还行,但是对面试掌握不够,所以我将用这100多天更新Java面试题🙃🙃。 不敢苟同,相信大…

QT桌面的构建

文章目录 前言一、按键类的创建二、按键样式设计三、详细代码讲解总结前言 本篇文章开始我将带大家构建一个属于自己的QT桌面,这个桌面将适用于ARM和Linux等。 一、按键类的创建 首先我们需要创建一个按键类,这个按键类需要包含一个按键和一个lable用来显示按键的名字。 效…
最新文章