- 注册时间
- 2024-7-16
- 最后登录
- 2024-11-19
- 阅读权限
- 70
- 积分
- 1878
- 精华
- 0
- 帖子
- 94
|
(1)开题
方向和路线,这两个词对于中国人来说是傻傻分不清。
方向对,路线不对,也是枉然。
(2)云计算
我记得2008年的时候,云计算这个词刚刚热起来。谷歌在搞GAE(大家还能想起不),AWS在搞虚拟机。
我有两个另外的经历:
1999年使用过网易的虚拟Web空间服务、2000年使用过中国万网的虚拟主机服务
2004年使用过VMWare的虚拟机产品
很多人知道虚拟机都主要来自VMWare,其实虚拟机的技术与思想,最初就是发源于IBM。因为IBM当年发明出S/360大型主机,性能非常高但价格也非常昂贵,怎么能做到一台主机供多个人并行用而不是排着队串行用?IBM就发明了虚拟机技术,每个用户占用一个限额的计算与存储资源,S/360大型主机可以最多支持16个用户并行用。这个思路一直影响到IBM的今天。
2006年AWS发布云计算商用服务,用的就是虚拟机技术,给用户出租计算资源和存储资源。
后来,谷歌在GAE技术路线走错的情况下痛定思痛,在2015年把技术开源出来,设立CNCF基金会,主打容器技术和K8S,起了一个新名词叫云原生。
从本质来讲:AWS是把一台高性能服务器切割成N份,走的是IBM最早大型主机的思路。谷歌走的是分布式计算的技术路线,把N台廉价x86 PC服务器用分布式调度管理平台(如K8S)组织起来。这就是技术路线之争。
真是十年河东十年河西。一开始,谷歌的GAE云计算业务赶不上AWS的云计算业务,现在,云原生技术思想在业界流行(其实这个技术路线对于大多数企业都不适用,但就是因为云原生这个词流行了)。
而IBM呢,还是坚信自己50年前的技术路线是对的。所以在云计算时代卖大型主机,在大型主机里内置虚拟机技术。
很多人奇怪,在容器和K8S大行天下的时候,为啥IBM并购红帽?
就是因为红帽起家于Linux操作系统。在云计算时期上半场,大家纷纷流行用虚拟机技术。而Citrix选择了XEN开源虚拟机技术,那红帽就选择了KVM开源虚拟机技术。而Citrix和制造中端服务器的Dell走的比较近,而且Dell还并购有VMWare,那么IBM要在大型主机里内置虚拟机技术,遍看业界能选择的只有红帽的技术+营收最合适。
可惜,现在流行的技术路线是:云原生技术。
而IBM选择的技术路线是:虚拟机技术。
当然,这也无可厚非,IBM一直围绕的就是大型主机。
(3)大数据
在关系型数据库出现之前,业界有很多各种类型的数据库,如层次技术数据库、文档型数据库等等。
1970年,IBM的研究员E.F.Codd博士发表了关于关系技术数据库论文。
不过,最早把关系技术做成商用产品的是Oracle,而不是IBM。从科研到研发,这是有巨大鸿沟的。
关系数据库一度称霸80年代、90年代、2000年代。
但是互联网,有另外的需求:
即时通信数据怎么存、怎么检索、怎么计算处理
日志数据怎么存、怎么检索、怎么计算处理
海量用户数据怎么存、怎么检索、怎么计算处理
社交网络关系数据怎么存、怎么检索、怎么计算处理
网页数据怎么存、怎么检索、怎么计算处理
图片数据怎么存、怎么检索、怎么计算处理
音乐视频流数据怎么存、怎么检索、怎么计算处理
所以,在大数据这个词还不流行的时候,还有一个词很流行,叫NOSQL。
我记得在2006年的时候特别流行NOSQL,什么KV数据库、文档数据库、图数据库...。
后来,2009年雅虎为了做海量检索引擎,倒逼做了海量数据存储平台,这就是Hadoop。不过Hadoop的思路都来自2004-2006年互联网巨头谷歌开源的三篇论文,于是才有了后来的HDFS分布式存储、MR分布式计算调度、Hbase这种OLAP 列技术数据库三大技术。
但是MR这种非实时的分布式批处理计算调度技术不满足互联网的快速要求,于是在2014年业界又出现了Spark和Flink这两类实时流处理技术。这两项技术我在当年的ADO/JDO、PB DataWindows、Python Pandas Dataframe这些老技术身上看到了太多的影子。
我现在也在做大量的数据处理工作,我反而也是越来越喜欢使用Excel文档数据格式、Python Pandas Dataframe、ES搜索引擎这些技术。
是的,存量市场仍然庞大。但是新的增量市场在我说的以上。
不过我也理解IBM的选择,因为IBM面对的是老牌实业企业,哪里有什么即时通信数据、日志数据、海量用户数据、社交网络关系数据、网页数据、音乐视频流数据。
(4)人工智能
人工智能这个词是被在1956年由麦卡锡与明斯基举办的达特茅斯暑期研讨会后被引爆业界的。那次会议,参加者还有香农,不过麦卡锡和明斯基当时人微言轻,请香农去其实是为了拉大旗镇场子,香农待了两天就走了。不过参加者还有IBM的两位研究员。也就是说,IBM研究人工智能,那也是相当相当早啊。
计算机这个东西,有三位先驱:图灵、香农、冯诺依曼。
图灵和香农在二战期间短暂会面交流合作过,都是为了通信信号加解密、密码加密解密。他们过去都是依靠人算,辅助使用计算尺等工具。他们与敌人互相攻防争分夺秒,希望有更快性能的、能更复杂计算的工具。这就是图灵和香农对计算机发明的初衷。
他们也交流过计算机的未来,除了能做复杂的计算处理以外,最好还能让计算机做数学题证明、机器翻译,甚至是语音对话-文本对话、图像识别。
大家想想:数学题证明、机器翻译,是不是和密码加密解密很像。
大家想想:这是不是和比特币数字加密货币挖币解数学方程组思想很像。
大家想想:这是不是和Transformer编码器解码器思想很像。
人工智能技术,IBM还是有高光时期的。那就是1997年的深蓝,赢了国际象棋大师卡斯帕罗夫。
但是,人工智能有三要素,过去人工智能一直卡在这个三要素的不可能三角里面才发展缓慢。
人工智能三要素是:数据、算法模型、算力。
算力,Intel最擅长数值型计算。虽然在数值型计算方面也有技术路线之争,有复杂指令CISC架构、精简指令RISC架构,有低价格的多任务分时轮换假并行架构、有多核分布式调度真假并行架构、也有多路真正并行架构。
但是,现在大模型适用的算力是图形-并行计算。
没办法,谁让这次第三次人工智能热潮,发源于2009年的李飞飞那1400万图片识别库,发源于2012年辛顿用大模型技术刷这个榜而引爆的。
很多人把图形-数值计算混淆、复杂指令和精简指令架构混淆、串行-并行处理架构混淆,三者六项豆子麻子混在一起谈就谈不清了。
为啥这第三次人工智能热潮是英伟达这个90年代就创业做显卡的公司一飞冲天了呢?就是因为这次热潮的技术路线选择了图形计算。
而IBM擅长的是数值计算。即使是1997年的深蓝,也走的是数值计算的技术路线。
再说说算法。在Transformer这个容器模型出现之前,大家都非常钻研精妙的各种专有算法模型,这是处理自然语言的算法、这是处理语音的算法、这是处理图片识别的算法...。但是2017年Transformer这个容器模型出现了,过去搞各个精妙的专有小模型的全都完蛋了。再精妙的小模型,也比不上傻大粗的可以海量随便堆叠的可以暴力美学的容器大模型。Transformer本身没什么太神奇的地方,但是就如同集装箱一样就如同标准砖块一样,可以让你凭借这块标准砖块垒摩天大楼。过去专有小模型没法傻大粗地无限堆叠做大,人们不相信暴力美学也能产生看起来的智能。所以IBM一直走的技术路线就是:专有精致小模型。
最后说说数据。IBM有数据吗?没有。IBM又不是互联网公司。谷歌有网页数据、视频数据,Meta有社交数据。IBM只卖产品,自己并不生产数据也不运营数据。
(5)最后
很多人佩服IBM不管咋样,都活了超过一百年了。能超过一百年的巨型企业,怎么说也有让人佩服的地方。
我个人把IBM这100多年这样分:
老沃森为代表-打字机时代:1911-1961。老沃森一个人就顶了IBM百年的前50年。虽然老沃森1956年就去世了,但他代表的IBM时代却并未随他去世而改变。
小沃森为代表-计算机时代:1961-1991。这又是30年过去了。虽然小沃森在1981年就退休了,但是他代表的IBM时代却并未随他去世而改变。
郭士纳为代表-IT服务时代:1991-现在。这又是30多年过去了。虽然郭士纳在2001年就退休了,但是他代表的IBM时代却并未随他去世而改变。IBM虽然从2010年以后一直试图再回归技术产品公司,但是,嘿嘿嘿,不遂人愿啊。
这样来看,好像百年也挺容易的。看看IBM从郭士纳、彭明盛、罗睿兰,这不30年也就过来了? |
|