2014年7月30日,腾讯游戏携手IT社区CSDN,在上海浦东喜来登由由酒店举行了第二届游戏运营技术论坛。论坛以“云时代的游戏运营”为主题,请来腾讯游戏、盛大游戏、英特尔亚太研发、云络网络的核心高管和技术大牛讨论云时代的游戏运营之道。
在嘉宾演讲环节之后有一个圆桌环节,参与嘉宾是盛大游戏冯祯旺、腾讯云研发总监郑立峰、金山云合伙人宋伟、腾讯运营总监刘栖铜、云络Steve Mushero。几位技术牛人一起探讨公有云与私有云的定位、区别、优劣势。
主持人刘江:在座立峰和宋伟,他们是做公有云,然后刘栖铜和冯祯旺是公司内部系统的,相当于私有云。那么几位怎么思考这个问题,是直接上公有云,还是自己内部干?
宋伟:公有云、私有云这两个我都有经验,我之前是在百度,百度的私有云是我从零开始建设的,在我走的时候,大概两万多台虚拟机,几千台物理机的量。当时我们支撑的几乎百度所有的业务,包括贴吧等等的业务都在上面跑。
加入金山云之后,真正开始做公有云这块。公有云、私有云原则上来说本身区别不是很大。做私有云的时候一样也要让产品线去先把它的服务从物理机上迁到虚拟机。我们在外部也是谈客户,必须要告诉客户你迁到这个云上面的收益是什么。所以本质上不在于说我们提供的服务区别是什么,而是说能给客户带来多大的差异。
短暂来说还是弹性,如果说我有私有云,就要购置大量的机器来满足我偶尔的一个峰值的需求,这里面机器的利用率相对是很低的,90%的时间机器闲置在那个地方。公有云的好处是这些事我不用管,我用多少付费多少,在我需要的时候一定要满足我的设备需求。在成本的考虑当中,公有云可能比私有云在这个维度上面有一点点的优势。
但是不是说私有云完全是没有优势的,私有云当然可以根据自己的业务以及你自己的应用场景,以及内部的系统做一些定制化,比如说我公有云的劣势是什么,要跟我公司的监控系统、资产管理系统这个怎么打通,这是公有云非常难做到的,当然现在通过用户自定义网络,通过BBC这样的一些服务是可以满足的。但是不管怎样对于公司内部的,还有私有云做这个事可能更方便,更接地气一些。这是我的看法。
主持人刘江:你有什么具体的建议,到底是规模怎么样,还是游戏规模怎样,更适合我先用公有云,或者选择自己的私有云?
宋伟:因为今天来的都是游戏圈的朋友,当你的游戏的量不是很大的时候,我建议还是用公有云比较好,因为第一个节省你的资金成本,以及运维压力,云解决的问题就是解放生产力,生产力解放是分几个维度的,第一是成本,第二还是时间比成本更重要,因为你自己做私有云的话,要采购机器,要去建机房,可能也不止一个点,要覆盖你的用户的话,沿海、北上广覆盖的范围是否和我游戏的范围是符合的,所以你要花大量的时间在IDC、采购机器以及询价,对于小一些的CP,或者是人不是那么多的,把时间花在这上面很不值得。所以在量非常小的时候用公有云是非常合适的。当你的量或者公司的规模到一定程度的时候,我的运维团队就像腾讯这样足以满足我所有需求的时候,这样搭建私有云比用公有云更好一些。
主持人刘江:其他嘉宾对这个问题有没有补充?
冯祯旺:作为私有云我说一下自己的观点,说到云,可能很多人原来会有一个这种想法,感觉云总是取之不竭的,或者说我要多少资源都有的,但是不管是建一个私有云还是公有云,我们要建这个云本身也有很大的投入,这个投入包括在设备资源,在IDC资源的投入,在人员上的投入,运维、研发人员的投入,这上面首先是要考量这个成本的问题。第二个是需求上面的问题,成本和需求有一个平衡点,当你达到一定规模的前提条件下,如果说自己投入人力,投入这些资源去做本身是合适的,即使我不用这些,也客观要养这一帮人来支撑游戏运营的需求,那相对我要再去建这个私有云,不需要太多投入,不需要全部重新去招,完全组建这样一支团队,这个首先会cove一部分成本。另外从需求方面来说,可能如果一个公司它的游戏类型也很复杂,业务量也很大,放在公有云里面,可能没有一个公有云能够很好的满足它各种要求。其实从我们来说,或者说从我们自己去建私有云来说,其实自己也提供资源,也会考量成本,如果说公有云真的能很好的满足各方面的要求,或者说能够满足性能稳定性、安全性的要求,同时我们又能够成本更低,也可以用公有云,只不过是前提怎么样满足。所以我刚刚说的需求,像现在公有云做得比较多的就是WEB的游戏或者是手游,我放在公有云平台跑得很多,即使量多也完全没有必要去建自己的私有云,如果有很多种类型的需求的话,可能就得要考虑。因为你本身也要自己的人力投入。
主持人刘江:公有云、私有云最大的差别之一还是人的差别,也就是私有一定自己要有一套运维团队,而且根据你的规模,包括它的复杂程度,可能这个团队你是不是要建,这是有些团队自己首先要考虑的问题。不知道Steve Mushero,因为你是做代理的业务,你可能接触了非常多类型的客户,可能也有很多类型游戏的客户,不知道你对这个问题有什么看法、经验,对一般客户来找你,你会怎么建议?
Steve Mushero:我非常同意之前的两位嘉宾的分享,一开始的话是公共云可能是作为起步比较好,但是一旦达到一定规模的时候,其实你会发现私有云会比公共云更便宜,因为它对CPU的耗量,还有怠工的耗量算起来会比公共云更便宜。对于私有云来说,对人的要求是非常高的,一开始可能十台很容易去运维,如果你在达到百台量级,就对人有大量的要求,所以这时候就不像公共云运维起来那么简单了。说到公共云,因为中国公共云还不像在美国那样,你要升降灵活,一分钟就可以达到秒级这样的,中国还是需要一定时间的,所以你在用云的时候,不但要考虑人员的投入,还有关于它的特性,还有你个人的需求,所以现在越来越多的需要去适应游戏的快速发展。如果是初期,规模比较小而且还新的话个我们还是建议公共云上,如果你成长得越来越大,越来越快,现在可能和年底的答案会不一样,因为需求不断地在变化,而且私有云的变化也是非常快的。
主持人刘江:谢谢,Steve Mushero其实已经说得比较完整了,其实现在来讲当然公有云整个趋势是不断在降价,也许有一天,确实公有云降到就像我们现在用电的感觉,现在已经很少有企业想到要自己去建个发电厂,建个电网,基本上很少很少,因为它确实太便宜,而且各方面都好。如果有一天公有云的价格包括服务质量支撑可以达到像电的感觉,也许它的普适性会更强。眼下来讲,随着公司规模稍微大一点,大的公司还会选择自己搭建一个私有云,可能有些还会跑到公有云,有这种混合模式。我们也看到很多国外的公司,最近也开始自建数据中心,也有这种行动。我想说立峰你今天讲的这个介绍,我们刚才讲的所有的公有云、私有云更多的是偏IDC层面的,按照立峰今天讲的信鸽推送服务,包括加固服务,比较偏PAAS的服务,可能公有云、私有云是另外一个层面的事情,不知道立峰如何看待这个问题,作为公有云的提供商的代表。
郑立峰:这个问题我来回答还有一点点的挑战,在腾讯既有公有云,又有私有云,其实在前两年我也做私有云的事情。腾讯未必是个合适的例子,因为腾讯在十几年的发展过程当中,积累了很多系统,这些系统你现在舍弃它是很困难的,比如说我们有网管系统、L5、CC这些都是在公司内部是通用化的,放到外面去现在还没办法用。所以从内部需求来讲,会非常需要一个私有云来提供腾讯内部自有的发展。
当然我也想说私有云和公有云各有优点,公有云首先一个成本的管理是更加明确的,我们现在可以做到每一个项目单独核算财务情况。包括像腾讯这样的公司,比如把某一款游戏放到公有云上,很容易来核算它的使用成本是多少,这对于一个规模很大的公司来说还是很有价值的。硬件的成本实际不断的下降,我们自己内部也做过一个预测,包括存储成本、计算成本,估计未来十年可能会下降几十倍,甚至上百倍。到那时候其实价格的问题我相信总会解决的,到最后大家会发现人会是最贵的。甚至从美国的发展情况来看,的确是这样,人是比较贵的。那云的发展也会经历这样一个过程,公有云的好处,如果是中小企业,其实公有云的效果好处是很明显的。因为公有云它有非常大的带宽,机房带宽,中小企业自己去搭建这个事情是不太可能的。比如说我们的公有云现在接入成本是很高的,但是公有云是通过把规模做大,把它的平均成本降下来,自己去搭建其实成本还是比较高的,包括跟运营商的谈判。在全国的节点建设,主干网的建设,这些在私有云上很难。比如说我们现在公有云香港机房的开通,这些投入方面都是比较大的。如果说自己去建私有云,这个事情我是觉得有点儿省了小钱要费大钱的,不太值得。所以公有云和私有云都有其好处,我刚才在回答这个问题的时候就想到一件事情,这好像说你兜里有钱,你是考虑放自己家里安全呢,还是存银行比较安全。那当然中国的银行一般都不会倒闭,但国外的银行有可能倒闭,中国的银行是财政部保证的,四大国有银行是财政部保证的,其他的银行也有一些措施去保证它,现在公有云有一个事情是比较重要的。就是可不可信,所以这就是工信部在力推的事情,要给一些比较品牌的厂商,来颁可信云,就像你存银行一样,云服务厂商是可信的。所以真到了那个时候,我相信没必要把很多钱放自己家里,是这样子的。
主持人刘江:刘总有没有补充,这个问题对你来说可以转化成你现在又碰到一个腾讯内部的游戏,未来有没有可能什么时候你考虑我就直接放到外部去。
刘栖铜:前面的嘉宾在分析公有云和私有云优劣已经非常全面了,我从另外一个角度来谈一下,现在的国内的公有云有一环觉得比较缺失一点,现在大部分是IAAS平台,但是在PAAS这一块关于整个运营体系的管理,应该说现在的公有云做得相对比较少。他拿到公有云以后,通过公有云拿到了OS,这些系统以后,还得自己负责去搭建和安装其他的部署,监控等等这样一些平台,当然这些里面都是一些开源的解决方案的。但是会有相当的学习成本,可能需要专业的人员去了解、学习,才能把它用好。所以我想未来公有云如果能够把这部分补上的话,我相信它的竞争力会更全、更强。初创公司,甚至中型公司,大型公司都有可能切到公有云上来,如果大型公司上云的话,还有一个问题,因为像腾讯我们面临很多大同架构的业务,很多个性化的需求,需要我们的公有云提供的这些平台系统能够开放很多要自己定制或者二次开发的功能和接口给到我们才能够适用,个人觉得公有云目前PAAS这块还需要再补强一些。
郑立峰:国内现在有一块发展比较滞后的就是云API的建设,要完成一个自动化的部署以及自定义的监控等等事情,跟已经发展了5~10年的企业它内部的一套系统很好的融合的能力,因为API是必不可少的能力,但现在国内在这一块恰恰是比较落后的。包括腾讯云现在连API的建设也是比较滞后,这个能力提升上去了之后,公司原有的很多运维,各种系统都可以很好地跟公有云来进行对接。到那个时候可能大家来接受公有云会更加容易一些,我们也是看到了这一点,在下半年的建设当中,我们在公有云的云API建设方面,计算、存储、网络、监控等等把已有的腾讯云的所有的能力都会通过API的方式开放出来,以达到比较精准的控制。包括个人账户里面的钱的调配等等,都可以进行非常精细化的控制。我相信这个事情发展起来的话,应该对公有云的发展会很有帮助。
主持人刘江:这个问题总体来讲大家已经谈得比较全了,我总结一下应该说对于现在来说,你规模比较小,也没有现成的运维人员或者团队的话,可能公有云是一个比较好的选择。尤其是现在包括金山、腾讯,有不少的公有云的厂商,重点至少是重点之一就是放在游戏这块,他们对游戏团队,尤其是手游,还是做了很多工作的,为了手游的一些相对比较专门的需求,都做了一些事情。所以这是大家首先可以考虑的。当然随着你团队的扩大,包括你的需求,整个的规模扩大,可能还是会有一个时间要考虑自己建。如果从这个角度讲,我们下一个问题可以提对于不同规模的游戏开发商,游戏开发团队,它应该是一个什么历程呢?当然今天其实祯旺已经在讲盛大,盛大已经到了一个比较大的情况才开始做运维。不知道大家对这个是怎样的建议?我现在就是一个游戏团队,是按照不同的类型吗?就是说手游、端游还是页游它的选择会有不同吗,不知道这个问题大家怎么看,在用云这块有什么区别吗?还是说其实没有太大区别。
宋伟:当然游戏分为端游、手游、页游在我们的客户来看,端游想上云还是有一定的难度,难度到底哪里?分为几个层次,第一是网络,网络端游不需要APP,当然我这个说得不一定对。他们对于网络的APP需求是不大的,他们可能需要一些双向的或者说单线的这种机房来通过分区满足这种端游玩家的需求已经足够了,这是网络的维度。从信任的维度来说,端游是非常耗CPU的,现在云的技术其实都是通过虚拟化的方式来提供的,根据我们经验来说,通过虚拟化来做云主机的话,CPU好的占5%,差的可能就在10%~20%,要看你的应用场景。因为本身来说现在端游对CPU耗的量就很大,然后通过虚拟化以后,中间又转了一层。从另外一个变化来说,端游相对还是比较稳定的,它的增长需求不像手游忽增忽降的频率这么快,所以端游市场基本也相对平稳,根据我们客户来看,端游是不太适合上云的。
分析一下手游跟页游,其实我们认为手游和页游是非常于上云计算的,几个维度。手游当然分为很多种了,不管是APP,还是其他的卡牌类的,对于资源的占用不像端游那么大,甚至有一些类型的游戏其实对资源的需求是非常少,当然现在有游戏在我们平台上测,国内收款的一个3D很炫的游戏,那个游戏是一款手游,具体名字就不说了,还没有发。它对CPU的要求就非常高,在我们看来跟端游差不多,而且我们把CPU直接调到了目前英特尔最高端的CPU勉强可以满足。所以现在的手游的趋势可能渐渐向端游的方向去发展。
从目前绝大部分的手游和页游来看,他们上云是非常适合的,不管是从成本上来说,还是从实际的运行的效果来说。并且从我们统计的数据,因为我们之前在成都做过一轮,大概有几百家客户的一个拜访,用云的我们统计一下,可能有60%左右,或多或少在使用云。
主持人刘江:应该是以手游为主是吧?
宋伟:对,所以现在至少手游这个市场对云的接受程度还是比较广的。并且我们看有20%可能在未来的一年内也会有尝试的使用云计算。
主持人刘江:宋伟你其实就讲到,如果不说端游、手游这么分的话,其实就是CPU消耗比较大的,可能更适合比如说直接用云的?
宋伟:I这块是很好解决的,因为IO性能完全靠硬件对出来,但是CPU的瓶颈还是放在那儿。
主持人刘江:其他嘉宾有没有什么分享?或者不同的看法?
冯祯旺:前面我分享的议题是我们在讲游戏云平台有个定义叫全能型的游戏云平台,但同时也看到我们有提供多种不同的资源模型来解决,或者说端游、手游主要的区别在哪里,端游一个是在架构上的要求,另外一个在性能上的要求,因为公有云都是统一的架构、统一的模型,不可能你这个游戏要这样我这样去做,那个游戏那样我那样去做,所以现在大部分的公有云像手游、页游这种WEB类型的,端游比较少。我们这边超过四分之三是端游,所以为了满足它的需求,我们不断的考虑要怎样才能更好的满足,包括端游上的、性能上的不同需求。也就是说至少在一定程度上或者在一段时间里针对公有云来说,或者说从三种游戏类型来说,公有云还是更适合在这种手游和页游,然后端游更适合用物理机或者是自己建的私有云,而且自己建的私有云,我们是用这种定制化的资源配置,我适用好之后,再提供给用户使用。这样就可以满足个性化的游戏需求,而公有云做不到这一点。
主持人刘江:当时你提到了,也在讲了你会根据不同类型,然后先网络,CPU、硬件软件会去调,以后公有云的规模有可能做到这一点吗?是不是很难?
冯祯旺:是这样的,我们也有计划对WEB进行服务,如果要去提供的话,可能我们定位还是私有云的模式,不是说先建一个大平台,然后用户来的话自己去申请,而是我们先跟用户的业务运维一起来评估现在的需求,然后我希再给他把这个资源提供。一方面能确保资源适用性是最好的,第二还能够确保有很高的资源利用率,我们这些资源不会上面的,如果搞一个很大平台在上面,在没有人用之前,这些都会造成设备等等的浪费。
主持人刘江:对,你说的这个现阶段还是会有这个需求,不是完全统一一个平台,然后自服务的模式,现在其实典型的公有云应该是这样,用户实际上是自主。但是你说的这个模式在很多的范围还是有这种需求,类似这样能不能提供这种服务,也是有一定机会的。
冯祯旺:是,因为我们一直是对内部提供资源,如果说换一个角度,现在是一个独立公司,如果说有一款新的业务来,要去买设备,我要去做IDC,但是现在因为我这个设备能够跑多少用户还不知道,即使现在用户正好跑到我现在的设备的瓶颈,最高的负载都跑满了,肯定过一段时间,可能游戏上线一个月以后,就下降了一定的百分比,用户可能因为收费或者是市场化了,很多用户一窝蜂又做了,过一段时间你搞一些活动,他又上来了,这个是很大的考验。我做过几种模型的评估,如果真的自己要去买设备,除了IDC,如果只用我们这个资源去付费的话,一般可能需要3~5个月的成本。
主持人刘江:接下来问一个问题,在座很多都是搞运维、运营的,现在慢慢的随着云时代,原来我们传统的都是运维要做的很多这样的事情,但是接下来实际上是在座的腾讯、金山、盛大相对规模更大的公司,然后我们把这个能力做成平台或者服务的模式向外提供了,因为我们能力更强。比你们小规模的同行,他自己运维人员的职业生涯会发生怎样的变化,他如何应对这个事情?大家对这个问题怎么看?如果跟我们普遍采用的话,很多公司其实运维的角色包括人数这些其实会发生变化,他的技能要求。
刘栖铜:我先来答一下。腾讯游戏我们的运维团队虽然说没有用公有云,但是我们其实也同样面临着类似的问题,私有云在某种程度上也是把原来所有运维人员都要求做的一些工作聚拢起来,而只是放在一个平台上,只有一部分人去做这个工作。在性质上跟公有云对运维的冲击是一样的,这个问题也是早几年我们也已经开始思考。到目前为止我们得出的想法是这样,不管是公有云还是私有云,它最终解放的是把我们整个运维的入门的门槛降低了,以前可能一个运维要成为一个合格甚至优秀的运维员工,可能要经历很多的考验。包括他可能要搬过机器,上过机架搞过服务等等一系列要体验过来,才能成为一个合格的运维。现在有了公有云、私有云的解决方案之后,入门的门槛被降低了,但是门槛降低了,但是不代表你把运维服务做好的能力就降低了。虽然公有云私有云帮助运维人员节省了重复劳动的时间,因为帮助上机架这些、买机器其实都是重复劳动,而且本身并没有太多的技术价值里面了,所以我们把这部分精力节省出来,我们的运维人员可以去做其他事情。不管怎么样再完善的平台,还是会有一些个性化的需求,我们可能需要在上面根据自己的需求做一些定制性的开发,那我们可以转到运维开发的方向,可以重点提升我们的开发能力,这是一类。
另一类在技术深度上面可以钻得更深一些,虽然说公有云可以帮大家解决很多问题,但是现在公有云其实提供的技术支持服务还是会有些分级的。一般中小的企业在公有云上得到的技术支持相对是有限的,毕竟我们的服务提供能力有限。我们的运维人员可以在技术深入上进一步加强,比如可以从系统价格甚至影响游戏开发的价格,从初期就开始影响价格,让它的性能更加均衡,这也是另外一个方向,对于我们运维人员来讲,这个云给我们带来的其实不是说以后咱们运维就没用了,应该是帮助我们的运维人员可以向更高的职业领域去成长,这是我们的看法。
还有一部分运维人员可以加入到公有云或者私有云的行业里面,去建设这些公有云、私有云。
主持人刘江:这个问题其他嘉宾有没有补充?
郑立峰:我也补充一下这个问题,在我们业务开拓的过程当中,我也经常碰到这样的问题,可能有一些公司的运维会抵触公有云的接入。所以我也在思考为什么,可能会担心说是不是我不需要做运维相关的事情,其实不是的。我是觉得运维其实是有几个层面的事情,云解决了最基础层面的运维的工作,比如说CPU是不是负载到100%了,内存是不是占满了,或者磁盘IO是不是很高,像这样的事情基本上每家公司都要做一点,现在云把它做了。但是并不代表做了这个事情之后,运维就没有其他事情可做。我自己本身也负责腾讯微社区的建设,它是一个社区业务,我在给我们团队讲运维这个事情的时候,可以区分两个层面的一个是最基础层面的运维,还有一个是业务层面的运维。业务层面的运维要去关注如果是页面的话,你要去关注这个页面访问的性能怎么样,它单个页面有多少个HTTP链接等等,其实这些方面跟业务相关的运维也可以做得特别精细。我们的手游,我们的页游也可以做掉线率怎么样,还有用户的在线情况是否有大范围的变化,这跟业务相关部比较高的运维的任务是什么。云是把大家从特别基础的一些运维工作当中解放出来了,可以更多的关注业务层面的运维体系的建设,我是这么理解的。
主持人刘江:立峰一个很好的建议就是说,整个云计算的发展本质上是一个社会分工,确实是我们有原来大量的工作是重复性的,而且都是大家各自之外在做的,如果通过这么一个社会分工集中到专业的团队,而且能大规模的更高效率的来完成,确实对整个社会的效率肯定是有好处的。就如同刚才说的电的感觉是一样的,如果大家想像一下,如果我们不管创业还是什么类型的公司,作为老总你管这个基础设施的,你还要考虑电的问题,自己还要考虑发电,或者怎么接电,这就太痛苦了。这个肯定是社会发展阶段的问题,可能往下走有很多方面原来各个公司都要重复做的工作,确实会收,有一个集中化的趋势。但是运维这个事情我们叫游戏运营技术论坛,其实在大运营这个范围里面可以做的事情很多,确实有很多点点滴滴,包括去年讲的大数据,很多数据点里面有很多优化的地方,以前由于基础的工作太多了,没有精力去做这些事情。基本运维以前给人的印象就是救火,除了情况被人举报了,拖着走。如果这个问题能缓解,或者减少了以后,更多的精力可以放到更有价值的事情上去。它的很多思路、技能跟我们原来是类似的,这一点其实是很有意义,不知道其他嘉宾有没有补充?
冯祯旺:我再补充一下,我们做云其实是很苦逼的事情,就是搬机器、布网络、布线,都是很基础的工作。如果说把这个工作再后面都做了,那就不需要这个东西了。云络这边没有自己去做这个云,而是帮助用户更好的去用云,用户可以对运维更专业,而且更有价值,可以做对业务更有价值的事情。我们把底层的最基层的工作给解放了,谢谢。
Steve Mushero:因为运维是云络的工作,希望这个工作能够继续,我们继续有活干。很多人用云,一开始都是花三百块、五百块买个很小的云去试,但很快就发现超负载了,所以就出现更多的问题,叫问题的累积。很多人用云想用,比如说做运维开发,自动化的一些事情,想用好云的各种特性,我们最近帮一个客户在亚马逊上做这样的工作,我本人去研究这些项目服务有五千页的说明书,其他一些项目要达到五万页的说明书,所以没有人有那么多的时间去快速的学习,这样给公有云的单位创造了很多工作机会去提升,更好的服务客户。
主持人刘江:Steve Mushero讲的也很重要,我之前跟一些做运维的交流,我说上云,包括立峰刚才提到的,你们会不会很抵触?是不是上了云以后很多人就没活了,其实比较资深的运维人员,早就意识到这个问题。在云上运维还是很多复杂的,以前可能复杂的都是去掉了,但是在云上还是有非常多的技术难度的各方面的东西。只要摸了一下下,包括像腾讯、阿里云会发现里面坑还是很多的。确实它还是有相当的复杂度把这个云利用好。刚才Steve Mushero说了一个文档,如果去看亚马逊的IDC文档,工作量是很大的,直观地说明了这个问题。这一块我们的讨论可以告一段落了,当然随着整个形势的发展,可能问题包括作为云时代云运维到底要做哪些工作,包括职业生涯往下怎么发展,大家还是要不断的再关注,不断地在变化。我们也会不断的再回过头来看这个问题。整个从云来讲,就像电最开始有,然后有了对初始的电网,一直到现在基本上没有人去思考,我就是一按开关,电就有了,插座一插就有了,你不会考虑这个电到底是哪个电厂发出来的,也不会想它是走哪个线路,哪个电,除了停电的时候你会知道,那条线断了我家就没电了,除此之外你不会太考虑了,甚至成本。之前我记得是福布斯还是哪个媒体有一个很好玩的事情,就说像iPad你用一年可能才花几美元电费,如果公有云能够有朝一日达到这个程度,大家可以想像一下,iPad我基本上随身都带着,随时都用,实际上它一年也就花几度电,这个还是很惊人的,我一年很多工作都可以在上面做,还可以玩游戏,但是它就只花了这点钱,如果到了这个程度,确实还是一个很大的革命性。但是电的发展也经过了上百年的历程,这个过程中至少我们这代人还有很多工作要做,无论是作为云的建设者,还是云的用户,我相信还是有非常多的工作要做的。
观众提问:今天有英特尔的前辈分享了一些事情,下午讨论的是更多跟软件相关的事情,我来自腾讯的运营部,刚才我也听到分享云上面的一些内容,现在我们用KVM或者是别的软件的时候,做了很多类似于虚拟机的这种,把一个大的机器分割成一个很小很小单元的服务,在硬件层面有没有可能说是我生产出来的硬件本身它就是成本很低的,一个一个的单元,这样就省去了我们从软件的层面再去分割。
再问一个问题,刚才提到了游戏跟用户的相关性,白天的时候我们的各种硬件指标都是非常高的,但是一到夜里可能这些硬件指标就降到只有百分之的点了,非常低。我没有听到有人说是我把晚上一些后台的计算再用这些设备让它跑起来,这样尽最大可能的使用的资源,达到资源的最大利用率。这一块我也想听一下有什么样的想法。
郑立峰:第一个问题硬件我不太懂,然后预测云未来的发展趋势,我是觉得软件和硬件都会有长足的发展,至于说最后是什么样的技术成型,这个还有很多外在的因素在影响。比如说我当年其实认为PHP这种研究不应该发展起来,我觉得C++无比强大,但是PHP发展得非常好。所以我认为一个技术最后长成什么样,最后还有很多外在公司的推动,社区的推动,各方面的一些力量在里面。未来会怎么样,现在还真不是很好说。
第二个问题我想到的是,云计算如果说晚上的没有用退掉,白天用的时候再事情,晚间也有很多事情可以做,比如数据备份,大数据挖掘,数据的运算,我们的大数据运算都是在凌晨一两点钟把它算出来。我们现在计费日间和晚间是没有区别的。
第二个问题是这样,刚才郑总说的,我们可以调度一些离线计算这样的事情,计算我们是要分级的,第一有离线和在线,还有实时,像流失这样的。一般的做法我们是怎样利用闲时的计算能力呢?我们把离线非实时的计算如果调度做得足够好,把它调度到你现在空闲利用率非常低的这台物理机上,当你的物理机游戏压力起来的时候,因为离线非实时的特性就造成了它是可以杀掉,没有关系。另外一台机器上再跑一遍就可以了,其实这套系统不是我凭空想的,它已经存在的。它的中文名字叫代理计算,我会把公司计算全部是分级别的,其实类似于像Docker,可以在物理机上划出很多槽位,可以调度甚至计算上去,这个槽位一定会有资源的限制以及运算优先机和级别,端口都是有优先级的,我把端口分成优先级,一级服务一定要用一类端口,二类服务用二类端口,会做更精细化的调度在里面。这是第二个问题。
第一个问题,我们也讨论过用硬件来取代虚拟化的技术,我们也做过RAM相关的存储,现在在金山云的环境里面,很多的硬件也是非标准化的,也是我们自己去定制的,我们有一些硬件比如像存储的,可能买的不是品牌的,是戴尔的,都是我们自己去设计,设计完了会找厂家给我们生产,所以我们的服务价格是非常低的,可能比电费还要便宜,估计只有电费的四分之一。我们通过硬件的这种革新,能把存储的价格做得非常低,大家觉得存储等于是不要钱。
还是回到虚拟化的这条路,我觉得这么看,虚拟化的本质是什么?虚拟化的本质是一种隔离的技术,把一个大的资源隔离成一小块,一小块,这种隔离用软件也好,用硬件也好,实现的目的都是一样的,但是软件和硬件的本质区别在哪儿?就在于软件的灵活性。你用硬件可以完成隔离,但是你用了这个硬件以后,不能像软件一样可以随时调整,随时的弹性去做一些新的方面的扩容,容量方面的扩容,硬件方面是很难做到的。必须通过软硬结合来实现,这样才能达到更好的效果。未来的趋势不是软件取代硬件,还是硬件取代软件,一定是软硬结合,才能满足我们游戏圈朋友的需求。这是我的看法。
主持人刘江:以前你看在计算机科学里面专门有一帮人搞的学科教育,软硬协同设计,实际上以前是相对来说好像比较冷的那种,其实现在整个数据中心,谷歌不是若干年前出了一篇文章叫数据中心就是计算机嘛,以后我们说计算机实际是一个数据中心,所以这个数据中心应该是怎样设计的,多大规模的,以后的数据中心的样子跟现在完全不一样,这是完全有可能的。包括里面的软件、硬件都有大规模的革新的地方,这对我们搞技术的人是比较令人兴奋的,真是人类历史上信息技术发展的最关键的若干年、几十年,是我们这代人碰上的,是挺好玩的事情。尤其是做运维的,其实你已经处于在硬件下面,比较接近于硬件,其实硬件很多新的发展,还是特别值得关注的。而且软硬件怎么分工,协同的思考是很好的方向,有很多新的点出来。
包括第二个问题也是很好,因为我学电力的,电力其实在这个方面有很多的资料,刚刚我提到电力有波峰价和波谷价的,晚上电费便宜,所以很多工厂会有晚上排班,让工人24小时晚班也在用电,因为电就是它很大的成本,每一度电低多少钱,省很多钱出来。而且电力部门有很多的人在晚上用电,对它来说也是非常好的,因为整个电网的平衡又是实时的,它发的电必须用掉,要存的话就特别费劲,像北京十三陵水电站得在那儿修一个水库,把这个电能给存起来,得花多少亿才能干这个事儿。如果能够有更多的措施把波峰波谷抹并,对于全网的经济效益和安全稳定性都有巨大的作用。所以专门有一些人搞电力经济学,还有电力市场,以后云都有可能出现。比如说你金山有一批空闲资源,就是这个时间现在没人用,我就可以比较便宜地来,进入某个市场,中间有很多中介,未来是有可能的。
宋伟:我们是有这个案例在的,就是说我们有S3的服务,S3很多都是上行的流量,所以我们下行基本上就是白费给别人用,这就类似于你说的一个闲时和忙时的区别。
主持人刘江:以后说不定若干个云平台之间互相之间可以有一个交易市场,你这儿忙,比如说你同意,说不定我还可以租用,我还可以租用金山的,挺好的,这两个问题确实提得很好。看看其他嘉宾还有没有补充?
郑立峰:我刚才想到客户买了云服务之后,用户忙的部分也可以在市场上出售掉他的部分资源,相信未来这个应该会发展起来。
观众提问:对公有云会有一个顾虑,那就是我自己使用了某一家公司的云服务,那么我把代码、数据都是迁移到他们的服务器上,假如我跟这个公司产生一定的竞争关系,那么这个公司是不是能够随时得到我上传的那些代码、数据之类的,能够确保它的安全性吗?这就是我的问题。
宋伟:这个问题被问到过很多次了。保证数据安全性是分为几个维度的:第一是从流程方面,相当于跟公司的运维一样,我从流程方面来保证这个数据是安全的,首先我们的权限是分级的,比如说有数字的权限,平台的权限,通过堡垒机的方式你才可以登到相应的速度机上。堡垒机可以记录下来每个人何时何地访问哪些机器,这些日志都是很全面的。而且我们是通过密码,也通过key,通过一些比如每几十秒变一下的,就是静态key、动态key去登录这个管理的权限系统,这个维度是在流程上的管理。还有一个维度是从技术方面的,技术方面我们是可以做一些加密的东西。国内对安全的重视程度是不高,国内的云用户对用key的方式接受程度不高,从安全性的维度是三个方面,第一就是云公司自己内部的流程和技术方面来保证数据的安全。第二就是在云的用户维度上,自身也要提高安全措施,比如说我的防火墙的配置策略,有些端口没必要打开来就把它关闭,还有一些我的密钥,可能不用password,用key的方式。大部分人选用前者,不用后者,但是key相对来说是安全的。
郑立峰:我听到这个问题的时候,首先想到的不是云安不安全。这是个心理问题,而是你信不信任把你的代码和数据放在云上。全世界头几家银行开出来的时候,估计大家也很担心把钱存在那儿,会担心银行会不会把我的钱拿走。现在有一些例子,比如说P2P的平台最近老发生转款逃跑的情况,一个新事物在发展的过程当中总是有一个认可过程,云其实也是一样,如果说我们想长久地做这个事情的话,我们肯定不能干这样的事情。因为云是一个长期的事业,对产业来说也是一个长期的事业,所以应该把云看成是银行一样,它是可以信赖的。但是现在OK,大家会担心说,你无论拖在哪家云服务厂商都会有这个担心,人家会不会把你的数据拿走了,而且现在提供云服务的厂商,基本上还在开展其他的业务。
我另外想到的一个例子是像平安集团这样的公司,它旗下又有很多,又有银行,又有保险,那么泰康人寿之类的公司会不会担心说把钱存在平安银行,可能不用太担心这个问题。其实道理是一样的,腾讯做游戏,那么在座各位也是做游戏,大家会担心说腾讯的游戏部门会不会来看你的数据?我可以告诉你,不会,但你不信。你不信,那我跟你签张合约,你信不信,你还是不信,那我只能说,没招,这是一个信任的问题。现在工信部给我发一张牌照,说腾讯云是可信的,你也许还不信。五年发展过去了,十年发展过去了,我相信时间会证明这个问题。
主持人刘江:对,我想这个问题确实是,这是一个底线问题。你做云服务或者是其他服务,反正做任何事情其实是需要底线的,确实中国是一个经常底线被超越的国家。但是我想整个形势还是往好的方向去发展。相信我们这一代人,我希望到了我们子女长大成人的时候,也许就这十几、二十几年,中国这种问题可能会越来越少,连底线都会得到怀疑,都会出问题。包括最近出的洋快餐集体出现问题,它的供应链就出问题,这个问题确实是有。但是希望大家一起来,包括CSDN我们作为媒体社区,大家一起来,如果你发现了有类似的问题,绝对不要忍气吞声,一定要把它说出来,一旦有哪家确实做得超越了底线,我们要把它永远地挂在耻辱柱上,让他付出难以承受的代价。如果这次福喜的事情把它罚得倾家荡产,他基本上就没法再干这个生意的话,就像之前三鹿奶粉的事情,对他的同行还是有极大的震慑作用,我们要多做这方面的事情,大家共同来努力,把基本的底线、信任,一定要把它纠过来。不然大家互相要做点事情,心里老是对基本的事情不信任的话,那中国发展起来就太慢了,太有问题了。还是需要大家共同来解决,除了问题要大家一起来,社会的力量,每个人的力量进行打击。我相信在座坐在这儿的这些公司,应该都是靠谱的公司,都是有长远的至少都是业界的领袖公司,很低级的突破底线,至少在公司层面应该是不存在的,没有这种动机。公司的流程是不是能很好地防止,比如说员工层面,即使违反公司的流程规矩来搞,做一些事情,这是公司层面确实要考虑的问题。
最后总结一句,云计算本质上是一个基于信任的产物,这就是社会分工,而且确实它涉及到,可能对我来说业务是关键的,就是机密,就是至关重要的数据。但是如果没有这个信任作为一个底部,云计算是永远发展不起来的。总结起来,这需要整个产业链包括整个业界都要共同努力。