近年来数据中心以太网交换发展强劲,公共、私有和混合云的客户支出庞大。根据Crehan Research公司的统计,2016年品牌数据中心以太网交换机销售超过100亿美元,创下了自2013年以来最强劲的市场增长速度。其中40GbE和100GbE交换机是主要的市场动力,总收入超过十亿美元。另外,从2016年下半年起40GbE数据中心开支下滑,全年的100GbE支出持续增长。
通过采访数家上游IC厂商,《EDN电子技术设计》得到的反馈和终端市场的统计是吻合的。目前,我们正处于的升级潮是:企业级向10GbE服务器升级、数据中心向25GbE升级。Uplinks/Spine连接已经从40GbE发展到100GbE,Cavium公司交换平台部营销总监Sachin Gandhi透露。Mellanox则表示公司已经在两年前开始供应100GbE交换机、网卡、光学收发器和线缆。同样,盛科市场总监王峰也认为,在大型的数据中心,作为架顶交换机(ToR)的上联端口,100GbE已经逐步取代原有的40GbE成为主流。
“我们预计未来的2~3年,10GbE/25GbE下行搭配100GbE上联将成为大型数据中心ToR/Leaf的主流形态。从当前的技术发展来看,400GbE也将逐步成为新的高速互联接口形态。”王峰表示。Marvell同样认为现在正值100GbE最为蓬勃高涨的时期,正在取代传统的40GbE基础设施(特别是现代超大规模数据中心)。
然而,我们仍处于市场向100GbE转型的初级阶段。私有云,企业和运营商网络还没有规模采用,标准服务器上行链路对100GbE连接也没有直接的需求。“尽管博通的100GE交换机在两年前全面投入生产,2017年才是100GbE出货量超过100万个端口的第一年。”博通核心交换机部门高级营销总监 Rochan Sankar指出。
“最初的400GbE部署比较早就开始了,以多个50GbE SERDES聚合在一起的形式出现。预期2018年第一季度将从半导体产业开始,第一批应用该技术的整机将于明年晚些时候到来(可能在第四季度)。”Marvell公司网络事业部副总裁兼总经理Michael Zimmerman表示,因为800G依赖于112G SERDES,其出现会更晚一些,可能还需要3年时间才会到来。不过,大部分受访者仍认为,400GbE光模块(QSFP-DD,OSFP)的可用性和经济性,是决定其部署速度的重要影响因素。
以太网交换机最重要的性能是什么?
除了吞吐量,优秀的以太网交换机仍有很多其他重要的性能,受访的不同厂商也有不同的性能平衡。
“灵活性,每位成本。”
Gandhi认为数据中心的运营者们会继续寻找灵活的解决方案,满足他们的吞吐量需求,并降低每位传输成本。他表示XPliant交换器系列在不影响流量、功率或价格的情况下提供了灵活性。
“灵活性与实时可视化。”
许多商用以太网交换机ASIC都针对吞吐量或灵活性进行了优化,从中取得性能的平衡。例如,业界会需要基于硬件的遥测功能,用来提供网络和缓冲器状态的实时可视性。许多解决方案缺乏这种高级功能,或在降低带宽能力时才能提供该功能。Mellanox公司营销副总裁Kevin Deierling认为公司以太网交换解决方案的主要区别是提供灵活性和可视化的独特能力,同时不会影响性能。
“电力预算与整体成本。”
除了吞吐量外(当然这仍会是关键),所涉及的电力预算也将成为关键,总体成本也是如此。采用模块化的方法构建交换机可以实现所有这三个指标,并能通过可配置性来匹配特定端口数、速度或扇出要求。Marvell公司网络事业部副总裁兼总经理Michael Zimmerman认为模块化架构意味着系统不会产生不必要的能力过剩,并且可以将适当的I/O组合分配给任何级别的交换机。因此,与交换机设计相关的功耗和成本都较低。此外,客户可以获得应对不同案例所需的I/O和容量可配置性。
“工程级别的权衡。”
除了上述重要性能,交换机芯片的设计会受到很大的约束,需要工程级别的权衡。Sankar以博通三个系列产品为例指出不同客户群所需的属性:Tomahawk应对超大规模数据中心架构,这需要最高的交换带宽和网络性能,并需要每位带宽的最佳功率效率和成本效率;Trident应对更广泛的企业和私有云数据中心,这里的需求是多种多样的,而且对网络设备的寿命也要求更长;对于Jericho来说,重点是提供可扩展的电信级交换和路由解决方案,可在多个方面提供可扩展性,如:交换设备容量,路由/策略规模,功能规模(通过可编程性)和缓冲规模等。
“立体的多维度考量。”
盛科市场总监王峰则认为未来对网络芯片的评价会是多维度的,不仅仅从单芯片的特性考量,还会把芯片融入到全网的需求中去评估,自上而下的来挑战芯片对未来云端创新业务的支撑能力。同时,对于芯片企业,也会考察除了芯片外的软件及方案创新能力。整个评价体系会变得越来越立体,也越来越丰富。
对于未来产品路线,他们各有所重
应对向更高吞吐量的演进,Marvell计划充分利用自己独特的模块化架构。“该架构为我们符合802.1BR标准的端口扩展器Prestera PX系列采用,将I/O与数据包处理元件分开,从而将所使用的半导体工艺技术(以及制造该IC的晶圆厂)从数据包处理器和I/O的设计选择中解开,”Zimmerman补充道,这意味着我们将能够在新的I/O技术推出时对其进行支持,而不需要对整个交换结构进行更改。
将I/O设计和结构设计相分离可以加快开发时间,减少工程量,并且在速度、馈电、I/O扇出等方面为客户提供前所未有的可配置性。“实质上,我们的Prestera PX解决方案提供了一种革命性的方法,使得可以以传统以太网交换机一半的功率和一半的成本来部署机架式(ToR)交换机,同时也简化了数据中心数十万个端口的集中管理。”Zimmerman指出。
盛科网络目前面向数据中心应用的芯片,是2016年进入量产的CTC8096,单芯片提供1.2Tbps的接口带宽,支持4x25GbE的原生100GbE端口。路标上,盛科正在研发面向25G/50G/100G/200G/400G的高带宽芯片。随着XP80投入量产,Cavium能提供10G、25G、100G的端口,可编程的芯片能支持任何市场协议。Deierling表示,“在XPliant以太网交换机组合中,我们能提供从480G到3.2 TB的解决方案。”据悉,擎发通讯于2016年4月已量产第一代28纳米的Aries系列,总出货量超过15,000片;今年4月样产的16纳米Taurus预计于9月进入商业市场。另外,其下一代产品Leo符合100G/400G PAM4,且尺寸上还将小于Taurus。
终端厂商们会放弃in-house ASIC吗?
在终端厂商这边,也有不少厂商如华为、思科都有研制自己的ASIC。多年来他们利用自己的ASIC来满足其高速交换需求的习惯。
Deierling 则认为设备厂商定制ASIC部分原因是“许多商业硅ASIC已经做了性能折中,且缺乏高端解决方案所需的可扩展性。”但随着集成度和复杂度的提高,系统公司的ASIC在上市时间或价格/性能方面与商业芯片竞争变得困难重重,这个时候需要的是增加了可扩展性和灵活性的商业芯片。
“由于博通一直主导着市场,所有来自OEM厂商的产品看起来都是一样的。由此一些公司认为,唯一的区分方法是建立一个定制的ASIC。”Gandhi认为,“我不认为有任何定制的ASIC能比性能最高的商业硅芯片更高。OEM厂商们还没有因为想要获取更高的性能来定制ASIC。
OEM们定制ASIC的目的,一般是为了在下一个性能点的需求上获得一个差异化的性能,Gandhi表示,这个问题利用可编程ASIC就能解决。Zimmerman则认为,由于竞争对手倾向于采取“一刀切”的策略,因此实际上玩家们被迫制造出大型、复杂和不灵活的交换机解决方案,这些解决方案仅“适用于”一种特定配置。当试图应用到市场上越来越多的各种案例时,这种做法变得越来越不合适。摩尔定律根本无法跟上网络的需求,因为要处理的数据量持续呈指数增长。由物联网和大数据等趋势所推动的数字流量,在未来几年会有双位数甚至三位数的增长,构成我们网络基础的半导体技术必须相应改变。
业界将会出现将越来越多的模块化构建块集成到ASIC设计中的需求,从而使开发过程变得更快更便宜。类似的趋势已经在微处理器领域出现。Zimmerman指出,例如英特尔收购Altera,就能把可编程逻辑添加到它们的处理器中。几乎同样,模块化方法也能够为与领先的数据通信硬件公司合作带来新机会,并为它们提供嵌入到其标准ASIC中的构建块,从而更好的满足包括速度、性价比、上市时间缩短和更好地利用可用资源等需求。尽管商业交换机芯片行业是在2000年从低端企业级/SMB开始进入市场,但此后越来越多地渗透到以前由定制ASIC主导的网络基础设施层面,如下图所示。
“我们预计未来这种趋势不仅仅是数据中心网络,还包括企业和运营商/电信网络。” Sankar指出。