基于结构上的相似性,大家把Zii与Cell、Larrabee拿来相提并论是情理中事,这三者在设计思想方面的确存在相当多的共同点:主处理单元只负责任务指派,实际计算工作都是通过数量较多的PE协处理单元完成,PE协处理器都采用流计算优化的SIMD架构。但这三者仍然有自己鲜明的特点:Zii具有独特的无限扩展性、任务自适应性和低功耗特征,它主要针对嵌入式应用,智能手机、手持设备、机顶盒等是它重要的应用;Intel Larrabee专注于图形渲染和高并行运算,Intel同时推行自己的x86扩展指令集;Cell目前主要应用在索尼PS3游戏机以及松下数字电视产品中,在高性能视频处理应用中表现卓越,而在超级计算机系统中,Cell则以协处理器的面目出现专注于高密集浮点运算。
图7:Cell处理器拥有8个协处理器,程序编制难度大限制了它的应用
在发布Zii的同时,创新也公布了Zii平台的开发工具。事实上,对这类拥有数量众多内核的处理器来说,如何有效地编程是其中的难点。Zii ZMS中的PE阵列以何种组态存在,完全取决于程序本身—假如程序足够优化,那么的确能够发挥出Zii任务自适应的优势;但如果程序编制得糟糕,那么
Zii平台将表现出低下的效率。
正因为如此,Zii平台对于程序的编制水准高度依赖,这也是创新在未来要面对的关键问题。不过对创新来讲,应用软件的问题并非瓶颈所在,因为创新公司将承担Zii实用化的先锋,得益于之前DMS-02媒体处理器的开发经验,创新可以很快地将Zii ZMS芯片用于自己新的媒体播放器产品中,同时创新也有能力拿出相应的软件平台,包括嵌入Linux和多媒体处理软件—在Zii的官方网页中,我们已经看到Google Android操作系统可以在Zii平台中顺利运行,这也意味着Zii进入智能手机市场完全没有障碍。此外,创新也发布了相应的中间件,借助这个中间件OEM厂商可以开发出Zii优化的应用。
与Zii形成鲜明对比,IBM Cell和Intel Larrabee都受制于软件的支持。首先我们来看Cell平台,它的PE协处理器虽然只有8个,但是性能更为强大,同时Cell具有高达4GHz的高频率足以保证了惊人的浮点性能。Cell可以支持分布式运算机制,即任务可以被分布于整个Cell网络的其他处理器中—这种特性与创新“干细胞”其实如出一辙,只是IBM没有作此宣传而已。Cell的PE协处理器同样具有高度可编程特性,问题在于IBM只是作为平台供应商,应用软件则由Cell的使用者开发。
图8:Intel Larrabee与Zii非常类似,都是采用数量较多
的协处理器单元,但Larrabee目前还是纸面上的产品
索尼初在设计PS3中曾雄心勃勃,打算用Cell来渲染3D图形,不过索尼很显然为如何有效编程困扰,而IBM当时没有公布完善的中间件,索尼终不得不放弃Cell渲染的计划,转而选择传统的NVIDIA GPU方案。目前除了PS3之外,Cell还被东芝用于液晶电视机和笔记本电脑中、负责对视频进行处理,这也是Cell目前较为成熟的应用。
Intel的Larrabee同样将面临软件支持的问题。Intel为Larrabee平台带来全新的指令集,尽管该指令集在x86基础上扩展,开发人员容易入手,同时也很具弹性,比如说它既可以执行高密集计算也可用于3D渲染。但问题就在于Larrabee的一切还是未知数,Intel很难说服开发者在不知道其性能高低的情况下就花费高昂的精力为它编程,大概没有一个游戏开发者愿意这么干,毕竟对于3D渲染来讲,微软DirectX和OpenGL都是更为成熟的选择;而对于密集的流计算,NVIDIA的CUDA平台也更为成熟。
尽管Zii处理器的小体积、超低功耗和无限扩展性让它能够在A4大小空间实现TFlops级别计算能力,或在576个刀片服务器里安装147456颗Zii处理器达到PFlops级别性能,但指望Zii进入超级计算领域显然是不务实的,原因并非在于性能的限制—其中关键的障碍在于创新在超级计算领域并无根基,现在Intel、IBM、AMD、NVIDIA都已经提供了足够多的方案,创新也很难说服超级计算机厂商选择Zii来构建超级计算平台。
对于这一点创新心知肚明,为此将Zii定位于自身所擅长的嵌入领域,集合自身在多媒体技术的优势,打造出一套面向未来的梦幻级嵌入式平台。对于这一点我们毫不怀疑,很快我们就会首先在创新的产品中看到Zii,只要它的表现足够出色,那么将能够不断吸引其他厂商的参与。我们同样不怀疑分布式计算是IT工业的未来方向所在,在它所专注的领域,Zii并没有强有力的对手。创新对Zii则寄以厚望,它急于摆脱“声卡之王”的讥讽,转身成为重量级的数字媒体供应商,而Zi i和“干细胞计算”也许真能够帮助创新做到这一点。