当arm的cortex-a15架构遇到mali-t604会是怎样一副情形?你是否相信mali-t604在性能方面5倍于mali-400mp?又是否真正了解mali-t604的在图形处理方面质的飞跃,带着这些疑问,我们将会和大家一同探讨一下全新一代gpu芯片组mali-t604的优势和对未来手机、平板的深远影响力,当你玩大型游戏时,它会让你感受到它的存在,小身材却有大智慧。而在将来,还会有更多的如mali-t624、t628、t658、t678等更高端的芯片运用到移动设备中来,到那时智能数字化时代也就迎来顶峰。
gpu大战 mali-t604与其他竞品强强对话
第四代gpu核心:mali-t604
图为 mali-t604架构示意图
arm mali-t604简介:
mali-t604是第一个基于 midgard 体系结构的gpu,它具有单核到四核的可伸缩性,是一个完整的嵌入式图形和 gpu 计算加速平台,支持高级用户界面、游戏功能和各种未来消费类设备(从手机到智能本、从 hdtv 到便携式游戏机等等)的 gpu计算应用程序的开发。
mali-t604管道在硬件中提供真正的ieee双精度浮点数学运算,从而为完全配置文件以及嵌入式配置文件 opencl 提供支持。通过单一驱动程序栈为所有多核配置提供达到生产质量要求的软件支持,可简化应用程序移植、系统集成和维护过程。多核调度和性能扩展完全在图形系统中处理,应用程序开发人员不需要考虑任何特殊事项。
mali-t600系列gpu内的作业管理器可将任务管理从cpu卸载到gpu,并在活动着色器内核之间实现无缝负载平衡。通过 arm 的一致性和互连技术,计算任务在异类系统中进行共享处理时,可以轻松跨越 cpu、gpu 和其他可用计算资源,更高效地访问数据。
arm mali-t604 gpu计算j9九游会官网登录的解决方案专门针对可视计算进行设计,通过使用独创的三管道体系结构,以2d和3d图形高质量可伸缩多核j9九游会官网登录的解决方案的跟踪记录为基础构建,支持的主要api(应用编程接口)包括 openvg 1.1、opengl es 1.1、2.0、directx 11和opencl 1.1。
移动领域gpu发展线程
上面我们提到了directx,为什么这个directx会这么重要呢。以前在dos下玩游戏时,可不像我们现在,安装上就可以玩了,他们往往首先要先设置声卡的品牌和型号,然后还要设置irq(中断)、i/o(输入与输出)、dma(存取模式),如果哪项设置的不对,那么游戏声音就发不出来。因为为了让游戏能够在众多电脑中正确运行,开发者必须在游戏制作之初,便需要把市面上所有声卡硬件数据都收集过来,然后根据不同的 api(应用编程接口)来写不同的驱动程序,这对于游戏制作公司来说,是很难完成的,所以说在当时多媒体游戏很少。微软正是看到了这个问题,为众厂家推出了一个共同的应用程序接口——directx,只要依照directx来开发的,不管你是什么显卡、声卡、统统都能运行,而且还能发挥更佳的效果。当然,前提是你的显卡、声卡的驱动程序也必须支持directx才行。
图为 direct x 11
移动领域gpu当下王者-imagination
说到imagination,上世纪90年代的桌面3d大战相信很多人都还记忆犹新,3dfx、nvidia、ati、s3、trident、imagination、matrox、3d-lab、sis、stm……经过一系列惨烈的较量之后,在激烈的竞争中失利的imagination不得不从桌面市场退下来,转入移动及soc领域进行发展。尽管从桌面领域暂时撤退了下来,但是惨烈的桌面3d大战考验使得imagination变得比过去更加成熟也更具竞争力。通过过去积累的先进技术,比如tbdr(tile based deferred rendering),imagination在soc领域的发展远较桌面领域来的顺利,也许你并不熟悉power vr曾经的图形构架,从惨烈的桌面gpu战争中撤退下来之后,卧薪尝胆的imagination长期以来一直在移动及soc领域发展着自己独特的构架,sgx series5系列构架就是其中的代表作。
sgx series5系列构架分为sgx series5以及sgx series5xt部分,其中sgx series5部分包含sgx 520、sgx530、sgx531、sgx535、sgx540及sgx545,而sgx series5xt部分则包含sgx 543mp1-16、sgx544mp1-16、sgx554mp1-16等。sgx series5系列构架支持的api非常广泛,不仅支持家用机及移动平台的open gl es,桌面平台的directx以及open gl,甚至还提供了open cl的完整支持。
图为 powervr sgx家族系列
sgx series5系列gpu家族
sgx series5系列构架从外观上来看与现代桌面gpu非常接近,由完整的前端几何部分,shader单元及后端组成流水线。其中包括geometry部分,cgs(coarse grain scheduler)线程块调度单元,usse(universal scalable shader engine)通用shader单元以及完整的rasterization阵列,整条流水线通过内部总线共享多级cache,并最终与64bit内存控制器与内存总线相连。这与桌面gpu常规的geometry shader rasterization的流水线过程几乎是完全一样的,甚至在进行常规构架介绍时,我们可以直接将sgx series5系列描述成“拥有1至4个us单元,2个tmu单元,64bit显存带宽的gpu”。此外,从sgx 543mp开始,imagination在构架中引入了特殊的multi-core设计,多个sgx54xmp芯片可以近乎于无损的完成多核心并联,达到性能倍增的目的。
图为 sgx series 5
整个sgx series5架构最引人瞩目的地方,在于usse单元以及通过总线与cache相连的cgs。
usse单元是imagination为sgx series5搭配的mimd可编程浮点单元,透过usse单元,sgx series5可以实现对vertex shader和pixel shader的无差别吞吐。usse单元内部被描述成多个并联的mteu(multi-thread execution unit),但从本质角度来讲usse单元更像是一个混合体,imagination在其官方pdf中宣称usse2在usse的基础上添加了一组新的指令集,以协助单元完成向量吞吐及co-issue操作,因此我们认为它既有常规gpu的流处理器单元alu/eu,又有类似larrabee中的vector unit,两者在不同吞吐场合共同完成特殊函数、shader及其他vector指令的吞吐。在这种设计的帮助下,最新的sgx543mp芯片可以在200mhz的频率上取得6.4gflops的吞吐能力,这个成绩已经达到了geforce ulp理论性能的2倍。
如果说mali-t604想有一番作为就必须能够在众多竞争对手面前脱颖而出,真正能够在图形性能方面占据优势,比如三角形输出率以及像素填充率,而这也是整个mali-t600系列需要完成的使命。
通过以上对比图我们能够发现,全新银河战舰三星galaxy s3还是优势明显,而它恰恰用的是mali-400mp四核gpu芯片,由此可见mali-t600系列的水平将是多么恐怖,虽然t600系列还尚未运用到手机终端,但随着exynos 5的跃跃欲试,它也会跟随一同来到人们面前,不过这并不代表arm就可以高枕无忧,刚才介绍简单介绍的imagination pover vr以及nv的tegra、更甚者高通的adreno等等均在窥视着移动领域gpu的王座地位,尤其是高通。
虽然高通公司的gpu业务发展时间较短,但是如果追溯它的根源,却可以说由来已久,再加上收购amd相关图形芯片部门,使得高通缩小了与其他竞争对手的差距,并且开发出了今天我们熟知的qsd和msm系列芯片组,代表性的有msm7x01、msm7227、sqd8250、msm8255等,主要应用在手机和平板电脑领域中。而且值得说明的是,高通拥有在移动soc芯片和3g通信技术上多向,而且是一家拥有移动gpu自主设计能力和生产能力的公司。移动gpu是soc芯片的一部分,与arm架构的通用处理器(cpu)一起构成soc芯片体现应用性能的两个重要部分。
高通adreno gpu
高通收购amd一部分图形技术之后,自家发展成为一种全新的gpu品牌体系adreno。高通的adreno产品大部分集成在高通自家的芯片组中,其他公司的产品中应用并不广泛。由于高通另外还提供通用处理器(cpu)和3g通信j9九游会官网登录的解决方案,因此它的soc芯片整合度非常高,可以为手机和平板电脑等移动设备提供出色的处理及显示性能。
图为 高通gpu性能展示
图为 adreno 320实力强劲
高通的芯片组产品应用范围广泛
adreno gpu至今已经发布了几款产品,在移动设备中应用比较广泛,现今阶段高通的adreno gpu产品大部分出现在高通的soc芯片组中,目前高通公司snapdragon系列芯片组j9九游会官网登录的解决方案主要包括:adreno 130、adreno 200、adreno 205、adreno 220、adreno 225、adreno 320;现在我们使用的主流产品主要是adreno 205和adreno 220。
adreno 220 gpu:
adreno 220于2011年推出,相比前者有几倍性能的提升,在游戏、导航及浏览器应用中的表现出色,而且还可提供更大的显示分辨率支持和更低的电源能耗。
·支持cpu、dsp、graphics和mdp的并行执行。
·支持视频、拍照设备的3d图形信息实时处理。
·支持主流的图形标准(api)。
gpu图形性能:
三角形输出率:88m/s
像素填充率: 532m/s
相关芯片组产品:高通apq8060(双核)、msm8260和msm8660(双核)、qsd8672(双核)
针锋相对:mali-t604与adreno 320 gpu
adreno 320采用28nm制程,比现行高通的adreno gpu架构强劲不少,据称新的adreno 300系列能提供与xbox360或者ps3相仿的处理能力。而mali-t604 gpu 与以前的mali图形处理器相比,性能可以提高5倍,并且最多可以使用4个内核,同样非常强劲。现阶段这两个gpu芯片都还没有完全服务于手机领域,尤其是猎户座5250系列,不过目前adreno 320已内嵌于高通骁龙apq8064 s4处理器中,实力绝对算得上顶级,我们完全可以预测到高通s4 vs 三星exynos 5 dual的新一轮处理器大战又将一触即发。
写在最后:
说了这么多,没有实际应用一切还是白搭,而被称为期货的米二代则正是御用高通s4四核8064处理器,其gpu大家可想而知,已经是最接近量产的配备,而三星exynos 5系列则更为神秘,但就其目前曝光的资料而言也是最值得期待的系列,因为exynos 4412的性能大家已经有目共睹,那么再次改变制程工艺的5系列,则不会差太多,只是目前并未得到有关5系列四核的消息,5250将会用到平板设备之中,而在上月底发布的note ii也并没有采用三星最新5系列处理器,看来一切还需等待。游戏厂商们肯定也不会放过这绝佳的机会,相信更高匹配度的游戏也将随之而生,未来的智能手机还会买上更高的高度,从某个方面来看,双核时代才真正开启了智能化时代,而你我都有幸成为见证者。