ldquo推土机”是AMD完全重新设计的核心,将成为AMD下一代高性能处理器技术,应用于客户端和服务器领域,与骁龙6100系列相比,核心增加33%,性能提升50%左右。
作为一种全新的处理器架构,AMD推土机将采用32nm SOI技术,与Magny-Cours Opteron处理器相比,在不增加功耗的情况下,使推土机的核心数和吞吐量分别增加33%和50%。
与AMD之前的所有处理器不同,“推土机”采用了“模块化”设计。每个“模块”包含两个处理器内核,这有点像启用了SMT的单核处理器。每个内核都有自己的整数调度器和四条专有流水线。两个内核共享一个浮点调度器和两个128位FMAC乘法累加器。
Turbo Core全核加速技术
睿频核心技术主要是指最大限度地为一些没有完全消耗的工作负载加快时钟速度。在各种不同的工作负载下,Turbo Core最多可以提升500 MHz的性能。最重要的一点是,睿频核心加速指的是所有核心的加速,和一些核加速技术有明显的区别。以前的核加速技术可能需要关闭一些内核,只对一些内核进行加速。睿频核心技术最多可以提升所有核心500 MHz的速度,如果关闭部分核心,速度将超过500 MHz。同时,我们进一步优化了内存控制器,提高了内存的吞吐量。
除了每个内核享有4条整数计算流水线,推土机在浮点运算上采用了“FlexFP”技术。两个内核共享一个浮点调度器和两个128位FMAC乘法累加器,它们可以合并使用。每个时钟周期可以完成两次64位双精度计算或四次32位单精度计算。如果一个核不执行浮点运算,那么另一个核可以占用这两个128位FMAC,在一个时钟周期内完成4次双精度运算或8次单精度计算,AMD将其命名为AVX模式。这项技术保证了推土机的浮点计算能力,不会因为高性能计算中的“共享”而牺牲性能。
新界面和新技术
推土机将采用942针的Socket AM3接口,与目前938针的Socket AM3接口不同。它的优点是可以支持DDR3-1600内存和先进的节能技术。而且,AM3将是AM3的AMD的最后一代针栅阵列(PGA)封装,之后将改用接触栅阵列(LGA)。当Fusion处理器到来时,它将使用新的LGA AF1接口,具有1591个触点,并支持DisplayPort 1.2标准,PCI-E 3.0规范(32通道)和四通道内存。
增强型内存控制器
八年前,AMD率先推出了集成内存控制器。根据AMD在这方面的经验和非常好的技术,内存控制器的性能在这一代产品中得到了全面的提升。首先,内存控制器的效率被重新设计和提高,因此内存性能提高了30%。在性能提升30%的基础上,如果内存支持1600MHz的频率,性能可以提升20%。这两项加起来可以实现内存控制器50%的吞吐量提升。
同时支持AVX指令和SSE指令
FLEX FP是AMD迄今为止最具创新性的浮点计算技术。每个模块都有一个用于浮点运算的FLEX FP。如果使用传统的128位编码,这意味着每个内核都将有一个独立的浮点运算单元。与友商相比,如果以128位编码为前提,AMD会执行两倍。如果是256位AVX编码,推土机可以把两个浮点运算器放在一起执行。所以在256位代码执行模式下,执行次数和友商是一样的。但是推土机有一个很大的优势,就是可以同时执行256位的AVX指令和SSE指令。朋友不能这样。他们只能在AVX和上交所中选择一个。这种优势可以让推土机在高性能计算、媒体编解码以及一些技术计算方面有更高的性能。
高级电源管理技术
每个模块中第二个整数核所需的电路只占总核面积的12%,在芯片级只会给整个核增加5%的电路。更多的核心和更少的空间,这显然有助于提高单位功耗和单位成本的性能。
功耗由上电时钟的数量决定,并且取决于执行一个公共指令(操作)需要上电多少个晶体管。在最大时钟供电百分比下,推土机在正常使用状态和空闲状态下都有很好的能耗表现。同时在各个能耗单元进行了优化,各个单元都可以关电。高性能运算的高能耗主要是因为浮点运算,而一般的应用程序运算在执行单元中消耗最多。同时,在空闲状态下,AMD的技术可以完全关闭那些完全不需要的内核的电源。去年AMD产品有一次大转型。AMD推出了新的插槽,2011年推出的推土机可以使用2010年的插槽。为了推出新的平台和新的插槽,尚友还让AMD更具统治地位。