请输入您要查询的百科知识:

 

词条 APU
释义
1 加速处理器(Accelerated Processing Unit)

APU(Accelerated Processing Unit)中文名字叫加速处理器,是AMD融聚理念的产品,它第一次将处理器和独显核心做在一个晶片上,它同时具有高性能处理器和最新独立显卡的处理性能,支持DX11游戏和最新应用的“加速运算”,大幅提升电脑运行效率,实现了CPU与GPU真正的融合。2011年1月,AMD将推出一款革命性的产品AMD APU,是AMD Fusion 技术的首款产品。2011年6月面向主流市场的Llano APU正式发布。

APU发布背景

AMD未来的处理器组成将按照“推土机”(Bulldozer)和“山猫”(Bobcat)两款全新的处理器架构划分,推土机架构主攻性能和扩展性,面向主流客户端和服务器领域;山猫架构的重点则是灵活性、低功耗和小尺寸,将用于低功耗设备、小型设备、云客户端。

山猫架构就是Fusion APU融合处理器的基础,真实产品包括“Zacate”和“Ontario”两种制品。这两种制品的区别在于,“Zacate”的TDP为18W,主要针对轻薄型PC市场,对阵Intel的ULV(Ultra Low Voltage)系列处理器,而“Ontario”的TDP为9W,主要目标是上网本,对阵Atom系列处理器,梅捷SY-E350就是采用的“Zacate”核心。

APU简介

说到底,APU将通用运算x86架构CPU核心和可编程矢量处理引擎相融合,把CPU擅长的精密标量运算与传统上只有GPU才具备的大规模并行矢量运算结合起来。AMD APU设计综合了CPU和GPU的优势,为软件开发者带来前所未有的灵活性,能够任意采用最适合的方式开发新的应用。AMD APU通过一个高性能总线,在单个硅片上把一个可编程x86 CPU和一个GPU的矢量处理架构连为一体,双方都能直接读取高速内存。AMD APU中还包含其他一些系统成分,比如内存控制器、I/O控制器、专用视频解码器、显示输出和总线接口等。AMD APU的魅力在于它们内含由标量和矢量硬件构成的全部处理能力。

AMD认为,CPU和GPU的融合将分为四步进行:

第一步是物理整合过程(Physical Integration),将CPU和GPU集成在同一块硅芯片上,并利用高带宽的内部总线通讯,集成高性能的内存控制器,借助开放的软件系统促成异构计算。

第二步称为平台优化(Optimized Platforms),CPU和GPU之间互连接口进一步增强,并且统一进行双向电源管理,GPU也支持高级编程语言,这部分才是最关键的。

第三步是架构整合(Architectural Integration),实现统一的CPU/GPU寻址空间、GPU使用可分页系统内存、GPU硬件可调度、CPU/GPU/APU内存协同一致,这已在APU中初步完成。

第四步是架构和系统整合(Architectural & OS Integration),主要特点包括GPU计算环境切换、GPU图形优先计算、独立显卡的PCI-E协同、任务并行运行实时整合等等,这些需要和微软、ADOBE等行业软件巨头不停的沟通交流。

APU正是AMD公司对融合技术多年研究的成果,传统计算中的绝大部分浮点操作都脱离CPU而转入擅长此道的GPU部分,GPU不再只是游戏工具,混合计算将大放光芒。在不远的未来,CPU和GPU的概念也会渐渐模糊起来,正如AMD所宣传的:The Future is Fusion。

Llano APU架构解析

APU与融合

不同于推土机,Llano APU并没有使用全新的内核架构,甚至不像Brazos APU平台那样至少处理器部分是新的“山猫”(Bobcat)架构,说白了主要就是K10处理器、DX11显卡(以及北桥芯片)的合体,但显然也不是1+1=2那么简单。Llano APU面临的问题不仅仅是要避免1+1<2,还要争取做到1+1>2。

Llano APU的设计目标主要有这么几条:

CPU、GPU性能综合:同时提供最好的CPU、GPU性能。

独立显卡级别的GPU体验:完整的DX11和功能集;拖拽转码和Aero效果等Windows 7体验。

独有双显卡技术:配合AMD Radeon独立显卡提供额外性能。

下一代视频加速:也就是UVD3引擎,创新的显示和画质功能,更高带宽。

行业和开放标准计算API支持:主要是OpenCL、DirectCompute,同时数据传输延迟更低。

3D立体:支持HD3D,包括蓝光3D、DisplayPort 1.1(不及独立显卡的DP 1.2)、HDMI 1.4a。

可以看出,六个目标中有五个半是关于GPU的,涉及CPU的只有半个,Llano APU的关注重点也就不言而喻了,也与AMD VISION这样的平台名字相符。

Llano APU芯片采用GlobalFoundries 32nm HKMG工艺制造,又分为两种版本,其一是完整版本,集成14.5亿个晶体管,核心面积228平方毫米,又称为Big Llano或者Llano 1;其二是精简版本,集成7.58亿个晶体管,核心面积暂时不详,又称为Small Llano或者Llano 2。二者都采用了新的micro PGA封装接口Socket FS1,772针无顶盖,引脚间距1.2192毫米,芯片尺寸35×35=1225平方毫米。

从各方面看,首批发布的Llano APU都是采用了第一个完整版本,双核版本也是由四核屏蔽而来的,因此热设计功耗同样较高。不知道何时才能看到原生的双核版本,但是AMD透露说会在近期推出不需要风扇散热的低功耗型号,想来就是了。

和之前的Brazos APU类似,Llano APU也在单独一颗硅片上集成了以下众多模块:x86处理器核心、二级缓存、DDR3内存控制器、图形SIMD阵列(也就是GPU)、显示控制器、UVD解码引擎、PCI-E控制器。从下边这两张图上你就可以看出各个模块的分布位置和相对大小。

Llano APU内集成了如此众多的功能模块,如何确保它们之间的高速互连、以便让整体随时保持在最佳状态、避免任何潜在的瓶颈,这无疑是APU设计过程中最关键的一点,也是获得1+1>2效果的基本前提。AMD在这方面显然是下足了功夫,比如特意设计了全新的Fusion Compute Link(Fusion计算连接)来将北桥模块、GPU、IO输入输出串联在一起,允许GPU访问一致性缓存/内存,同时在GPU和北桥之间还搭建了Radeon Memory Bus(Radeon内存总线),让没有独立显存的GPU通过高速带宽去访问系统系统。

说到底,APU并不是简简单单地把CPU、GPU整合到一块硅片上就完事了,不然也不会花费AMD三年多的时间,反复修改设计才最终修成正果。

CPU与Turbo Core

Llano APU中的处理器部分来源于Stars架构,也就是俗称的K10架构,与Phenom II/Athlon II系列同宗同源,在移动平台上更确切地说相当于此前的Phenom II Mobile系列,自带128-bit浮点单元、一级缓存(每核心64KB+64KB)、二级缓存(每核心1MB),但没有三级缓存。

当然一切都不是完全照搬而来的。除了制造工艺从45nm进步到32nm,从而更有效地控制晶体管集成度、核心面积、频率和功耗,支持C6电源状态,还在细节上进行了大量优化,包括更大容量的二级缓存、改进的硬件预取、更大的窗口尺寸、硬件分割器、支持第二代Turbo Core智能超频技术等等,最终将IPC(每时钟周期指令数)提升了6%以上。

这里特别需要着重介绍的就是Turbo Core,官方中文名:“智能超频”。该技术最早出现于六核心的Phenom II X6系列上,如今已经进化到第二代,支持从推土机到APU的全系列产品,不过目前基本还没有软件工具能够实时监测Turbo Core的动态频率,只有AIDA64附带的CPUID还凑合。

我们知道,处理器在不同负载下的实际功耗差别很大,而且都距离最大热设计功耗还有一定的空间,另一方面多核心处理器在不同应用环境中活跃的核心数量也有所不同,这都造成了处理器资源无法得到充分利用,形成了浪费。

解决方案就是由功耗监视器实时测量每个处理器核心的功耗,由北桥汇总,然后统一报告给P-State电源状态管理器,再由其根据需要让处理器的各个核心运行在适当的电源状态下,或者降速或者提速,特别是提速的时候能短时间超过原始频率,并且保证始终不超过整体热设计功耗。

AMD Turbo Core的创新之处在于使用了数字式高级电源管理(APM)模块,相比于类似技术中的模拟温度和电流监测方法,能够提供高灵敏度的电源管理,精确度更高,具备完全可重复性。

更关键的是,Turbo Core会自动协调CPU、GPU,让需要更多资源的能够获得更高速度。在GPU闲置的时候,它就会大幅降低其频率,去尽可能高地提升CPU频率。

如果碰到了较为繁重的图形或者视频任务,GPU就会获得更高优先级,CPU退而求其次。

如果GPU执行的是DVD视频播放等轻负载任务,那么留给CPU的加速空间就要在整体热设计功耗中排除掉GPU的那一部分。

极端情况下,如果CPU、GPU都面临繁忙的任务,或者需要携手进行OpenCL APP加速计算,此时CPU、GPU就会同时得到加速,甚至会在短时间内超过热设计功耗限制,然后再根据情况去降低CPU的频率和功耗(GPU不变),保证核心温度不致于过高。这一点倒是和Sandy Bridge上的第二代Turbo Boost有些相似。

内存支持上,Llano APU移动版支持双通道DDR3 SO-DIMM,每通道一条内存条,也就是总共只能插两条内存,容量最大32GB。频率和电压方面标准版DDR3最高1600MHz,电压1.5V,低压版DDR3L最高1333MHz,电压1.35V,带宽最高25.6GB/s。

Llano APU的桌面版则支持双通道DDR3 DIMM,每通道两条内存条,总共可以插入四条内存,容量最大64GB,支持1.35V DDR3-1333、1.5V DDR3-1866,带宽最高29.8GB/s。

由于CPU、GPU“同处一室”,难免会争夺资源(事实上APU对内存带宽的依赖性确实非常强),为此AMD将GPU与内存控制器之间的带宽提高到了上代平台的四倍,且高于内存控制器与内存之间的带宽。

DX11 GPU

这部分是Llano APU的重点。它的开发代号为“Sumo”(相扑),源于第一代DX11家族中Radeon HD 5600/5500系列的Redwood核心,最多400个流处理器、20个纹理单元、2个渲染后端、8个ROP单元,显存位宽128-bit。遗憾的是,独立的GDDR5显存是没有了,而且也不像880G主板那样有板载硬显存,只能去共享系统DDR3内存。

除了继承原有的TeraScale 2统一处理架构,以及完全的DX11、OpenGL 4.1、各种抗锯齿和各向异性过滤(包括形态抗锯齿MLAA)、APP并行计算加速技术之外,Sumo核心还增加了来自Radeon HD 6000系列家族的UVD3视频解码引擎、功率门控(深度电源管理与节能),重新设计了通往北桥的显存接口,制造工艺也同步采用了最新的GlobalFoundries 32nm。

Sumo核心自然还是VLIW5 5D式流处理器架构,单精度浮点计算性能最高480GFlops,整数计算性能最高480Gints,都是每秒钟4800亿次。

作为Fusion APU的竞争对手,Intel Sandy Bridge所集成的HD Graphics 3000/2000虽然比前一代也有了巨大的进步,但是在图形技术、视频技术方面依然落后得很多,尤其是OpenCL并行计算仅有处理器支持,图形核心并不支持,无法协同加速。

Llano APU的处理器、图形核心部分都支持AMD APP加速并行处理技术,尤其是OpenCL标准规范,为此AMD将不断更新APP SDK开发包,提供更好性能和更多功能。按照规划,APP SDK 2.5版将于八月份推出,主要更新有Windows 7/Linux性能优化、多GPU支持(Windows 7)、快速傅立叶变换(根基数5)、UVD3/MPEG2解码、PowerExpress独显集显切换支持、GPU调试器(Windows 7)等等。

值得一提的是,Llano APU目前正式支持的OpenCL规范版本为1.1,1.2版本支持还在认证申请中。

芯片组与节能

随着芯片集成度的提高,目前无论桌面还是移动平台的构成都越来越简单,传统的处理器加南北桥双的三片架构已经消失,取而代之的是处理器加互连芯片的双芯片架构。原来由北桥负责的大部分功能都已经转移到处理器内部,包括图形核心,所谓的芯片组也就剩下了一颗充当南桥功能的小芯片。

Llano APU处理器搭配的Hudson系列芯片组同样是单芯片设计,在移动平台上有A70M、A60M两款型号,代号分别为Hudson-M3、Hudson-M2,通过UMI总线(PCI-E 1.0 x4+DP)与处理器互连。和之前用于Brazos APU平台的Hudson-M1 A50M是同门师兄弟。

A70M/A60M芯片组采用65nm工艺制造,605球脚FC BGA封装,芯片尺寸23×23=529平方毫米,典型热设计功耗2.7-4.7W

两款芯片组均支持六个SATA 6Gbps存储接口并支持RAID 0/1阵列方式,可提供四条PCI-E 2.0 x1连接通道,集成时钟发生器、消费级红外接收器、风扇控制、电压感应、DAC(支持VGA)等等,主要区别则在于USB接口:A70M原生支持四个USB 3.0、十个USB 2.0和两个内部USB 1.1,A60M则没有USB 3.0,而是改成了十四个USB 2.0

这套平台上还有个可选的替补角色,那就是Vancouver Radeon HD 6000M系列独立显卡,通过PCI-E x16通道与处理器相连。它不但能为笔记本带来独显性能,还支持与Llano APU集成的图形核心组成双显切换、加速系统。

最后再说一下电源管理与节能技术,这方面同样很丰富,包括32nm HKMG新工艺、AMD Turbo Core 2.0动态调速技术、系统管理模式(SMM)、ACIP兼容、多重性能状态(P-states)、多重节能状态(C-states)、S0/S3/S4/S5休眠状态、每个核心功率门控(CC6)、PCI-E核心功率门控、Radeon流处理器核心与UVD3视频引擎功率门控。

功率门控(Power Gating)尤为值得一提。它是AMD 45nm时代非常欠缺的技术,如今终于得到了彻底的支持。相比于时钟门控(Clock Gating),它不仅可以实时调节各个模块的运行频率、电压,还能在不需要的时候彻底关闭,实现部分零功耗。换句话说,Llano APU的每个处理器核心、每个PCI-E控制器、流处理器阵列、UVD3引擎都是可以完全关闭的,Turbo Core技术也是因此更上一层楼。

以上种种,都属于AMD AllDay全天计算技术。按照AMD给出的数据,VISION 2010移动平台的待机时间最长为6个半小时,迎来了APU的VISION 2011则可长达10个小时;同时相比竞争对手,待机续航时间长一个半多小时,满载续航时间也要长一个小时。

APU桌面级技术参数

Lynx平台

"Llano" (32 nm)

CPU支持:MMX, SSE, SSE2, SSE3, SSE4a, Enhanced 3DNow!, NX bit, AMD64, Cool'n'Quiet, AMD-V, Turbo Core

CPU部分代号Husky,基于改进版K10.5架构

GPU部分基于Redwood核心

带K字的型号开放倍频

全型号通用参数:

晶体管数量:14.5亿

核心面积:228平方毫米

步进:B0

接口:Socket FM1

UMI总线:5GT/s

注:GPU核心配置格式为 流处理器数量:纹理单元数量:光栅单元数量

型号 核心线程 主频 加速频率 二级缓存 GPU型号 GPU配置 GPU频率 TDP 内存支持

E2-3200 双核心双线程 2.4GHz 无 2×512 KB HD 6370D 160:8:4 443MHz 65W DDR3-1600双通道

A4-3300 双核心双线程 2.5GHz 无 2×512 KB HD 6410D 160:8:4 443MHz 65W DDR3-1600双通道

A4-3400 双核心双线程 2.7GHz 无 2×512 KB HD 6410D 160:8:4 600MHz 65W DDR3-1600双通道

A4-3420 双核心双线程 2.8GHz 无 2×512 KB HD 6410D 160:8:4 600MHz 65W DDR3-1600双通道

A6-3500 三核心三线程 2.1GHz 2.4GHz 3×1MB HD 6530D 320:16:8 443MHz 65W DDR3-1866双通道

A6-3600 四核心四线程 2.1GHz 2.4GHz 4×1MB HD 6530D 320:16:8 443MHz 65W DDR3-1866双通道

A6-3620 四核心四线程 2.2GHz 2.5GHz 4×1MB HD 6530D 320:16:8 443MHz 65W DDR3-1866双通道

A6-3650 四核心四线程 2.6GHz 无 4×1MB HD 6530D 320:16:8 443MHz 100W DDR3-1866双通道

A6-3670K 四核心四线程 2.7GHz 无 4×1MB HD 6530D 320:16:8 443MHz 100W DDR3-1866双通道

A8-3800 四核心四线程 2.4GHz 2.7GHz 4×1MB HD 6550D 400:20:8 600MHz 65W DDR3-1866双通道

A8-3820 四核心四线程 2.5GHz 2.8GHz 4×1MB HD 6550D 400:20:8 600MHz 65W DDR3-1866双通道

A8-3850 四核心四线程 2.9GHz 无 4×1MB HD 6550D 400:20:8 600MHz 100W DDR3-1866双通道

A8-3870K 四核心四线程 3GHz 无 4×1MB HD 6550D 400:20:8 600MHz 100W DDR3-1866双通道

Athlon II X4 631 四核心四线程 2.6GHz 无 4×1MB 无 无 无 100W DDR3-1866双通道

Athlon II X4 651 四核心四线程 3GHz 无 4×1MB 无 无 无 100W DDR3-1866双通道

APU移动版技术参数

Brazos平台

基于Bobcat微架构

CPU支持:SSE, SSE2, SSE3, SSSE3, SSE4a, NX bit, AMD64, PowerNow!, AMD-V.

所有型号支持DX11和UVD3.0硬件解码

Socket FT1接口

步进:B0,C0

注:GPU核心配置格式为 流处理器数量:纹理单元数量:光栅单元数量

型号 核心 主频 二级缓存 GPU型号 GPU配置 GPU频率 GPU加速频率 TDP 内存支持

"Ontario" (40 nm)

C-30 单核心 1.2GHz 512KB HD 6250 80:8:4 276MHz 无 9W DDR3-1066单通道

C-50 双核心 1GHz 2×512 KB HD 6250 80:8:4 276MHz 无 9W DDR3-1066单通道

C-60 双核心 1GHz 2×512 KB HD 6290 80:8:4 276MHz 400MHz 9W DDR3-1066单通道

"Zacate" (40 nm)

E-240 单核心 1.5GHz 512KB HD 6310 80:8:4 500MHz 无 18W DDR3-1066单通道

E-300 双核心 1.3GHz 2×512 KB HD 6310 80:8:4 488MHz 无 18W DDR3-1333单通道

E-350 双核心 1.6GHz 2×512 KB HD 6310 80:8:4 492MHz 无 18W DDR3-1066单通道

E-450 双核心 1.65GHz 2×512 KB HD 6320 80:8:4 508MHz 600MHz 18W DDR3-1333单通道

"Desna" (40nm)

Z-01 双核心 1GHz 2×512 KB HD 6250 80:8:4 276MHz 无 5.9W DDR3-1066单通道

Sabine平台

"Llano" (32 nm)

CPU支持:MMX, SSE, SSE2, SSE3, SSE4a, Enhanced 3DNow!, NX bit, AMD64, Cool'n'Quiet, AMD-V, Turbo Core

CPU部分代号Husky,基于改进版K10.5架构

GPU部分基于Redwood核心

全型号通用参数:

晶体管数量:14.5亿

核心面积:228平方毫米

步进:B0

接口:Socket FS1

UMI总线:2.5GT/s

注:GPU核心配置格式为 流处理器数量:纹理单元数量:光栅单元数量

型号 核心 主频 加速频率 二级缓存 GPU型号 GPU配置 GPU频率 TDP 内存支持

E2-3000M 双核心 1.8GHz 2.4GHz 2×512 KB HD 6380G 160:8:4 400MHz 35W DDR3-1333双通道

A4-3300M 双核心 1.9GHz 2.5GHz 2×1MB HD 6480G 240:12:4 444MHz 35W DDR3-1333双通道

A4-3305M 双核心 1.9GHz 2.5GHz 2×512 KB HD 6480G 240:12:4 593MHz 35W DDR3-1333双通道

A4-3310MX 双核心 2.1GHz 2.5GHz 2×1MB HD 6480G 240:12:4 444MHz 35W DDR3-1333双通道

A4-3320M 双核心 2GHz 2.6GHz 2×1MB HD 6480G 240:12:4 444MHz 35W DDR3-1333双通道

A4-3330MX 双核心 2.2GHz 2.6GHz 2×1MB HD 6480G 240:12:4 444MHz 45W DDR3-1600双通道

A6-3400M 四核心 1.4GHz 2.3GHz 4×1MB HD 6520G 320:16:8 400MHz 35W DDR3-1333双通道

A6-3410MX 四核心 1.6GHz 2.3GHz 4×1MB HD 6520G 320:16:8 400MHz 45W DDR3-1600双通道

A6-3420 四核心 1.5GHz 2.4GHz 4×1MB HD 6520G 320:16:8 400MHz 35W DDR3-1333双通道

A6-3430MX 四核心 1.7GHz 2.4GHz 4×1MB HD 6520G 320:16:8 400MHz 45W DDR3-1600双通道

A8-3500M 四核心 1.5GHz 2.4GHz 4×1MB HD 6620G 400:20:8 444MHz 35W DDR3-1333双通道

A8-3510MX 四核心 1.8GHz 2.5GHz 4×1MB HD 6620G 400:20:8 444MHz 45W DDR3-1600双通道

A8-3520M 四核心 1.6GHz 2.5GHz 4×1MB HD 6620G 400:20:8 444MHz 35W DDR3-1333双通道

A8-3530MX 四核心 1.9GHz 2.6GHz 4×1MB HD 6620G 400:20:8 444MHz 45W DDR3-1600双通道

A8-3550MX 四核心 2GHz 2.7GHz 4×1MB HD 6620G 400:20:8 444MHz 45W DDR3-1600双通道

4 机械装甲步兵

在《黑客帝国》中出现的人类用来对抗机器章鱼的APU(Armored Personal Units)这种机器需要人类来驾驶,其本身并没有人工智能。APU的外表给人以非常强壮的感觉,而其材质和表面的光泽带来一种冷冰冰的金属质感。APU的内部结构也是经过精心设计的,即使在现实中也能具有很高的可行性。因此这个机器人的形象无论从任何方面看起来都非常完美,必将成为科幻电影史上的一个经典。

APU分为两种,第一种是“第二次文艺复兴”之前的APU,这类APU的操作室呈封闭状态,主要作用是保护人类单兵,所以其进攻性能以及机甲能动性都较差。第二中是“复兴”之后改进型的APU,这类APU几乎取消了操作室保护盖,操作APU的人类单兵几乎暴露在外,但正因为少了复杂的防御设备,使得APU的重量大大减轻,进攻性和机甲能动性相对提升,同时,由于缺乏保护,这种APU的操作单兵常常给人一种“不成功则成仁”的壮烈感。

5 反扒同盟

英文:APU Anti-Pickpocket Union

这个标识的简要说明:

整体外形,由两个拟人化的相同箭头形状表示,在外形上达到一致,说明每个人先天都是平等公平的。没有差别。二只眼睛分别为心怀不轨和无限正义,在这场正义的演练中更形象地刻画出两个主角的特性。在色彩上采用红蓝两色。而红色代表激烈的冲突或是问题,蓝色代表天空大海的包容与冷静。正体现了扒手与反扒队员的特征。

整个标识外型简洁有张力,色彩靓丽,表达的意思非常鲜明。

6 声音处理器

声音处理器(Audio Processing Unit)是声卡上的处理器,可用来处理声音的数据,由于在现代的计算机中(特别是家用系统,游戏的发烧友)环绕声的处理变得越来越重要,需要一个专门的声音的核心处理器。

声存

声卡上的存储器。

例如,创新X-Fi Xtreme Music SB0460,这个声卡上就带有声存。容量为64M。低端声卡也有2M。声存的意义在于节省CPU资源和系统内存,还有玩FPS游戏的时候,系统把游戏声音缓存文件放入声存里,好让FPS游戏的声音播放访问更快速。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2024/11/16 4:22:26