请输入您要查询的百科知识:

 

词条 GeForce 200
释义

GeForce 200系列,代号D10U,是NVIDIA的第十代GeForce显示芯片,NVIDIA称GTX 200核心采用了第二代的统一架构。相对第一代,显示核心除了专注立体效能的提升外,更专注非传统的GPU应用。NVIDIA认为,随着GPU的效能愈来愈大,可应用的范围再不局限于立体计算,而GPU绝对有能力取代CPU,成为高效能运算的工具。为了凸显第二代统一架构的功能,NVIDIA将显卡的命名法则改变,不再是GeForce加上代表世代的数字。而是GeForce GTX、GeForce GT、GeForce GS和GeForce G。它们分别代表旗舰级、高端、中端和入门。

首个产品GeForce GTX 280于2008年6月16日推出,是一款高端产品。随后推出了中端的GTX 260。GTX 200系列拥有 65nm 制程的高阶 D10U。与AMD不同,NVIDIA依然先推出单核心的旗舰级显卡,再将其功能削减,成为中低端的显卡。面对着对手AMD的Radeon R700显示核心,GTX 200显示核心显得太复杂和成本高,不能与之有效竞争。所以NVIDIA即时将GeForce 9800 GTX降价,并提升其制程至55nm,再推出GeForce 9800 GTX+显卡。有消息指在2009年1月8日开幕的CES 2009电子大展推出55nm版本的GT206核心及两款新卡GTX285、GTX295。

②架构

NVIDIA称第二代的统一架构,效能是上一代的1.5倍。核心的代号是D10U,采用65nm制程,拥有14亿个晶体管。是第一款显示核心的晶体管数量突破十亿大关,但是它仍然不支援DirectX 10.1和Smart Shader 4.1。最能反映实际性能的流处理器方面,由上一代的128个,提升到240个。另外,它支援双精度和64位元浮点运算。

第二代统一架构

在GTX 280显示核心中,总共有十个流处理器阵列。每个阵列中有24个流处理器,当中又以8个为一组。每一组流处理器都拥有独立的本地内存,亦即是8个流处理器共享1个本地内存。本地内存的容量由16KB提升到32KB。另外,每一个阵列都有其独立的L1缓冲内存,亦即是24个流处理器共享一个L1缓冲内存。加起来,GTX 280核心拥有240个流处理器。

GTX 200有两个计算模式。一个是绘图模式,另一个是并行处理模式。比较特别的是线程排序器,当线程在读写内存的时候,为了不耽误整个计算,会直接计算另一项资料。这样可以提升并行处理的效率,提升GPGPU的效能。

自上一代的G80开始,NVIDIA已放弃采用SIMD架构,改用全新的MIMD架构。在G80显示核心中,所有的流处理器都是1D标量形式。NVIDIA认为这样做最有效率,因为不用再顾忌数据是1D抑或是4D,所有的数据都会分折成标量1D。而对手AMD的显示核心,依然是4D+1D架构。虽然NVIDIA的做法效率较高,但成本和复杂度亦较高,比较难大幅增加流处理器的数量,因为每一个流处理器都需要一个指令发射端口。而AMD的显示核心方面,由于一个4D+1D的流处理器才需要一个指令发射端口,所以比较容易提升处理器的数量。

流处理器

上一代的G80核心中,每一个流处理器阵列有两组流处理器。而在GTX 200系列显示核心中,阵列数量提升为3组。每组流处理器的可执行线程数量,亦由768条提升列1024条。另外,每一个阵列都有8个纹理单元。

ROP

数量和效率都有所提升,有效改善AA性能。

缓存

8个流处理器会共享32KB的本地内存;而3组总共24个流处理器会共享一个L1缓存,减少对外部内存的依赖。

显示内存

每一个显示内存控制器的带宽是64-bit,而GTX 280核心有8个控制器,总共的带宽是512-bit。容量方面,由512MB提升到1GB。

③其他技术

PhysX物理引擎

2008年2月,NVIDIA收购了AGEIA公司,取得有关的PhysX物理引擎技术。过去,该引擎必须以自家的物理加速卡作硬件加速,或者以CPU作软件加速。随着NVIDIA收购AGEIA,公司己着手改装有关引擎,使之可以透过显示核心加速该引擎。现在,NVIDIA已推出用于显卡加速的PhysX物理引擎驱动程式,在3DMark Vantage的测试中,CPU的得分受惠于显示核心硬件加速了物理引擎,分数大幅上升。但采用该引擎的游戏始终较少,分数能否反映事实仍是未知之数。

对手AMD则采用了Havok物理引擎作为解决方案。现时,Havok是Intel的子公司。而Havok亦答应将为其物理引擎,优化AMD的CPU和GPU。包括最新的Phenom处理器和Radeon R700显卡。

CUDA

NVIDIA认为,流处理器的地位可与CPU核心作比较。而一颗显示核心,有多个的流处理器,使到显卡非常适合作并行计算之用。NVIDIA有另一个产品线-NVIDIA Tesla,就是将显示核心包装为GPGPU产品。用来加速或者计算通用计算,亦即是非单纯立体计算。CUDA可以让程式员使用C语言,来使用显示核心作为加速器。对手AMD认为,CUDA始终是闭源产品,并不会取得成功,所以推荐使用者使用另一个标准-OpenCL。有趣的是,NVIDIA同样是参与了该计划。

对于家用者来说,CUDA可以用来加速高清视频的编码。NVIDIA报称效率是利用CPU的20倍,纵使某些算法仍然是交由CPU处理,使到CPU使用率仍然维持20%左右。亦说明显示核心并不是可以处理所有的算法。另外,Folding@home科学计算项目已开始支援NVIDIA的显卡。

Hybrid SLI

配合NVIDIA的AMD平台芯片组,例如780a或者750a芯片组,就可以启动Hybrid SLI功能。在闲置的时候,独立显卡会完全关闭,只启动整合式显示核心,这样就可以达到节能的效果。

PowerPlay

在不同的模式下,GPU会根据实际使用率去自行调整核心频率。另外,某些不在使用中的模块可以关闭,以节省电源。

④产品系列

第一次发布

GeForce GTX 280

已停产。核心拥有240个流处理器,显示内存带宽是512-bit,显存为1GB GDDR3。

GeForce GTX 260

定位是中高端显卡,部分厂商己下调其价格到150美元,用作与Radeon HD 4870竞争。核心的流处理器数量下降至192个,显示内存带宽是448-bit。随后,为了对抗Radeon HD 4870,NVIDIA会推出新版本的GTX 260核心,流处理器数量上升至216个,而厂商一般会使用GTX 260+作为型号以作分辨。

第二次发布

GeForce GTX 295

最新旗舰级。GeForce GTX 295拥有两颗55nm GT206显示核心,产品设计与GeForce 9800GX2相近。两核心合共拥有480个流处理器,配备1792MB的GDDR3显存,位宽896-bit,核心频率为576MHz,核心频率为1242MHz,显存频率为1998MHz〈DDR 999MHz〉[2]。整卡功耗达289W,需要1个6pin及1个8pin外接供电接口。卡上提供了一个SLI桥接接口,用作支援双卡并联的Quad SLI模式。

GeForce GTX 285

相当于GTX 280的55nm GT206核心版本。同样拥有240个流处理器、512-bit显存位宽和1GB GDDR3显存。显存频率未确定,但估计比GTX 280为高。功耗由GTX 280的236W降至183W,并只需要2个6pin外接供电接口。

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/2/24 21:31:52