“NVIDIA Tesla C2050”的意思、由来-中文百科全书

概论

NVIDIA®（英伟达™）Tesla™ C2050与C2070计算处理器能够推动整个行业向并行计算的过渡，为台式机带来了小型集群般的性能。Tesla GPU的20系列产品家族基于代号为“Fermi”的下一代CUDA架构，支持技术与企业计算所“必备”的诸多特性，其中包括C++支持、可实现极高精度与可扩展性的ECC存储器以及7倍于Tesla 10系列GPU的双精度性能。Tesla™ C2050与C2070 GPU旨在重新定义高性能计算并实现超级计算的平民化。

与最新的四核CPU相比，Tesla C2050与C2070计算处理器以十分之一的成本和二十分之一的功耗即可实现同等超级计算性能。

特性

基于新一代Fermi CUDA架构的GPU 　与基于最新四核CPU的纯CPU系统相比，该GPU以十分之一的成本和二十分之一的功耗即可实现同等的集群性能。

448个CUDA核心　每颗GPU最高可实现515 Gigaflop双精度峰值性能，从而让一台工作站即可实现Teraflop级甚至更高的性能。每颗GPU的单精度峰值性能超过1 Teraflop。

ECC存储器　能够满足工作站计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能，从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。

台式机上的集群性能　与一个小型服务器集群相比，配备多颗GPU的单台工作站能够更快地解决大型难题。

每颗GPU最多配备6GB GDDR5存储器　更大的数据集能够保存在直接附属于GPU的本地存储器上，从而实现了性能的最大化并减少了数据传输的情况。

NVIDIA®（英伟达™）并行DataCache™　能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速，在这些算法中，数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存，所有处理器核心使用统一的L2高速缓存。

NVIDIA®（英伟达™）GigaThread™引擎　通过多项技术实现了吞吐量的最大化，其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。

异步传输　计算核心在PCIe总线上传输数据的同时还能够处理其它数据，因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序，也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。

CUDA编程环境受到各种编程语言与API的广泛支持　开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言，都能够实现应用程序的并行机制，进而利用“Fermi”GPU的创新架构。Microsoft Visual Studio开发人员可以使用NVIDIA®（英伟达™）Parallel Nsight工具。

高速PCIe Gen 2.0数据传输率　实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCIe x16插槽且符合PCIe规范的主系统。

规格

尺寸规格　9.75英寸PCIe x16规格

Tesla GPU的数量　1

CUDA核心数量　448

CUDA核心频率　1.15 GHz

双精度浮点性能（峰值）　515 Gflops

单精度浮点性能（峰值）　1.03 Tflops

专用存储器总容量*
Tesla C2050
Tesla C2070　3GB GDDR5
6GB GDDR5

存储器频率 　1.5 GHz

存储器接口　384位

存储器带宽　144 GB/秒

功耗
Tesla C2050　238W热设计功耗

系统接口　PCIe x16 Gen2

散热解决方案　主动式风扇散热器

显示器支持
Dual-Link DVI-I
显示器最大分辨率@ 60Hz　
1
2560x1600

软件开发工具　CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
针对Visual Studio的NVIDIA®（英伟达™）Parallel Nsight™*注：在开启ECC功能的情况下，专用存储器中的一部分将用于ECC数据，因此用户可用存储器容量将减少12.5%。（例如总容量为3 GB的存储器将仅能为用户提供2.68 GB的可用容量。）

词条	NVIDIA Tesla C2050
释义	概论特性规格概论 NVIDIA®（英伟达™）Tesla™ C2050与C2070计算处理器能够推动整个行业向并行计算的过渡，为台式机带来了小型集群般的性能。Tesla GPU的20系列产品家族基于代号为“Fermi”的下一代CUDA架构，支持技术与企业计算所“必备”的诸多特性，其中包括C++支持、可实现极高精度与可扩展性的ECC存储器以及7倍于Tesla 10系列GPU的双精度性能。Tesla™ C2050与C2070 GPU旨在重新定义高性能计算并实现超级计算的平民化。与最新的四核CPU相比，Tesla C2050与C2070计算处理器以十分之一的成本和二十分之一的功耗即可实现同等超级计算性能。特性基于新一代Fermi CUDA架构的GPU 　与基于最新四核CPU的纯CPU系统相比，该GPU以十分之一的成本和二十分之一的功耗即可实现同等的集群性能。 448个CUDA核心　每颗GPU最高可实现515 Gigaflop双精度峰值性能，从而让一台工作站即可实现Teraflop级甚至更高的性能。每颗GPU的单精度峰值性能超过1 Teraflop。 ECC存储器　能够满足工作站计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能，从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。台式机上的集群性能　与一个小型服务器集群相比，配备多颗GPU的单台工作站能够更快地解决大型难题。每颗GPU最多配备6GB GDDR5存储器　更大的数据集能够保存在直接附属于GPU的本地存储器上，从而实现了性能的最大化并减少了数据传输的情况。 NVIDIA®（英伟达™）并行DataCache™　能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速，在这些算法中，数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存，所有处理器核心使用统一的L2高速缓存。 NVIDIA®（英伟达™）GigaThread™引擎　通过多项技术实现了吞吐量的最大化，其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。异步传输　计算核心在PCIe总线上传输数据的同时还能够处理其它数据，因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序，也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。 CUDA编程环境受到各种编程语言与API的广泛支持　开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言，都能够实现应用程序的并行机制，进而利用“Fermi”GPU的创新架构。Microsoft Visual Studio开发人员可以使用NVIDIA®（英伟达™）Parallel Nsight工具。高速PCIe Gen 2.0数据传输率　实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCIe x16插槽且符合PCIe规范的主系统。　规格尺寸规格　9.75英寸PCIe x16规格 Tesla GPU的数量　1 CUDA核心数量　448 CUDA核心频率　1.15 GHz 双精度浮点性能（峰值）　515 Gflops 单精度浮点性能（峰值）　1.03 Tflops 专用存储器总容量* Tesla C2050 Tesla C2070　3GB GDDR5 6GB GDDR5 存储器频率　1.5 GHz 存储器接口　384位存储器带宽　144 GB/秒功耗 Tesla C2050　238W热设计功耗系统接口　PCIe x16 Gen2 散热解决方案　主动式风扇散热器显示器支持 Dual-Link DVI-I 显示器最大分辨率@ 60Hz　 1 2560x1600 软件开发工具　CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。针对Visual Studio的NVIDIA®（英伟达™）Parallel Nsight™*注：在开启ECC功能的情况下，专用存储器中的一部分将用于ECC数据，因此用户可用存储器容量将减少12.5%。（例如总容量为3 GB的存储器将仅能为用户提供2.68 GB的可用容量。）
随便看	回回新桥回回营回回营村回回营清真寺回回原来回回寨回魂60天回魂大法回魂妻回魂日回魂神探回火二次硬化回火现象回火油回惑回极回忌回家V1.03 回家：2008南方冰雪纪实回家：卷1 回家：学者系列回家吃饭的智慧2:妈妈传给我的饮食偏方回家吃饭的智慧·妈妈留给我的饮食秘方回家吃饭的智慧·妈妈留给我的饮食秘方回家吃饭的智慧：妈妈留给我的饮食秘方李周福烈士李周行烈士李周魁烈士李命乾烈士李和李和冬烈士李和圣烈士李和宝李和宾烈士李和忠烈士李和森李和棺石刻李和水烈士李和禄烈士李咏李咏娴李咏森李咪眼子烈士李咸太烈士李咸松烈士李咸泰烈士李咸禾烈士李咸醮烈士李咸阳李品仙