请输入您要查询的百科知识:

 

词条 NVIDIA Tesla C1060
释义

概论

NVIDIA Tesla(特斯拉)是NVIDIA继专业加速卡QUADRO及娱乐图形卡GeForce系列后,推出的一个全新的产品线,主要应用于于广大科学研究的高性能计算需求。Tesla是一位拥有700多项专利的著名科学家,交流电和无线电的创始人,变压器和交流电动机的发明人,提出了低损耗高压电传输的概念。高中物理课本中磁感应密度的单位就是特斯拉!

TESLA的主要特色包括有:

* 业界第一个拥有128个运算处理核心的大量多执行绪架构

* 采用C语言的绘图处理器开发环境

* 提供完整的开发工具套件(C语言编码器、除错器、性能分析工具、最佳化的链接库)

* 最大规模的GPU运算独立软件开发(ISV)伙伴社群

* 配合现有HPC环境完美运作

NVIDIA Tesla C1060在一个计算机工作站上供了一个小型计算机集群的计算能力,支持向高效利用能源的并行计算能力的转化。NVIDIA® Tesla™ C1060 可将工作站转变成一个性能远超小型集群的高性能计算机。它的计算能力甚至超过了一个小的计算机集群。这在技术专业人员的桌边为他们提供了一个专用的计算资源,与在数据中心中的共享计算机集群相比,NVIDIA®(英伟达™) Tesla™ C1060性能更强,消耗的能源更少。Tesla C1060基于大规模并行的多核Tesla处理器。该处理器与标准的CUDA C语言编程环境紧密结合以简化多核心编程。

特性

基于新一代Fermi CUDA架构的GPU  与基于最新四核CPU的纯CPU系统相比,该GPU以十分之一的成本和二十分之一的功耗即可实现同等的集群性能。

448个CUDA核心  每颗GPU最高可实现515 Gigaflop双精度峰值性能,从而让一台工作站即可实现Teraflop级甚至更高的性能。每颗GPU的单精度峰值性能超过1 Teraflop。

ECC存储器  能够满足工作站计算精度与可靠性方面的关键需求。能够为存储器中的数据提供保护功能,从而为应用程序增强数据完整性和可靠性。寄存器文件、L1/L2高速缓存、共享存储器以及DRAM均受ECC的保护。

台式机上的集群性能  与一个小型服务器集群相比,配备多颗GPU的单台工作站能够更快地解决大型难题。

每颗GPU最多配备6GB GDDR5存储器  更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况。

NVIDIA®(英伟达™)并行DataCache™ 能够为物理效果解算器、光线追踪以及稀疏矩阵乘法等诸多算法加速,在这些算法中,数据地址事先都是未知的。每个流式多处理器模块均包含一个可配置的L1高速缓存,所有处理器核心使用统一的L2高速缓存。

NVIDIA®(英伟达™)GigaThread™引擎  通过多项技术实现了吞吐量的最大化,其中包括10倍于上一代架构的高速上下文切换、并发内核执行以及改良的线程块调度。

异步传输  计算核心在PCIe总线上传输数据的同时还能够处理其它数据,因而增强了系统性能。即便是地震处理这类需要大量数据传输的应用程序,也能够通过事先将数据传输至本地存储器的方法来最大限度提升计算效率。

CUDA编程环境受到各种编程语言与API的广泛支持  开发人员无论选择C语言、C++、OpenCL、DirectCompute还是选择Fortran语言,都能够实现应用程序的并行机制,进而利用“Fermi”GPU的创新架构。Microsoft Visual Studio开发人员可以使用NVIDIA®(英伟达™)Parallel Nsight工具。

高速PCIe Gen 2.0数据传输率  实现了主系统与Tesla处理器之间带宽的最大化。让Tesla系统能够应用于几乎所有具备一条开放式PCIe x16插槽且符合PCIe规范的主系统。

规格

尺寸规格  9.75英寸PCIe x16规格

Tesla GPU的数量  1

CUDA核心数量  448

CUDA核心频率  1.15 GHz

双精度浮点性能(峰值)  515 Gflops

单精度浮点性能(峰值)  1.03 Tflops

专用存储器总容量*
Tesla C2050
Tesla C2070 3GB GDDR5
6GB GDDR5

存储器频率  1.5 GHz

存储器接口  384位

存储器带宽  144 GB/秒

功耗
Tesla C2050 238W热设计功耗

系统接口  PCIe x16 Gen2

散热解决方案  主动式风扇散热器

显示器支持
Dual-Link DVI-I
显示器最大分辨率@ 60Hz 
1
2560x1600

软件开发工具  CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
针对Visual Studio的NVIDIA®(英伟达™)Parallel Nsight™*注:在开启ECC功能的情况下,专用存储器中的一部分将用于ECC数据,因此用户可用存储器容量将减少12.5%。(例如总容量为3 GB的存储器将仅能为用户提供2.68 GB的可用容量。)

杂项

该卡详细参数如下:

规格 10.5" x 4.376", 双槽

Tesla GPU数量 1

流处理器内核数量 240

处理器内核频率 1.296 Ghz

单精度浮点性能 933 GFlops

双精度浮点性能 78 GFlops

浮点精度 支持IEEE 754单精度和双精度浮点数

专用显存总容量 4 GB

内存频率 800 MHz

显存位宽 512位 GDDR3

显存带宽 102 GB/秒

最大功耗 187.8瓦

系统接口 PCI Express x16 (二代)

辅助电源 连接器 两个六针或一个八针

散热方案 主动风扇散热器

编程环境 CUDA

特性 优势

大规模并行多核架构,有240个处理核心 在您的工作站上即可解决以前需要用大型计算机集群来运算的计算难题

4 GB高速存储器 支持更大数据集的本地存储,充分利用存储器高达102GB/s的传输速度,把系统中的数据移动需求降到最低。

广为接受,易于学习的CUDA C语言编程环境 简洁高速的应用程序并行机制可充分利用GPU(图形处理器)的多核架构

可扩展到多个GPU(图形处理器)以及达到上千个处理器内核的性能 通过扩展到多个GPU(图形处理器)上的数千个核心,来解决大规模的问题

IEEE 754单精度和双精度浮点单元 在一块芯片上获得最高的浮点运算性能,同时满足你的程序对精确度的需求

异步传输能力 可以在计算的同时进行数据传输,从而进一步提高系统性能

从GPU(图形处理器)到板载显存可达512位显存位宽 高速GDDR3显存、512位显存位宽以及102 GB/秒的显存带宽可实现超高的数据传输速度

共享数据内存 利用低延迟的存储器,各处理器内核群组可以紧密合作

高速、PCI-Express 2.0数据传输 CPU与GPU(图形处理器)之间的通信速度快、带宽高

Tesla GPU(图形处理器)产品拥有多种规格 Tesla工作站和1U系统可以适应很广泛的部署环境

随便看

 

百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。

 

Copyright © 2004-2023 Cnenc.net All Rights Reserved
更新时间:2025/3/22 6:25:13