词条 | FLOPS |
释义 | 含义FLOPS,是“每秒所执行的浮点运算次数”(floating-point operations per second) 的缩写。 它常被用来估算电脑的执行效能,尤其是在使用到大量浮点运算的科学计算领域中。 正因为 FLOPS 字尾的那个 S,代表秒,而不是复数,所以不能省略掉。 在这里所谓的“浮点运算”,实际上含括了所有渉及小数的运算。 这类运算在某类应用软件中常常出现,而它们也较整数运算花时间。 其他现今大部分的处理器中,都有一个专门用来处理浮点运算的“浮点单元”(FPU)。也因此 FLOPS 所量测的,实际上就是 FPU 的执行速度。而最常用来测量 FLOPS 的基准程序 (benchmark) 之一,就是 Linpack。 1GHz 就是每秒 十亿次 运算,如果每次运算能完成两个浮点操作,就叫 2G FLOPS(每秒二十亿次浮点操作)。现在家用的双核计算机通常都能达到每秒 五十亿次运算(2*2.5GHz)左右的水平,浮点性能大约是上百亿次浮点操作。 超级计算机发展得很快,目前划分超级计算机的门槛是“每秒一万亿次浮点操作”,是家用微机的一百倍以上,几年以后这个门槛预计会提高到十万亿次。 超级计算机几十、上百万亿次的 FLOPS 也是靠多个处理器(通常还是多核)堆起来的,比如的IBM Roadrunner (走鹃,一种喜欢在地上飞快地走的小鸟)有 6562 个 AMD Opteron 双核处理器,12240 个 PowerX Cell 8i 处理器, 其中主要的浮点运算能力是由 Cell 处理器提供的, 每个 Cell CPU 包括 8 个浮点处理核心,你可以理解为 8 核。 (Cell也是 Sony PS3 游戏机的处理器,不过用于PS3的比用于超级计算机的要次一等) 总体来看,就是 2 * 6562 = 13124 个通用处理器核心; 8 * 12240 = 97920 个专用处理器核心。 你说这么多钱堆出来的这么十多万个核心,速度能不快吗? 它的速度是 1.026 P FLOPS, 也就是每秒超过 一千万亿次 浮点操作 单位换算1Pflops=10^3Tflops=10^6Gflops GPU的运算能力当今的第一 GTX690 CUDA处理器核心 3072 基础频率(MHz) 915 提升频率(MHz) 1019 纹理填充速率(billion/sec)234 曾今的第一 HD 6990 拥有3840(1920*2)个流处理单元,单精度浮点运算能力达到惊人的6TLOPs, 双精度浮点运算能力也有1.5TFLOPs 截止至 2009.11.21 当今最强的 GPU 排名如下 顺序----GPU/CPU----FLOPS 1----ATI 5970----4.64(T) 2----ATI 5870----2.72(T) 3----ATI 4870x2----1.2 x 2(T) 4----ATI 5850----2.09(T) 5----GTX 295----0.894 x 2(T) 6----ATI 5770/4890----1.36(T) 7----ATI 4870----1.2(T) 8----GTX 285----1.06(T) 9----ATI 5750----1.008(T) 10----ATI 4850----1(T) 11----ATI 4770----0.96(T) ... N----ATI 4830----0.736(T) ... N----Core i7 965----0.00756(T) |
随便看 |
百科全书收录4421916条中文百科知识,基本涵盖了大多数领域的百科知识,是一部内容开放、自由的电子版百科全书。