在标准模型(没有开销)中,解决问题所需的总时间随着 N 函数单调递减,逐渐接近 Ts。在修改后的公式中,可以明显看出,随着 N 的增加,由于出现通信开销,解决问题所需的总时间将开始增加。在上述的简单示例中,可以根据以下公式定义完全并行的应用 (Ts=0) 所需处理器的最优数量:

由此,举例来说,若 To 是 Tp 的 1%,则可以使用 10 个处理器获得最大性能。是否将此作为一个重要设计点,将取决于其他性能与性能价格比指标的相对重要性。
3.3. 市场问题
即将推出的多核芯片与 RISC SMP极其相似 —— 在过去的 10 年中,RISC SMP 市场的硬件收入超过 2400 亿美元。
与 1990 年代中期的 RISC SMP 一样,这些多核心处理器具备易于使用、内置缓存、共享内存的特性,不同的是,多核心处理器是在单一芯片中实现这些特性。
1995 年前后,SGI POWER Challenge 是中端市场中最畅销的 HPC 服务器 —— 笔者之一(McCalpin)当年就曾花费近 40 万美元购买了一个配备 8 个 CPU 的系统。在 1996 到 1997 年,CPU 主频为 90 MHz (11 ns),主内存延迟接近 1000 ns,或 90 个时钟周期。2007 年,四核 AMD 处理器的频率超过 2 GHz (0.5 ns),主内存延迟约为 55 ns,或者 110 个时钟周期。这些比例都惊人的相似。
SGI要在Power Challenge上提供充足的内存带宽是一项艰巨的“挑战”(这里的双关令人遗憾)。一个配备 8 个 CPU 的SGI POWER Challenge 的最高浮点性能为 2.88 GFLOPS,最高内存带宽达到 1.2 GB/s,约为 0.42 字节/FLOP。而AMD即将推出四核Barcelona处理器的最高浮点性能约为 32 GFLOPS、最高内存带宽达到约 12.8 GB/s,也是大约 0.4 字节/FLOP的比例。
到1996 年,UNIX 服务器市场的硬件收入超过 220 亿美元,而到 2000 年,该收入提高到近 330 亿美元。之后,该市场一直在萎缩,2006 年,已下滑至 180 亿美元左右。
以下 3 个因素共同导致了市场萎缩:
- 越来越难以保持最初使UNIX服务器获得成功的系统平衡,
- 大规模RISC SMP 难以和小型RISC SMP一样,能不断降低CPU的平均价格,
- AMD推出了基于 IA32 架构、价格更便宜的服务器,进而令基于AMD64 架构的产品在2003年快速推出。
对这三个因素的详细分析也很耐人寻味。
|