计算机体系结构-量化研究方法(第六版)-汉化
  • 关于翻译
  • 前言
    • 我们为什么写这本书
    • 当前版本
    • 选材与组织
    • 内容概述
    • 阅读导览
    • 章节结构
    • 案例研究与习题
    • 补充材料
    • 帮助改进这本书
    • 结语
  • 第一章 量化设计和分析的基础知识
    • 摘要
    • 1.1 介绍
    • 1.2 计算机的类别
      • 物联网/嵌入式计算机
      • 个人移动终端
      • 桌面计算机
      • 服务器
      • 集群/数据仓库规模的计算机
      • 并行性和并行架构的类别
    • 1.3 计算机体系结构的定义
      • 指令集架构:计算机体系结构的“狭隘”观点
      • 名副其实的计算机体系结构:设计组织(Organization)和硬件以满足设计指标和功能需求
    • 1.4 技术趋势
      • 性能趋势:带宽的提升大于延迟
      • 晶体管性能和导线的扩大
    • 1.5 集成电路中功率和能耗的发展趋势
      • 电源和能耗,一个系统的视角
      • 微处理器内的能耗和功率
      • 由于能耗的限制,计算机架构的转变
    • 1.6 成本的发展趋势
      • 时间、数量和商品化的影响
      • 集成电路的成本
      • 成本与价格
      • 制造成本与运营成本
    • 1.7 可靠性
    • 1.8 评测、报告和总结性能
      • 基准评测
        • 桌面应用基准
        • 服务器应用基准
      • 报告性能结果
      • 总结性能结果
    • 1.9 计算机量化设计原则
      • 利用并行化的优势
      • 局部性原理
      • 关注常见情况
      • 阿姆达尔定律
      • 处理器性能方程
    • 1.10 把它们放在一起:性能、价格和功耗
    • 1.11 谬误和陷阱
    • 1.12 结论
    • 1.13 历史观点和引用
    • 案例研究和习题
  • 第二章 内存层次结构设计
  • 第三章 指令级并行及其应用
  • 第四章 矢量、SIMD和GPU架构中的数据级并行性
  • 第五章 线程级并行
  • 第六章 大规模数据中心级计算机的并行性:请求级并行(RLP)和数据级并行
  • 第七章 领域特定架构(DSA)
  • 附录A-指令集设计原则
  • 附录B-内存层次结构的回顾
    • 摘要
    • B.1 介绍
      • 缓存性能回顾
      • 四个内存层次的问题
      • 一个例子:Opteron的数据缓存
  • 附录C-流水线:初级和中级概念
  • 附录D-存储系统
  • 附录E-嵌入式系统
  • 附录F-多机互联
  • 附录G-深入向量处理器
  • 附录H-VLIW和EPIC的硬件和软件
  • 附录I-大规模多处理器和科学计算的应用
  • 附录J-计算机算数(Arithmetic)相关
  • 附录K-指令集架构的回顾
  • 附录L-地址翻译(Address Translation)的高级概念
  • 附录M-历史观点和参考文献
Powered by GitBook
On this page
  1. 前言

内容概述

Previous选材与组织Next阅读导览

Last updated 2 years ago

包括能效、静态功率、动态功率、集成电路成本、可靠性和可用性的公式。(这些公式也可以在封面内页找到。)我们希望这些主题可以贯穿本书的其他部分。除了计算机设计和性能测量的经典定量原则外,本书还展示了通用微处理器性能改进的缓慢过程,这也是特定领域架构(DSA)的一个灵感来源。

我们的观点是,与1990年相比,今天的指令集结构所起的作用较小,因此我们将这一材料移到了。它现在使用RISC-V架构。(为了快速回顾,RISC-V ISA的摘要可以在封面内页找到)。对于ISA的爱好者来说,为这个版本进行了修订,涵盖了8种RISC架构(5种用于桌面和服务器,3种用于嵌入式)、80×86、DEC VAX和IBM 360/370。

然后,我们在中转入内存的层次结构,因为很容易将成本-性能-功耗原则应用到这个问题中,而且内存是其余章节的关键资源。和过去的版本一样,包含了对高速缓存原理的介绍性回顾,可以在你需要的时候使用。讨论了缓存的10个高级优化技术。本章也将介绍虚拟机,它在保护、软件管理和硬件管理方面具有优势,并在云计算中发挥着重要作用。除了涵盖SRAM和DRAM技术外,该章还包括关于闪存和使用堆叠式芯片封装来扩展内存层次的资料介绍。PIAT的例子是用于PMD的ARM Cortex A8和用于服务器的Intel Core i7。

涉及高性能处理器中指令级并行的使用,包括超标量执行、分支预测(包括新的标记混合预测器)、推测、动态调度和同步多线程。如前所述,是对流水线的回顾,以防你需要它。还探讨了ILP的局限性。和一样,PIAT的例子还是ARM Cortex A8和Intel Core i7。虽然第三版包含了大量关于Itanium和VLIW的内容,但这些材料现在在附录H中,表明我们认为这种架构没有达到早期的要求。

游戏和视频处理等多媒体应用的重要性日益增加,这也提高了能够利用数据级并行性的架构的重要性。特别是,人们对使用图形处理单元(GPU)进行计算的兴趣越来越大,但很少有架构师了解GPU的真正工作原理。我们决定写一个新的章节,在很大程度上是为了揭开这种新式计算机架构的面纱。首先介绍了矢量架构,作为解释多媒体SIMD指令集扩展和GPU的基础。(本章介绍了Roofline性能模型,然后用它来比较英特尔酷睿i7和NVIDIA GTX 280和GTX 480 GPU。本章还介绍了用于PMD的Tegra 2 GPU。

介绍了多核处理器。它探讨了对称和分布式内存架构,研究了组织原则(organizational principles)和性能。本章的主要补充内容包括对多核组织的更多比较,包括多核多级缓存的组织、多核一致性方案和片上多核互连。接下来是同步和内存一致性模型方面的话题。例子是Intel Core i7。对互连网络更深入感兴趣的读者应阅读,对更大规模的多核处理器和科学计算感兴趣的读者应阅读。

介绍了数据仓库级计算机(Warehouse-Scale Computers, WSCs)。它在谷歌和亚马逊网络服务的工程师的帮助下进行了广泛的修订。本章整合了很少有架构师知道的关于WSCs的设计、成本和性能的细节。它从流行的MapReduce编程模型开始,然后描述了WSCs的架构和物理实现,包括成本。成本使我们能够解释云计算的出现,据此,在云中使用WSCs进行计算可能比在本地数据中心计算更便宜。PIAT的例子是对谷歌WSC的描述,其中包括本书中首次发布的信息。

新的激发了对特定领域架构(DSA)的需求。它在四个DSA实例的基础上得出了DSA的指导原则。每个DSA都对应于已经部署在商业环境中的芯片。我们还解释了为什么在通用微处理器的单线程性能停滞不前的情况下,我们期望通过DSA实现计算机架构的复兴。

涵盖了ISA的原理,包括RISC-V,描述了64位版本的RISC V、ARM、MIPS、Power和SPARC及其多媒体扩展。它还包括一些经典架构(80x86、VAX和IBM 360/370)和流行的嵌入式指令集(Thumb-2、microMIPS和RISCV C)。是相关的,因为它涵盖了VLIW ISA的架构和编译器。

如前所述,和是关于基本缓存和流水线概念的教程。对缓存比较陌生的读者应该在之前阅读,而对流水线比较陌生的读者应该在第三章之前阅读。

,"存储系统",扩充了如下内容:对可靠性和可用性的讨论,对RAID进行了指导性介绍,对RAID 6方案进行了描述,并对真实系统的故障统计数据进行了罕见的介绍。它继续提供了对排队理论和I/O性能基准的介绍。我们评估了一个真实集群的成本、性能和可靠性:互联网档案馆(Internet Archive)。“把它放在一起”的例子是NetApp FAS6000档案机。

Thomas M. Conte 撰写的,将嵌入式相关的材料整合到一个地方。

关于多机互联的,由Timothy M. Pinkston和José Duato修订。,最初由Krste Asanović撰写,包括对矢量处理器的描述。我们认为这两个附录是我们所知道的关于每个主题的一些最好的材料。

介绍了VLIW和EPIC,即Itanium的架构。

描述了并行处理的应用和更大规模的、共享内存多处理的一致性协议。,由David Goldberg撰写,描述了计算机算术。

Abhishek Bhattacharjee撰写的是新的,讨论了内存管理的高级技术,重点是对虚拟机的支持和对超大地址空间的地址转换设计。随着云计算处理器的增长,这些架构上的改进正变得越来越重要。

将每一章的 "历史观点和参考文献 "收集到一个附录中。它试图对每一章中的想法给予适当的肯定,并对围绕这些发明的历史有所了解。我们喜欢把这看作是介绍计算机设计的戏剧。它还提供了计算机体系结构的学生可能想要追求的参考资料。如果你有时间,我们建议阅读这些章节中提到的该领域的一些经典论文。直接从创作者那里听到这些想法,既愉快又有教育意义。"历史透视 "是以前版本中最受欢迎的部分之一。

第一章
附录A
附录K
第二章
附录B
第二章
第三章
附录C
第三章
第二章
第四章
第五章
附录F
附录I
第6章
第七章
附录A
附录K
附录H
附录B
附录C
第二章
附录B
附录C
附录D
附录E
附录F
附录G
附录H
附录I
附录J
附录L
附录M