计算机体系结构-量化研究方法(第六版)-汉化
  • 关于翻译
  • 前言
    • 我们为什么写这本书
    • 当前版本
    • 选材与组织
    • 内容概述
    • 阅读导览
    • 章节结构
    • 案例研究与习题
    • 补充材料
    • 帮助改进这本书
    • 结语
  • 第一章 量化设计和分析的基础知识
    • 摘要
    • 1.1 介绍
    • 1.2 计算机的类别
      • 物联网/嵌入式计算机
      • 个人移动终端
      • 桌面计算机
      • 服务器
      • 集群/数据仓库规模的计算机
      • 并行性和并行架构的类别
    • 1.3 计算机体系结构的定义
      • 指令集架构:计算机体系结构的“狭隘”观点
      • 名副其实的计算机体系结构:设计组织(Organization)和硬件以满足设计指标和功能需求
    • 1.4 技术趋势
      • 性能趋势:带宽的提升大于延迟
      • 晶体管性能和导线的扩大
    • 1.5 集成电路中功率和能耗的发展趋势
      • 电源和能耗,一个系统的视角
      • 微处理器内的能耗和功率
      • 由于能耗的限制,计算机架构的转变
    • 1.6 成本的发展趋势
      • 时间、数量和商品化的影响
      • 集成电路的成本
      • 成本与价格
      • 制造成本与运营成本
    • 1.7 可靠性
    • 1.8 评测、报告和总结性能
      • 基准评测
        • 桌面应用基准
        • 服务器应用基准
      • 报告性能结果
      • 总结性能结果
    • 1.9 计算机量化设计原则
      • 利用并行化的优势
      • 局部性原理
      • 关注常见情况
      • 阿姆达尔定律
      • 处理器性能方程
    • 1.10 把它们放在一起:性能、价格和功耗
    • 1.11 谬误和陷阱
    • 1.12 结论
    • 1.13 历史观点和引用
    • 案例研究和习题
  • 第二章 内存层次结构设计
  • 第三章 指令级并行及其应用
  • 第四章 矢量、SIMD和GPU架构中的数据级并行性
  • 第五章 线程级并行
  • 第六章 大规模数据中心级计算机的并行性:请求级并行(RLP)和数据级并行
  • 第七章 领域特定架构(DSA)
  • 附录A-指令集设计原则
  • 附录B-内存层次结构的回顾
    • 摘要
    • B.1 介绍
      • 缓存性能回顾
      • 四个内存层次的问题
      • 一个例子:Opteron的数据缓存
  • 附录C-流水线:初级和中级概念
  • 附录D-存储系统
  • 附录E-嵌入式系统
  • 附录F-多机互联
  • 附录G-深入向量处理器
  • 附录H-VLIW和EPIC的硬件和软件
  • 附录I-大规模多处理器和科学计算的应用
  • 附录J-计算机算数(Arithmetic)相关
  • 附录K-指令集架构的回顾
  • 附录L-地址翻译(Address Translation)的高级概念
  • 附录M-历史观点和参考文献
Powered by GitBook
On this page
  1. 第一章 量化设计和分析的基础知识
  2. 1.5 集成电路中功率和能耗的发展趋势

由于能耗的限制,计算机架构的转变

Previous微处理器内的能耗和功率Next1.6 成本的发展趋势

Last updated 2 years ago

随着晶体管改进速度的减慢,计算机设计师必须从其他地方寻找改进的能源效率。事实上,考虑到能源预算,今天很容易设计出具有如此多晶体管的微处理器,以至于它们无法同时开启。这种现象被称为 "暗硅",即由于热限制,芯片的大部分在任何时候都不能被使用("暗")。这一观察促使建筑师们重新审视处理器设计的基本原理,以寻求更高的能源成本性能。

图1.13列出了现代计算机构件的能量成本和面积成本,显示了令人惊讶的大比率。例如,32位浮点加法的能耗是8位整数加法的30倍。面积差异甚至更大,为60倍。然而,最大的差异是在内存方面;32位DRAM访问所需的能量是8位加法的2万倍。一个小型的SRAM比DRAM的能量效率高125倍,这表明谨慎使用缓存和内存缓冲器的重要性。

每个任务能量最小化的新设计原则与图1.13中的相对能量和面积成本相结合,激发了计算机体系结构的新方向,我们将在介绍。特定领域的处理器通过减少宽泛的浮点运算和部署特殊用途的存储器以减少对DRAM的访问来节省能量。它们利用这些节省的能量来提供比传统处理器多10-100个(更窄的)整数运算单元。虽然这种处理器只执行有限的任务,但它们执行这些任务的速度明显比通用处理器快,而且更节能。

就像医院里有普通医生和医疗专家一样,在这个能源意识的世界里,计算机很可能是可以执行任何任务的通用内核和能极好地完成少数事情甚至更便宜的特殊用途内核的组合。

第七章
图 1.13 Comparison of the energy and die area of arithmetic operations and energy cost of accesses to SRAM and DRAM. [Azizi][Dally]. Area is for TSMC 45 nm technology node.