总结性能结果

在实际的计算机设计中，人们必须评估无数的设计选择，以确定它们在一系列被认为是相关的基准中的相对的量化测试结果的收益。同样地，试图选择计算机的消费者将依赖于来自基准的性能评测，这些基准最好与用户的应用相似。在这两种情况下，拥有一套基准的测量结果是很有用的，这样重要的应用程序的性能就会与这套基准中的一个或多个基准相似，这样就可以理解性能的变化。在最好的情况下，该套件类似于应用空间的一个统计学上的有效样本，但这样的样本需要比大多数套件中通常发现的更多的基准，并且需要随机抽样，而基本上没有基准套件使用这种方法。

一旦我们选择用一个基准套件来测量性能，我们希望能够用一个独特的数字来总结该套件的性能结果。计算总结结果的一个简单方法是比较套件中程序的执行时间的算术平均值。另一种方法是给每个基准添加一个加权因子，并使用加权算术平均值作为总结性能的单一数字。一种方法是使用权重，使所有程序在某些参考计算机上的执行时间相等，但这使结果偏向于参考计算机的性能特征。

与其选择权重，我们可以通过将参考计算机上的时间除以被评测计算机上的时间来使执行时间规范化（normalization），从而产生一个与性能成正比的比率。SPEC采用了这种方法，将该比率称为SPECRatio。它有一个特别有用的属性，与我们在本文中对计算机性能进行基准测试的方式相匹配，即比较性能比率。例如，假设计算机A在一项基准测试中的SPECRatio是计算机B的1.25倍；那么我们知道：