程式執行的平行度會對cache的penalty造成不少影響
所以不見得可以很單純從cache架構上看出優劣
不過有幾點是必定的取向
1. 降低cache miss機率
2. 減少cache存取的平均時間
所以 cache的分層速度與大小往上提升是一定要的
但是cache越大,搜尋的耗電與速度就會趨向不好的影響
也會造成佈局設計上的困擾
不然直接做個6M的register file不是更帥
記憶體的頻率是拉升的沒錯
可是存取不單看頻率,還要看花費的週期數
同等頻率的L3跟DDR2 or DDR3一定是不同的存取結果
另外不同level的cache間可能會有non-blocking跟queue的類似設計(CPU對cache也有)
所以真的要去算penalty....還不如直接看結果
甚至每次跑相同的程式還會有不同的結果 (時差問題)