關於AMD推土機在Win8下表現較好?以及效能倍增補丁?

fpe wrote:
關於紅字的部份要參考"亂序執行(Out-Of-Order Execution)"架構


亂序執行的重要依據是把所有待發送指令先加以整理
然後把 "可以先執行的指令" 分送至各個電路加以處理 :

也就是說, 若這排指令裡面有 A B C D E F G

A 與 B 相依, B 與 G 相依, D 與 F 相依, 但 A與B與G 跟 D與F 不相依

則可以先執行 A , C , D , E 四個指令

其後 A , D 指令出來後再執行 B 及 F , 並在 B 結果出來後再執行 G

在空間與處理單元設定為兩個核心處理情況下
亂序執行的組合可以為此 :

Core1 : A , B , C , G
Core2 : D , E , F , -

或其他排列... 但無論如何, 需要至少四個單位時間

可是若沒有亂序執行來排列的話...
就可能會形成這樣 :

Core1 : A , B , C , E , G
Core2 : B , B , D , F , -

其中 Core2 會出現兩個 B 是因為第一個 B 與 A 依存,
Core1 尚未給出 A 的結果, Core2 手上的 B 就必須等待到 A 完成才能做 B ...
因此整體就會形成了五個單位時間的等待

亂序執行的概念上應該是這樣

但還是逃不了一定得面對的 A 與 B 依存性的問題...
這也是將所有運算平行化為何極端困難的原因.


Y大只能在01陪我們這些鄉民打打嘴砲實在是太委屈了
這麼好的構想,AMD怎不採用,INTEL怎麼還沒把Y大給挖過去呢
i_stuck wrote:
這麼好的構想,AMD怎不採用,INTEL怎麼還沒把Y大給挖過去呢。...(恕刪)

您好像誤會了中文裡面"構想"的意義,可以翻中文辭典溫故一下....AMD去年2010就已經在跟微軟共同商討針對推土機的作業系統端改善,雖然說錯過了今年初的Win7 SP1、得到明年2012的Win8才會發生....

AMD官網 : Bulldozer 20 Questions, Part 2. August 30, 2010

=========================================================================================
[Question] “Is there any”programmable-tangible” improvement in synchronization between cores in the same module? In other words, will I get tangible performance improvement if I can partition my multi-threaded algorithm to pairs of closely interacting threads, and schedule each pair to a module?” – Edward Yang

[Answer] That is a very interesting question.

For the majority of software, the OS will work in concert with the processor to manage the thread to core relationships. We are collaborating with Microsoft and the open source software community to ensure that future versions of Windows and Linux operating systems will understand how to enumerate and effectively schedule the Bulldozer core pairs. The OS will understand if your machine is setup for maximum performance or for maximum performance/watt which takes advantage of Core Performance Boost.

However, let’s say you want to explore if you can get a performance advantage if your threads were scheduled on different modules. The benefit you can gain really depends on how much sharing the two threads are going to do.

Since the two integer cores are completely separate and have their own execution clusters (pipelines) you get no sharing of data in the L1 – and there is no specific optimizations needed at the software level. However, at the L2 cache level there could be some benefits. A shared L2 cache means that both cores have access to read the same cache lines – but obviously only one can write any cache line at any time. This means that if you have a workload with a main focus of querying data and your two threads are sharing a data set that fits in our L2, then having them execute in the same module could have some advantages. The main advantage we expect to see is an increase in the power efficiency of the cores that are idle. The more idle other cores are, the better chance the busy cores will have to boost.

However, there is another consideration to this which is how available other cores are. You need to weigh the benefits of data sharing with the benefit of starting the thread on the next available core. Stacking up threads to execute in proximity means that a thread might be waiting in line while an open core is available for immediate execution. If your multi-threaded application isn’t optimized to target the L2 (or possibly the L3 cache), or you have distinctly separate applications to run, and you don’t need to conserve power, then you’ll likely get better performance by having them scheduled on separate modules. So it is important to weigh both options to determine the best execution.
......
=========================================================================================

enm wrote:
亂序執行的重要依據是把所有待發送指令先加以整理
然後把 "可以先執行的指令" 分送至各個電路加以處理 :

也就是說, 若這排指令裡面有 A B C D E F G

A 與 B 相依, B 與 G 相依, D 與 F 相依, 但 A與B與G 跟 D與F 不相依

則可以先執行 A , C , D , E 四個指令

其後 A , D 指令出來後再執行 B 及 F , 並在 B 結果出來後再執行 G


在空間與處理單元設定為兩個核心處理情況下
亂序執行的組合可以為此 :

Core1 : A , B , C , G
Core2 : D , E , F , -

或其他排列... 但無論如何, 需要至少四個單位時間
...(恕刪)


enm wrote:
但還是逃不了一定得面對的 A 與 B 依存性的問題...
這也是將所有運算平行化為何極端困難的原因.


請問亂序執行都排列出來了,為何又有 A 與 B 依存性的問題???

ycweng wrote:
您好像誤會了中文裡面...(恕刪)


我覺得你對AMD的期望太大了

AMD的工程師也蠻可悲的,爆肝爆到一個打30個,還被『嫌』到沒倆好

我不認為AMD產品『符合』你們的期待啦。
有多少人是希望AMD把INTEL拉下來,然後跑去買SNB OR IVY的?


在01打打嘴砲,單純用嘴巴說說,多『容易』阿

AMD工程師花了5年都解決不了問題的,結果樓上幾個花了5秒鐘就解決了,好威猛阿

來看看2011/10/14年兩家公司的總市值
AMD 3.401B
Intel 123.398B

恩,兩者相差36.28倍

更不用說INTEL有的是錢,有哪幾個頂尖的工程師會願意屈就在AMD之下?

AMD把GF分出來後,AMD目前幾乎不可能靠CPU去贏過INTEL
論研發能力(比喻),INTEL有好幾個,AMD可能卻只有一個,INTEL有自家的晶圓廠
AMD作為FABLESS的半導體公司,兩者市值相差36多倍
AMD現況上根本沒機會在單純的X86上贏過英特爾。

INTEL花4年追上AMD,現在那AMD要花40年嗎?




i_stuck wrote:
我覺得你對AMD的期望太大了

AMD的工程師也蠻可悲的,爆肝爆到一個打30個,還被『嫌』到沒倆好

我不認為AMD產品『符合』你們的期待啦。
有多少人是希望AMD把INTEL拉下來,然後跑去買SNB OR IVY的?

...(恕刪)

一樓就說過有意爭論I/A誰道德高尚、該買I還是A的可以跳過這一篇了,您大約是剛接觸中文吧....

您要扯到這些市值、人力、財力的事後"檢討",好幾棟不同主題內我都提過個人認為AMD可以考慮先專注執行在毛利較高的筆電市場一步一腳印搶下市佔率的既定策略,先好好儲備糧草一陣子.......八萬人的軍隊跟二萬人的軍隊作戰,但是二萬人的一方卻硬要跟對方擺出同樣寬的正面,因而縱深薄弱,這....這....這?Llano在筆電,現在還得再觀察,千萬顆APU出貨量看起來很多,別忘了,筆電一年的總出貨量有多少....而且,得要真正賣到消費者手中,才會變成入袋的現金。

AMD現在在伺服器、效能桌機、主流桌機、主流筆電、入門機種、Netbook、Tablet、GPU、晶片組....無役不與,GPU、晶片組不算,手上還有四、五種不同架構處理器同時在生產、主要晶圓代工生產商就有TSMC、GF兩家要管理,試問經營團隊硬要擺出這種打腫臉的超寬戰鬥正面、輸人不輸陣,但力分則散,縱深跟後勤能不弱嗎?
ycweng wrote:
一樓就說過有意爭論I...(恕刪)


等等...敝人看了文,直街的心理反應是如下.

記得哈雷機車出廠可說決大多數是一樣的,但每年史特吉斯鎮年會.

可以看到麟囊滿目各有千秋的機車,連現在密爾瓦基廠內也增設客製區.

同樣的思維,量不量產與戰鬥正面並非絕對.

中華民族-美利堅合眾國-那個戰鬥正面不寬?
祝 身體健康 萬事如意 董慶先敬上
ycweng wrote:
一樓就說過有意爭論I...(恕刪)


我同意Y大說的,AMD把戰線拉太長了,
應該把主力範圍縮小,集中火力才是上策,我到現在還是覺得前CEO Dirk走的太冤了,
AMD不是不進入平板市場,是沒能力進入,
董事會炒了Dirk,沒CEO 運作了七八個月,走了一票的高管,中間一堆重要決策都延誤,實在禍害太大
(愚蠢的董事會搞壞一家公司,讓我想起HP和YAHOO的慘狀)。

目標主力市場的Llano還因為缺貨損失不少商機,據稱Llano是因為設計上的問題讓GF生產時良率太差,
推土機和下一代的FUSION APU--Trinity則沒有良率的問題,
Llano設計內容一改再改,整個時程延後達八個月之多,
目前看來Llano是剛上市就準備下市了,因為下一代的APU已經準備提槍上陣了。

AMD的口號是The Future is Fusion其實應該把前面換了,
應是AMD's Future is Fusion,
AMD最後的命符就靠這一張了...

至於推土機,主要應是瞄準伺服器市場,桌機市場看來只是插花,利潤大不過伺服器,量高不過APU,
從架構上我實在看不出推土機有啥問題,而且覺得實在是一個創新的設計,
只是很訝異功耗怎會那麼的高,以為這樣的設計功耗應該會降低才是,
造成了效能和功耗上的奇怪比例,
功耗上四模塊比INTEL的四核心還高,
效能上瘦身的八核心卻比不上INTEL的八線程,


剛看完AMD的Roadmap,很訝異的發現,下一代的CPU/APU/GPU晶圓面積似乎都比目前的稍大,
這實在是有點詭異的事情...
其實沒啥好吵的啦!

就純粹討論技術方面的東西就好了

其它版都吵的亂七八糟了............

約翰約翰 wrote:
我同意Y大說的,AM...(恕刪)


敝人是只有等著看戰報的份,但不會全看.

這是基於本身學養及攸關.
祝 身體健康 萬事如意 董慶先敬上
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!