免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

談?wù)凜PU的時(shí)鐘

 kaller_cui 2022-10-02 發(fā)布于北京

來源:內(nèi)容由半導(dǎo)體行業(yè)觀察(ID:icbank)編譯自chipsandcheese,謝謝。

我們經(jīng)常發(fā)現(xiàn)CPU的時(shí)鐘頻率非常高,但其實(shí)CPU為了減少功耗和熱量產(chǎn)生,并不是一直以最大時(shí)鐘運(yùn)行。由于電源傳輸電路需要時(shí)間來提升電壓和傳輸更高的電流,因此它們不能立即從一個(gè)時(shí)鐘速度切換到另一個(gè)。在本文中,我們將研究各種CPU從空閑時(shí)鐘到更高頻率的速度。讓我們從結(jié)論開始,然后以我們?nèi)绾芜M(jìn)行這個(gè)小實(shí)驗(yàn)結(jié)束。

是時(shí)候開始最大化提升了

以下是一些CPU如何達(dá)到其最大提升頻率的簡要概述。單獨(dú)來看,這張圖并不能說明全部情況,因?yàn)樵S多CPU在提升之前,會(huì)在中間頻率上保持平穩(wěn),而這遠(yuǎn)高于它們的空閑時(shí)鐘。

圖片

現(xiàn)在,讓我們分析一下這些CPU上的時(shí)鐘斜坡行為。

AMD Zen3架構(gòu)

Zen 3于2020年底推出,雖然即將被Zen 4取代,但現(xiàn)在它仍然是最新的廣泛可用的AMD架構(gòu)。在移動(dòng)形式(Cezanne)中,我們可以看到非常快的頻率斜坡行為,甚至能夠在幾毫秒內(nèi)達(dá)到3.7GHz。不過,我們并沒有看到核心提升到4.4 GHz,也許一段時(shí)間后就能達(dá)成,顯然目前測試還不能運(yùn)行足夠的迭代。

圖片

盡管如此,3.7GHz的速度仍足以提供良好的用戶體驗(yàn)。

AMD Zen2架構(gòu)

AMD Zen 2架構(gòu)于2019年首次推出,主要應(yīng)用于移動(dòng)、桌面和服務(wù)器。在臺(tái)式機(jī)(Matisse)上,Zen 2內(nèi)核的啟動(dòng)頻率為1.7GHz,提升時(shí)間稍長,16毫秒后才達(dá)到4.3 GHz。在3950X上,最好的盒式內(nèi)核在4.3 GHz下穩(wěn)定一毫秒,17.45毫秒后達(dá)到4.7 GHz。從時(shí)鐘斜坡行為來看,雖然Zen 2比Zen 3慢,但考慮到17.45毫秒是57 FPS的單幀,所以Zen 2的速度仍然很快。

圖片

Mobile Zen 2(Renoir)更令人印象深刻,在9毫秒多一點(diǎn)的時(shí)間內(nèi)達(dá)到4.3 GHz。為了節(jié)省電力,Renoir以較低的1.4 GHz時(shí)鐘速度啟動(dòng)。

Ryzen 9 3950X在ASRock X570M Pro4上測試,Ryzen4800H則是在Eluktronics RP-15筆記本電腦上測試。

Intel Skylake架構(gòu)

Skylake于2015年問世,但由于英特爾多年沒有給臺(tái)式機(jī)市場帶來新架構(gòu),因此Skylake的影響力一直持續(xù)到2020年。英特爾在Skylake上首次推出了一項(xiàng)名為“Speed Shift”的技術(shù),該技術(shù)將處理器電源狀態(tài)控制交給CPU,而不是讓操作系統(tǒng)要求轉(zhuǎn)換??犷5-6600K充分展示了這一功能,僅在5.62毫秒后就達(dá)到了其最大的增益時(shí)鐘3.9 GHz。

Kaby Lake是2017年Skylake架構(gòu)的更新版本,但表現(xiàn)相比Skylake卻差別很大,需要31.5毫秒才能達(dá)到2 GHz。其4.5 GHz的最大升壓時(shí)鐘要到62.54 ms才能達(dá)到。

圖片

我懷疑這與在OEM系統(tǒng)中實(shí)現(xiàn)的i7-7700K有關(guān),主板是采用Intel C236芯片組的HP 802F,同時(shí),i5-6600K安裝在MSI Z170A Gaming Pro Carbon中,這是一款相當(dāng)普通的發(fā)燒友主板,應(yīng)該不會(huì)帶來任何意外驚喜。

AMD Piledriver架構(gòu)

Piledriver是AMD 2012年的架構(gòu)。一般來說,F(xiàn)X-8350顯示的時(shí)鐘斜坡行為與客戶端Haswell類似,需要近80毫秒才能達(dá)到其最大提升時(shí)鐘。然而,Piledriver在47毫秒后就達(dá)到了令人滿意的3.4 GHz,這意味著CPU的響應(yīng)速度應(yīng)該比最大提升速度所需的時(shí)間更快。

圖片

如果Windows電源計(jì)劃將最小CPU狀態(tài)設(shè)置為100%,那么FX-8350即使在空閑時(shí)也將保持在1.35V左右。在這種模式下,Piledriver表現(xiàn)出極快的增強(qiáng)性能,在不到五分之一毫秒的時(shí)間內(nèi)從1.41 GHz提升到4.1 GHz,并在一毫秒多一點(diǎn)的時(shí)間內(nèi)達(dá)到4.2 GHz的最大增強(qiáng)時(shí)鐘。這表明大部分時(shí)鐘延遲來自于等待電壓增加。

圖片

FX-8350安裝在Gigabyte GA-990FX-Gaming板中。

Intel Haswell架構(gòu)

英特爾2013年推出的Haswell架構(gòu)幫助英特爾鞏固了在臺(tái)式機(jī)和服務(wù)器市場領(lǐng)域強(qiáng)大的領(lǐng)先地位。它采用英特爾的22納米FinFET工藝,推出了AVX2,并提供了比前代產(chǎn)品更高的高速緩存帶寬。在客戶端上,Haswell的增強(qiáng)行為與同期的其他CPU類似。臺(tái)式機(jī)Haswell在31毫秒后達(dá)到中等2.5 GHz,僅在60毫秒后就達(dá)到高時(shí)鐘。Mobile Haswill的升壓行為更為保守,47毫秒后達(dá)到2 GHz,79毫秒后達(dá)到最大時(shí)鐘。

圖片

提前達(dá)到中等時(shí)鐘可能會(huì)讓Haswell感覺比最大時(shí)鐘時(shí)間數(shù)據(jù)所顯示的反應(yīng)更靈敏一些。盡管如此,它的速度還是遠(yuǎn)遠(yuǎn)比不上Skylake的“速度轉(zhuǎn)換”。

Core i7-4712HQ在Dell Precision M3800筆記本電腦上測試,i7-4770則是安裝在華碩Q87M-E板上。

Intel的舊HEDT平臺(tái):

 Sandy Bridge and Haswell

此前,在一個(gè)并不遙遠(yuǎn)的Galaxy中,英特爾主導(dǎo)了高端臺(tái)式機(jī)市場。在那時(shí)候。如果你想要四個(gè)以上的內(nèi)核,就需要付錢給英特爾,并且很樂意這樣做?;仡櫮切?duì)英特爾來說十分輝煌的時(shí)期,我們可以看到英特爾的HEDT芯片很快就達(dá)到了中間時(shí)鐘,但卻花了很長時(shí)間才達(dá)到最大提升時(shí)鐘?;赟andy Bridge的Xeon E5-1650達(dá)到3.2 GHz的基本時(shí)鐘所需的時(shí)間與客戶端Haswell達(dá)到最大提升時(shí)鐘所需的時(shí)間大致相同。此后,它等待了近半秒鐘才上升到其3.8GHz的單核渦輪頻率。而Hedt Haswell在某種程度上更好,在大約三分之一秒內(nèi)達(dá)到最大時(shí)鐘速度,但我這次測試的是一個(gè)相當(dāng)?shù)偷臅r(shí)鐘Haswell SKU。

圖片

與英特爾的臺(tái)式機(jī)和移動(dòng)平臺(tái)不同,HEDT芯片的起始頻率略高,為1.2 GHz,而英特爾的臺(tái)式機(jī)和移動(dòng)平臺(tái)的空閑頻率通常為800 MHz。我想知道我們在這里看到的非常長的時(shí)鐘斜坡時(shí)間是否是故意的,目的是為了降低短期任務(wù)的功耗。

Xeon E5-1650使用的是惠普1589主板和C602芯片組,而E5-2630 v3使用的是戴爾0K240Y主板和C612芯片組。我相信這些主板名稱對(duì)你來說很有意義,因?yàn)樗鼈儗?duì)戴爾和惠普來說也很有意義。

Intel低功耗架構(gòu): Goldmont Plus

Goldmont Plus是英特爾2017年推出的低功耗架構(gòu),它是一種3寬架構(gòu),具有無序執(zhí)行功能,比2010年代早期的Atom芯片更強(qiáng)大,但也不打算在臺(tái)式機(jī)領(lǐng)域上競爭。與當(dāng)代Skylake架構(gòu)不同,它似乎沒有實(shí)現(xiàn)“速度轉(zhuǎn)換”,需要47毫秒才能達(dá)到2.6 GHz。

圖片

Goldmont Plus在一些“ Coofun ”品牌的GK41小型PC上進(jìn)行了測試。別再問了,這在當(dāng)時(shí)聽起來是個(gè)好主意。

高通驍龍670

驍龍670是一款2018年推出的中端手機(jī)SoC,有兩個(gè)Cortex A75核和六個(gè)大家都喜歡的Cortex A55核。A75核心達(dá)到2 GHz,而A55核心達(dá)到1.7 GHz。A75核上的頻率斜坡非常快,而A55核需要更長的時(shí)間才能達(dá)到最大時(shí)鐘速度。奇怪的是,當(dāng)手機(jī)插上電源時(shí),A55內(nèi)核增加時(shí)鐘的速度更快,而A75內(nèi)核在電池供電的情況下提升頻率的速度更快。

圖片

另一個(gè)有趣的細(xì)節(jié)是,A55內(nèi)核的起始頻率非常低,為600 MHz,而A75內(nèi)核的起始頻率略高于800 MHz。

Snapdragon 670在Pixel 3A中進(jìn)行了測試。

高通驍龍821

高通的驍龍821最出名的可能是它不是驍龍810,但它是一個(gè)非常獨(dú)特的芯片,盡管緩存設(shè)置不同,高性能和低功耗的內(nèi)核實(shí)際上使用的是相同的Kryo架構(gòu)。Kryo是一個(gè)4寬的失序內(nèi)核,擁有4個(gè)alu和相當(dāng)厲害的重排序能力,因此驍龍821擁有當(dāng)時(shí)最大的“小”內(nèi)核。遺憾的是,高通在實(shí)現(xiàn)緩存方面的表現(xiàn)非常糟糕,不過這是另一個(gè)故事了。

無論是在手機(jī)電池耗盡還是在電池充滿電的情況下插入,Little Kryo的行為都是相似的。任何一種模式都會(huì)導(dǎo)致內(nèi)核在逐步提升后,還需要超過200 ms才能達(dá)到1.59 GHz.電池模式似乎只是將空閑頻率降至非常低的300 MHz。在交流電源上,它們的空閑頻率為600 MHz。

圖片

Big Kryo也具有類似的空閑頻率差異,但在使用交流電源時(shí),時(shí)鐘斜坡要快得多。如果手機(jī)充滿電并連接到電源,則在20毫秒內(nèi)可達(dá)到2.34 GHz,但使用電池則需要將近400毫秒。這種行為可能是故意的,以防止內(nèi)核消耗大量能量來完成非常短的任務(wù)。有趣的是,當(dāng)手機(jī)使用電池時(shí),little Kryo實(shí)際上比Big Kryo高出一點(diǎn)點(diǎn),從100到300毫秒。

Snapdragon 821在LG G6上進(jìn)行了測試。

兆芯陸家嘴架構(gòu)

作為獎(jiǎng)勵(lì),我們在KX-6640MA中測試了兆信的陸家嘴架構(gòu)。此CPU的數(shù)據(jù)使用舊版本的測試收集,該測試通過按鍵來啟動(dòng)數(shù)據(jù)收集,而不是休眠五秒鐘。事實(shí)證明,按鍵本身可能需要幾毫秒才能傳送到程序,導(dǎo)致測量精度略低。不過,有足夠的數(shù)據(jù)表明,陸家嘴有相當(dāng)快的時(shí)鐘斜坡行為,它增加時(shí)鐘的速度比Goldmont Plus快,但不如Zen 3或Skylake。

圖片

方法論

我們的測試執(zhí)行已知數(shù)量的相關(guān)整數(shù)加法,在絕大多數(shù)CPU上以每個(gè)時(shí)鐘周期執(zhí)行一次。如果我們計(jì)算執(zhí)行一定數(shù)量的相關(guān)加法所需的時(shí)間,我們可以用它作為CPU周期數(shù)的代理,從而計(jì)算時(shí)鐘速度。雖然CPU不能立即改變時(shí)鐘速度,但很多能比我們使用標(biāo)準(zhǔn)計(jì)時(shí)API(如gettimeofday或ftime)精確測量的速度更快。

圖片

Estimating clock speed via integer addition latency on x86

因此,我們使用x86上的RDTSC(讀取TSC或時(shí)間戳計(jì)數(shù)器),或ARM上的CNTVCT_EL0(計(jì)數(shù)器定時(shí)器虛擬計(jì)數(shù)寄存器)來測量時(shí)間差。重復(fù)上述過程,我們希望在幾次迭代之后看到時(shí)鐘速度的提高(RDTSCor CNTVCT_EL0增量更?。?。然后,我們通過測量gettimeofday和rdtsc/cntvct_el0的大時(shí)間差(約2秒),分別確定rdtsc或cntvct_el0增量與實(shí)時(shí)差的對(duì)應(yīng)關(guān)系。盡管計(jì)時(shí)精度最終會(huì)受到rdtsc和cntvc_el0開銷的限制,但這種設(shè)置使我們能夠獲得低于毫秒的準(zhǔn)確計(jì)時(shí)。

另一個(gè)有趣的注意事項(xiàng)是,ARM CPU上的CNTVCT_EL0提供的精度略低于x86 CPU上的RDTSC。x86 CPU傾向于在基本時(shí)鐘上遞增時(shí)間戳計(jì)數(shù)器。例如,F(xiàn)X-8350的時(shí)間戳計(jì)數(shù)器將每納秒遞增四次,來對(duì)應(yīng)于其4GHz基本時(shí)鐘。Snapdragon 670和Snapdragon 821內(nèi)核大約每50納秒增加一次CNTVCT_EL0。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多