11Aug
Ha valaha is összehasonlítást vásárolt egy új processzorral kapcsolatban, észrevette volna, hogy a magok úgy tűnik, hogy nem a különböző típusok kombinációja, hanem sebessége. Miert van az? A mai SuperUser Q & A bejegyzés válaszol egy kíváncsi olvasó kérdésére.
A mai kérdés &A válaszüzenet a SuperUser - a Stack Exchange megosztottságának köszönhetően - a Q & A webhelyek közösségi szintű csoportosítása.
Az
SuperUser olvasó kérdése Jamie tudni akarja, hogy a CPU-magok mindegyike ugyanolyan sebességgel működik, mint a különböző típusok közül:
Általában, ha új számítógépet vásárol, meghatározza, hogy mely processzort vásárolja meg a számítógép várható munkaterhelése alapján. A videojátékok teljesítményét általában egy mag sebességgel határozzák meg, míg a videó szerkesztéshez hasonló alkalmazásokat a magok száma határozza meg. Ami a piacon elérhető, úgy tűnik, hogy minden processzor nagyjából ugyanolyan sebességgel rendelkezik, a főbb különbségek pedig több szál vagy több mag.
Például:
- Intel Core i5-7600K, alap frekvencia 3.80 GHz, 4 mag, 4 szál
- Intel Core i7-7700K, alap frekvencia 4,20 GHz, 4 mag, 8 szál
- AMD Ryzen 5 1600X, alap frekvencia 3,60 GHz, 6magok, 12 szál
- AMD Ryzen 7 1800X, alap frekvencia 3,60 GHz, 8 mag, 16 szál
Miért látjuk ezt a mintát a növekvő magok, de minden magnak ugyanolyan órajelsebességgel? Miért nem léteznek olyan változatok, amelyeknek különböző órája van? Például két "nagy" mag és sok kis mag.
A 4,0 GHz-es négycsöves( azaz 4 × 4 GHz-es, 16 GHz-es) négysugár helyett, mi a helyzet a 4,0 GHz-es és a 2,0 GHz-es( azaz 2 × 4,0 GHz + 4 ×2,0 GHz, maximálisan 16 GHz)?A második lehetőség ugyanolyan jó lenne az egy menetes munkaterheléseknél, de potenciálisan jobb a többszálú munkaterheléseknél?
Általános kérdésként ezt kérdezem, nem pedig kifejezetten a fent felsorolt CPU-kra, vagy egy adott munkaterhelésre vonatkozóan. Csak kíváncsi vagyok, miért van ez a minta.
Miért minden processzor magja ugyanolyan sebességgel működik, mint más?
A válasz
A SuperUser közreműködője a bwDraco választja nekünk:
Ezt heterogén multi-feldolgozásnak( HMP) ismerik és széles körben alkalmazzák a mobil eszközök. Az ARM-alapú eszközökben, amelyek nagy LITTLE-t valósítanak meg, a processzor különböző teljesítményű és teljesítményprofilokkal rendelkező magokat tartalmaz, azaz egyes magok gyorsan futnak, de rengeteg energiát( gyorsabb architektúrát és / vagy magasabb órákat) húznak, míg mások energiatakarékosak, de lassúak( lassabb architektúra és / vagy alacsonyabb óra).Ez azért hasznos, mert az energiafelhasználás aránytalanul növeli a teljesítményt, miután elért egy bizonyos pontot. Az ötlet itt az, hogy teljesítményt kapjon, amikor szüksége van rá és az akkumulátor élettartama, ha nem.
Az asztali gépeken az energiafogyasztás sokkal kevésbé fontos, így ez valóban nem feltétlenül szükséges. A legtöbb alkalmazás várhatóan minden magnak hasonló teljesítményjellemzői vannak, és a HMP rendszerek ütemezési folyamata sokkal összetettebb, mint a hagyományos szimmetrikus többprocesszoros( SMP) rendszerek ütemezése( technikailag a Windows 10 támogatja a HMP-t,olyan eszközök, amelyek ARM nagyot használnak. LITTLE).
A legtöbb asztali és laptop processzor ma sem termikusan, sem elektromosan nem korlátozódik arra a pontra, ahol néhány magnak gyorsabbnak kell lennie, mint másoknak, még rövid röpke esetén is. Alapvetően megtaláltuk a falat, hogy milyen gyorsan tudunk egyedi magokat létrehozni, így a magok lassabb cseréjével nem engedjük meg a többi mag gyorsabb futását.
Bár néhány olyan asztali processzor van, amelyek egy vagy két magot képesek gyorsabban futni, mint a többiek, ez a képesség jelenleg csak bizonyos csúcsminőségű Intel processzorokra korlátozódik( Turbo Boost Max Technology 3.0 néven ismert), és csak enyhe nyereségeta gyorsabb teljesítményű magok teljesítményében.
Bár lehet, hogy egy hagyományos x86 processzort tervez, mindkét nagy, gyors magot és kisebb, lassabb magokat, hogy optimalizálja az erősen menetes munkaterheléseket, ez komoly bonyolultságot jelentene a processzorok tervezésével szemben, és az alkalmazások valószínűleg nem támogatják megfelelően.
Vegyünk egy hipotetikus processzort két gyors Kaby Lake( 7. generációs) maggal és nyolc lassú Goldmont( Atom) maggal.Összesen 10 magot használnánk, és az ilyen típusú processzorokhoz optimalizált, erősen menetes munkaterhelések teljesítményt és hatékonyságot értek el a normál négymagos Kaby Lake processzor felett. Azonban a különböző típusú magok vadul eltérő teljesítményszintekkel rendelkeznek, és a lassú magok nem támogatják a gyors magok, például az AVX utasításait( ARM elkerüli ezt a problémát, mivel mind a nagy, mind a kis magot ugyanazoknak az utasításoknak).
A legtöbb Windows-alapú többszálas alkalmazás feltételezi, hogy minden magnak ugyanolyan vagy közel azonos szintű teljesítménye van, és ugyanazokat az utasításokat hajthatja végre, így ez az aszimmetria valószínűleg kevesebb mint ideális teljesítményt eredményezhetmég akkor is összeomlik, ha olyan utasításokat használ, amelyeket a lassabb magok nem támogatnak. Miközben az Intel módosíthatja a lassú magokat, hogy fejlett utasítást támogasson, hogy minden mag mindegyikét végrehajthassa, ez nem oldja meg a heterogén processzorokkal szoftvertámogatással kapcsolatos problémákat.
Az alkalmazástervezés eltérő megközelítése, közelebb attól, amit valószínűleg a kérdésedben gondolsz, a GPU-t használja a nagyon párhuzamos alkalmazások felgyorsításához. Ezt API-k, például az OpenCL és a CUDA segítségével lehet elvégezni. Ami egy chipes megoldást illeti, az AMD támogatja az APU-k GPU-gyorsításának hardveres támogatását, amely egy hagyományos processzort és egy nagy teljesítményű integrált GPU-t ugyanabba a chipbe, mint a Heterogeneous System Architecture,néhány speciális alkalmazásból.
Van valami a magyarázathoz? Hangzik ki a megjegyzésekben. Szeretne többet válaszolni a többi technikus-tudós Stack Exchange felhasználóiról? Nézze meg a teljes vitafonalat itt.
képarány: Mirko Waltermann( Flickr)