Die Speicherhierarchie des Conroe war extrem einfach und Intel konnte sich auf die Leistung des geteilten L2-Cache konzentrieren, was die beste Lösung für eine Architektur war, die hauptsächlich auf die Dual-Core-Implementierungen abzielte. Aber mit Nehalem haben die Ingenieure wieder bei null angefangen und sind zu den gleichen Schlussfolgerungen gekommen wie ihre Konkurrenten: Ein geteilter Cache auf zweiter Ebene war für eine native Quad-Core-Architektur nicht geeignet: Die verschiedenen Kerne konnten die für einen anderen notwendigen Daten zu häufig verdrängen und es ist wahrscheinlich, dass dies auf der Ebene des internen Bus und der Arbitration zahlreiche Probleme stellte, die vier Kerne mit einer ausreichenden Bandbreite zu versorgen und dabei eine ausreichend niedrige Latenz zu bewahren. Um diese harte Nuss zu knacken, haben die Ingenieure dann die verschiedenen Kerne mit einem privaten Cache-Speicher auf zweiter Ebene ausgerüstet. Da dieser nur für einen einzigen Kern gedacht und relativ klein (256 KB) ist, konnten die Ingenieure ihn extrem leistungsstark machen. Insbesondere die Latenz sei im Vergleich zum Penryn von 15 Zyklen auf ca. 10 Zyklen deutlich verbessert worden.
Man findet dann noch einen riesigen Cache-Speicher der dritten Ebene (8 MB) vor, um die Kommunikation zwischen den Kernen zu verwalten. Wenn die Cache-Hierarchie des Nehalem auf den ersten Blick an die des Barcelona erinnert, so unterscheidet sich die Funktionsweise des Cache auf der dritten Ebene sehr von der seines Konkurrenten: Er umfasst nämlich alle Ebenen der vorangehenden Caches. Das bedeutet, dass wenn ein Kern versucht, auf Daten zuzugreifen und diese Daten sich nicht im Cache der Ebene 3 befinden, es unnötig ist, sie in den privaten Caches der anderen Kerne zu suchen: Diese Daten müssen sich dort jedoch nicht unbedingt finden lassen. Wenn diese Daten jedoch da sind, geben vier mit jeder Zeile des Speichercache verbundene Bits (ein Bit pro Kern) an, ob die Daten potentiell im Cache einer tieferen Ebene eines anderen Kerns präsent sind und in welchem.
Diese Technik ist effizient, um die Kohärenz der privaten Caches sicherzustellen und den Datenverkehr zwischen den Kernen zu begrenzen, aber ihr Nachteil ist, dass sie einen Teil des Cachespeichers mit Daten vergeudet, die bereits auf anderen Ebenen präsent sind. Das wird jedoch dadurch in Grenzen gehalten, dass die L1- und L2-Caches im Vergleich zum L3-Cache relativ klein sind und die Gesamtheit der L1- und L2-Daten nur maximal 1,25 MB von 8 MB belegen. Genau wie auf dem Barcelona arbeitet der Cache der Ebene 3 nicht mit der gleichen Frequenz wie der restliche Chip und folglich ist die Zugriffslatenz auf dieser Ebene variabel, sollte aber im Bereich von 40 Zyklen liegen.
Letzten Endes ist die einzige Enttäuschung bei der neuen Cache-Hierarchie des Nehalem der Cache der ersten Ebene. So wurde die Durchlassbreite des Anweisungscaches nicht vergrößert. Sie beträgt immer noch nur 16 Bytes pro Zyklus im Vergleich zu 32 beim Barcelona. Das könnte sich für eine serverorientierte Architektur als Engpass erweisen, da 64-Bit-Anweisungen voluminöser sind als 32-Bit-Anweisungen. Hinzu kommt auch noch, dass der Nehalem einen Decoder mehr als der Barcelona hat, was noch mehr Druck auf den Cache ausübt. Der Datencache seinerseits verzeichnet eine Erhöhung seiner Latenz auf vier Zyklen im Vergleich zu drei beim Conroe, um eine höhere Taktfrequenz zu erzielen. Um zum Schluss noch einen positiven Punkt zu erwähnen: Die Ingenieure von Intel haben die Anzahl der Cachefehler der ersten Ebene erhöht, die ihre Architektur parallel verarbeiten kann.
- Intel, amd was ist besser für vmware ? [Prozessoren]
- Intel i7 - Nehalem oder Bloomfield? [Prozessoren]
- News: Intel Core i7 - Modelle und Preise [Prozessoren]
- Core i7 oder doch ein alter Q9550 oder 9650 [Prozessoren]
- | [Neu] Erste Benchmarks von Corei5 und Corei7 860 [Prozessoren]
Haben Sie Fragen? Die Tom's Hardware Community hilft!
- 1 / 2
- Weiter
-
Beste Angebote
Download-Spiele
Alexandra Fortune:Mystery of the Lunar Archipelago
|
Youda Legend und Youda Sushi Chef
|
- i5 oder i7
- reg cleaner vista
- festplattenreceiver
- grafikkarte kaputt
- 5.1 system
- 5.1 system
- uaa hd audio bus driver microsoft
- windows 7 superfetch
- festplatte wird nicht erkannt
- temperatur 9600gt
- i7 860 benchmark
- grafikkarten temperatur zu hoch
- mix computer
- anschliessen e-sata
- die beste low profile grafikkarte
- p5b treiber
- wlan lauft sehr langsam
- msi p55 cd53 test
- propylalkohol wo bekommen
- geforce 8100 test




Toller Artikel, sehr interessant!
Nun bin ich noch mehr gespannt, was die CPUs nun wirklich bringen!
Wahrlich einer der besten Artikel der letzten Monate.
Schade nur dass der Nehalem so wenig L2-Cache bekommen wird.
Wenn dies einer der besten Artikel der letzten Monate ist...
Sehr informativ und verständlich geschrieben, sehr schön!
Der Nehale baucht nicht soviel 2nd level cache, dieser wurde bei den alten Architekturen primär zum Verstecken der miesen Speicheranbindung verwendet. Wir hatten die Gelegenheit unsere eigene Software (Raytracer) auf einem Nehalem-System zu testen und wurden ohne Anpassung (kein SSE4.1 oder SSE4.2 mit Beschleunigung von Faktor 2.5-3 belohnt). Ich denke der Grossteil der Beschleunigung ist einfach durch den (mittlerweile auch für Intel :-) Memorycontroller on-chip zurückzuführen. Gut, SMT hilft natürlich auch mit gut 25%. Alles in allem ein Höllenteil und für AMD sehe ich ernsthafte Probleme am Horizont. Die K10 Architektur hat so wie es derzeit aussieht absolut nichts dagegen zu setzen.
Euer Arno
Sehr informativ und der Nehalem erscheint ja fast unschlagbar. Da müsste AMD ganz schön nachziehen um da mithalten zu können.
Durch den integrierten Memorycontroller wird aber Intel wieder mehr mit Abwärme zu kämpfen haben. Die TDPs sollen ja größenteils über 110 W liegen.
Sehr schön wenn die CPUs bei Raytracing schneller sind, hoffe das die Entwicklung für RTGames verbessert.
"Intel wird einige Zeit gebraucht haben, um AMD in diesem Punkt einzuholen, aber wie immer macht der Riese eben nur ganze Sachen."
Genau solche Sätze bringen euch immer wieder den Vorwurf ein, dass eure Berichterstattung gekauft ist. Vielleicht solltet ihr euren Lektor feuern.
Stimmt aber teilweise, Intel hat einfach viel mehr Geldreserven um Eventualitäten schnell zu umschiffen, die können sich ja sogar noch Verzögerungen leisten und von der Anzahl der Mitarbeiter sind die auch größer wodurch die die Kräfte vielleicht. auch felxibler verteilen können.
Welche Probleme da dann später dank Speichercontroller noch auftreten werden wir ja sehen, aber bisher haben die ja noch keine gehypten Bugs wie der TLB-Bug bei AMD.
@Webstar
So ein Unsinn. Sie haben nur gesagt, dass sie ihre Sache gut gemacht haben, und haben auch begründet wieso.
Ich finde es lächerlich, dauernd auf solche Sätze zu lauern und aus jeder Mücke einen Elefanten zu machen.
Wenn alle Artikel zumindest auf diesem Niveau (kaum Rechtschreibfehler, fundierte Recherche, gutes Thema und verständliches Deutsch) wären, dann hätte tom's hardware seine frühere Qualität wieder erreicht.
stimme pornseller voll zu ^^
OMG bald ist es aus mit AMD. (wen das so weitergeht.
bald is es mit amd vorbei - das haben wir jetzt schon oft gehört
Die haben gerade ein paar Milliarden bekommen, so schnell werden wir die nicht los und das ist auch gut so.
wow eine neue cpu
mal benchmarks abwarten - wenn nicht 2 mal so schnell wie der alte "pro core gerechnet" dann ist es eher unbrauchbar.
Hey, alle wollen benchmarks? Kein Problem:
http://www.computerbase.de/news/ha [...] 0_293_ghz/
Keine Ahnung warum tomshardware diese Datein nicht im Artikel verarbeitet hat. Aber davon mal abgesehen, habt ihr den Artikel selbst geschrieben oder handelt es sich um "copy and paste"? Der Bericht ist richtig gut, sogar so gut, dass er zu den übrigen überhaupt nicht passt.
@bernddasBrot: Böse Welt... wie der den QX9770 versägt, ouhauaha
hehe... jep. Zudem wird er wohl nur ein fünftel kosten
.
was meint ihr, sollte man noch abwarten bis nov./dez. für den kauf eines neuen rechners oder bei den "alten" prozessoren zuschlagen? vielleicht werden die "alten" dann billiger. bin sehr unschlüssig.