En la tecnología de procesadores, el cambio estructural más importante es la interfaz QuickPath (QPI) . El QPI ha sido desarrollado para reemplazar el envejecido FSB (Front Side Bus) y ofrecer una vía más rápida de comunicación entre el procesador y el chipset. Obviamente el chipset debe tener soporte para la tecnología QPI y es aquí donde entra el X58 que reemplaza al X48.
Un FSB universal tiene un multiplicador para lograr la frecuencia deseada.
Con QPI Intel introduce una sola frecuencia base de 133,33MHz.
Cada componente en la tarjeta madre utiliza su propio multiplicador para determinar la frecuencia. Para dar un ejemplo práctico, el Core i7 940 opera a 2,93GHz y utiliza un multiplicador de 22x (22 x 133 – 2926MHz).
A diferencia de los procesadores convencionales que usan un solo multiplicador, el Core i7 965 Extreme Edition por ejemplo ofrece un modo especial llamada “Turbo Mode”. Cuando se activa, este permite que el usuario designe un multiplicador independiente para cada uno de los cuatro núcleos.
Para un overclocking es posible aumentar sólo la frecuencia del primer núcleo, que es el más utilizado.
La memoria también funciona de una manera similar, utiliza como base la frecuencia 133,33MHz con un multiplicador para la frecuencia adecuada.
Por ejemplo, la plataforma Core i7 utiliza memoria DDR3-1066 por lo que se necesita en multiplicador 8x para llegar a esa frecuencia. Esto realmente simplifica el overclocking al aumentar la frecuencia de trabajo de los componentes tan sólo modificando la frecuencia central de 133,33MHz o ajustar la frecuencia de cada componente a través de su multiplicador individual.
Este aumento de frecuencia de trabajo, simplificado junto con un ancho de banda más amplio entre el procesador y el chipset son mejoras impresionantes, pero hay algo mas que estaba siendo limitado por el FSB: la memoria. Para resolver este problema Intel finalmente hizo lo que AMD viene haciendo hace años, mover el controlador de memoria al procesador central. El nuevo controlador empotrado en los procesadores “Bloomfield” Core i7 tiene soporte para tres canales de memoria DDR3.
Anteriormente el FSB de 333MHz de los procesadores de alto desempeño Core 2 limitaba el ancho de banda a 10,6GB/s mientras que la memoria DDR2-1066 en modo de dos canales tiene un pico de 17GB/s. Para poder romper esta barrera Intel tenía que eliminar el FSB y decidió seguir el enfoque de AMD para solucionar este problema.
El desarrollo de un controlador de memoria DDR3 de tres canales fue un logro de Intel. Con módulos de memoria DDR3-1066 este controlador logra un pico de 25,5GB/s. Al utilizar módulos DDR3-1333 el ancho de banda máximo es 31GB/s.
Con esta transferencia impresionante el controlador soporta tres canales de memoria y permite dos DIMMs por canal. Las placas base pueden implementar tres o seis ranuras DIMM en vez de las configuraciones típicas de dos o cuatro ranuras.
Los procesadores Core i7 sólo tienen soporte para memoria DDR3. El Core i7 es un procesador con un dye donde los cuatro núcleos, el controlador de memoria, y todos los caches están en un mismo chip.
Los tres procesadores Nehalem tienen un cache L3 de 8MB, y cada de los cuatro núcleos tienen su propio cache L2 de 256KB. En total cada uno de estos procesadores cuenta con unos 731 Millones de transistores y un diseño termal de 130W.
Para darle el toque final, la tecnología hyper-threading está implementada en los procesadores Core i7, lo cual permite que estos chips de cuatro núcleos manejen un total de ocho hilos. Ésta es la misma tecnología usada en los antiguos procesadores Netburst Pentium 4 que desapareció con el lanzamiento de la línea Core 2.
El sistema operativo mostrará ocho núcleos.
El futuro de los procesadores Core i7
Los chips Nehalem vendrán en diferentes versiones, unos para computadoras de escritorio, otros para servidores e incluso unos para computadoras portátiles. La primera serie de la marca Core i7 salió bajo el nombre ‘Bloomfield’ y sus procesadores ofrecen cuatro núcleos, 45nm y tecnología Hyper-threading.
También están siendo desarrollados los procesadores Westmere, Clarkdale, Beckton, Gainestown, Lynnfield, Clarksfield, Havendale, y Auburndale.
Los Beckton serán procesadores de cuatro zócalos para servidores, los Gainestown de dos zócalos.
En cuanto a computadoras de escritorio, eventualmente los tres procesadores Bloomfield serán reemplazados por los procesadores Westmere que ofrecerán varias mejoras.
Los procesadores Bloomfield de hoy como los Westmere están diseñados para ser utilizados con el nuevo zócalo LGA1366 que no es compatible con el LGA775.
Sin embargo, otros procesadores para computadoras de escritorio como los Lynnfield y Havendale no usarán el zócalo LGA1366. Utilizarán el zócalo LGA1156. Es interesante que una vez más Intel decidiera lanzar dos zócalos diferentes, pero tal vez no sea lo más conveniente para el consumidor. Cuando los procesadores Lynnfield y Havendale salgan a finales del 2009 se supone que solo tendrán soporte para memoria DDR3 de dos canales y por ende serán una buena opción para los que busquen armar equipos económicos.
Inevitablemente habrá una versión para portátiles de los procesadores Nehalem para finales del 2009. El desempeño de los procesadores móviles (Clarksfield) será muy similar al de los procesadores para computadoras de escritorio Lynnfield, lo cual significa que serán chips de cuatro núcleos con cache L3 de 8MB y soporte para memoria DDR3 de dos canales.
Otro procesador para portátiles que será muy interesante es el ‘Auburndale’. Aunque éstos serán procesadores mainstream de dos núcleos con cache L3 de 4MB con un GPU Ironlake incorporado. Se espera que éste sea el primer chip de Intel en combinar el CPU y el GPU en un mismo chip.
Comparación de arquitecturas Intel y AMD
Configuración HW intel Core i7 - Intel Core i7 965 Extreme Edition (LGA1366) - Intel Core i7 940 (LGA1366) - Intel Core i7 920 (LGA1366) Módulos de memoria - x3 Samsung 1GB DDR3-1066 (CAS 7-7-7-20) chipset - Intel DX58SO (Intel X58) Pre-Producción Fuente - OCZ GameXStream (700 watt) Disco rígido - Seagate 500GB 7200-RPM (Serial ATA300) - video ASUS GeForce GTX 280 (1GB) Software - Microsoft Windows Vista Ultimate SP1 (64-bit) - Nvidia Forceware 180.43 Beta | Configuración HW intel Core 2 - Intel Core 2 Quad Q9650 (LGA775) - Intel Core 2 Duo E8600 (LGA775) - Intel Core 2 Duo E6700 (LGA775) Módulos de memoria - x2 Kingston HyperX 2GB DDR3-1333 (CAS 7-7-7-20) chipset - ASUS Rampage Extreme (Intel X48) Fuente - OCZ GameXStream (700 watt) Disco rígido - Seagate 500GB 7200-RPM (Serial ATA300) - video ASUS GeForce GTX 280 (1GB) Software - Microsoft Windows Vista Ultimate SP1 (64-bit) - Nvidia Forceware 180.43 Beta |
Configuración HW AMD Phenom X4 - AMD Phenom X4 9950 (AM2+) - x2 Kingston HyperX 2GB DDR2-1066 (CAS 5-5-5-15) - ASUS M3A79-T Deluxe (AMD 790FX) - OCZ GameXStream (700 watt) - Seagate 500GB 7200-RPM (Serial ATA300) - ASUS GeForce GTX 280 (1GB) Software - Microsoft Windows Vista Ultimate SP1 (64-bit) - Nvidia Forceware 180.43 Beta |
Integrar el controlador de memoria en el dye (chip) ha dado resultados positivos para el Core i7 920 que logró en SiSoftware Sandra un ancho de banda para la memoria de 17GB/s usando nada más que la memoria DDR3 de 1066MHz. Correr tres de estos módulos en modo de tres canales tiene enormes beneficios en cuanto a desempeño se refiere.
El Core i7 940 con una velocidad ligeramente superior aumento el desempeño en 1 Gbit/s para igualar al Core i7 965 Extreme Edition.
El overclock del Core i7 965 EE junto con la memoria DDR3 permitió un ancho de banda para la memoria de 21GB/s!.
Cuando se lo compara con el Core 2 Quad Q9650 con memoria DDR3-1333 de dos canales, el Core i7 920 entrega dos veces más ancho de banda.
Aunque el Phenom X4 9950 también tiene el controlador de memoria en chip... su limitado FSB sólo le permite llegar a 10GB/s.
En la prueba aritmética de desempeño del procesador el Core i7 920 fácilmente supera al Core 2 Quad Q9650. En esta prueba el Core i7 920 entregó 60% más desempeño en la prueba whetstone, y un 24% más en la prueba dhrystone. Por lo tanto, los procesadores Core i7 simplemente aumentan su desempeño en relación directa a su frecuencia.
La prueba multi-media SiSoft Sandraindica que los procesadores Core i7 ofrecen significativas ventajas de desempeño en relación a los procesadores Core 2 y Phenom X4.
El Core i7 920 fue 17% más rápido que el Phenom X4 9950 en la prueba multi-media float, y un 21% más rápido en la prueba multi-media int.
Una vez más el desempeño aumenta en relación directa con la frecuencia del procesador, y aumentar la frecuencia de trabajo del Core i7 965 Extreme Edition tuvo un impacto notable en su desempeño: funcionando a una frecuencia de 3,88GHz es un 38% más rápido que el Core i7 920.
Con esa frecuencia la a entre los núcleos llego a unos increíbles 45GB/s.
La escalabilidad es una mejora notable en la architectura Core i7.
A pesar de ser 670MHz más lento que el Core 2 Duo E8600, el Core i7 920 en realidad fue 100KB/s más rápido en la prueba de un solo hilo. Cuando vemos el desempeño de varios hilos que tuvo el Phenom X4 9550 podemos apreciar que fue superado por el Core 2 Quad con 1567KB/s. El Core i7 920 que logró 76% mas desempeño. Este procesador fue superado por el 940 que logró un desempeño 10,5% más rápido.
No comments:
Post a Comment