Sitios web

Nvidia presenta la arquitectura de próxima generación de Fermi

LAS NUEVAS TARJETAS GRÁFICAS NVIDIA "RTX" Serie 20 con ¿Ray Tracing?

LAS NUEVAS TARJETAS GRÁFICAS NVIDIA "RTX" Serie 20 con ¿Ray Tracing?
Anonim

Nvidia puede haber cambiado su NVISION promocional conferencia para la "Conferencia de tecnología GPU", pero sigue siendo un show de Nvidia de principio a fin. La CEO Jen-Hsun Huang tomó algo de tiempo durante su discurso para dar a conocer la próxima arquitectura principal de GPU de la compañía, cuyo nombre clave es "Fermi". Este es el chip que los fanáticos han estado llamando GT300, el sucesor generacional del chip GT200 que alimenta tarjetas como la GeForce GTX 285.

El gigante de los chips tuvo mucho cuidado de posicionar el chip como un nuevo chip gráfico, sino como un nuevo " cómputo y gráficos", en ese orden (cursiva mía). De hecho, casi todo lo que se revela sobre el nuevo chip se relaciona con sus características computacionales, en lugar de elementos tradicionalmente orientados a los gráficos, como unidades de textura y finales de render back. Lo que sí sabemos es que el chip es enorme con un estimado de 3,0 mil millones de transistores, y se producirá en un proceso de 40 nm en TSMC. Esto es aproximadamente un 40 por ciento más de transistores que el chip RV870 en las nuevas tarjetas DirectX 11 de la serie Radeon 5800 que acaba de lanzar su rival AMD. El chip tiene 512 unidades de procesamiento (Nvidia los llama núcleos CUDA) organizados en 16 "multiprocesadores de transmisión" de 32 núcleos cada uno. Esto es más del doble de los 240 núcleos en GT200, y los núcleos tienen mejoras significativas además. El chip utilizará una interfaz de memoria GDDR5 de 384 bits.

Estos son algunos de los principales puntos:

Multiprocesador de transmisión de tercera generación (SM)

  • 32 núcleos CUDA por SM, 4 veces más que GT200
  • 8x el pico de rendimiento de punto flotante de doble precisión sobre GT200
  • Programador dual de Warp que programa y despacha dos warps de 32 hilos
  • por reloj
  • 64 KB de RAM con una partición configurable de memoria compartida y caché L1

Second Ejecución paralela de generación de subprocesos ISA

  • Espacio de direcciones unificado con soporte completo de C ++
  • Optimizado para OpenCL y DirectCompute
  • Completo IEEE 754-2008 Precisión de 32 bits y 64 bits
  • Ruta entera de entero de 32 bits con 64 -bit extensiones
  • Instrucciones de acceso a la memoria para admitir la transición al direccionamiento de 64 bits
  • Rendimiento mejorado a través de Predication

Subsistema de memoria mejorado

  • Jerarquía paralela de DataCache de NVIDIA con L1 configurable y L2 unificada
  • Cachés
  • Primera GPU con soporte de memoria ECC
  • Operación de memoria atómica mejorada rendimiento

NVIDIA GigaThread Engine

  • cambio de contexto de aplicación 10x más rápido
  • ejecución de kernel concurrente
  • ejecución de bloque de subproceso fuera de servicio
  • motores de transferencia de memoria superpuestos

Hay muchas características adicionales que deberían mejorar el rendimiento de este chip en tareas informáticas de flujo, como una tasa de cálculo de coma flotante de doble precisión mucho más rápida. Las GPU actuales de Nvidia calculan la precisión doble a una fracción de la velocidad de las operaciones de precisión simple. Las operaciones de coma flotante de doble precisión ahora deberían tener la mitad del rendimiento de la precisión simple, lo cual es una gran mejora. Grandes mejoras en el almacenamiento en caché y la programación son evidentes también. Puede leer más sobre la arquitectura en la nueva página de Fermi de Nvidia, que incluye un documento en formato PDF.

Entonces, ¿cuándo podrá comprar una tarjeta gráfica que use este chip? Nvidia no está diciendo. Los representantes de la compañía han dicho que actualmente están "sacando el chip", lo que significa que las muestras de trabajo recién han regresado de la planta de fabricación. Haciendo una conjetura educada de la historia pasada, diríamos que diciembre es una fecha de lanzamiento optimista, y el primer trimestre de 2010 para una amplia disponibilidad es más probable. Espere que los tableros sean caros. Nvidia no divulgará el tamaño del chip, pero a juzgar por el recuento de transistores, supondría entre 450 y 500 mm 2 . Junto con los costos agregados de la placa de una interfaz de memoria de 384 bits y los desafíos para obtener buenos rendimientos de un chip tan grande en el relativamente nuevo proceso de fabricación de 40nm, y se buscan tarjetas que probablemente sean más poderosas y potentes más caras que las tarjetas de la serie Radeon 5800 recién lanzadas de AMD.

Siga a Jason Cross en Twitter o visite su blog.