|
02.10.2009 09:00 |
| |
NVIDIA Fermi - архитектура не только для вычислений |
|
Помимо фотографий графического ускорителя NVIDIA Tesla, во время официального анонса графического процессора GT300 была показана новая информация касательно архитектуры с кодовым названием Fermi. На слайдах продемонстрированы общие характеристики новинки, организация потоковых мультипроцессоров и их структура, результаты производительности в вычислениях чисел с плавающей запятой и другое.
Как и сообщалось ранее, графический процессор нового поколения GT300 содержит три миллиарда транзисторов, имеет 512 шейдерных ядер и обеспечивает производительность в вычислениях с двойной точностью, в восемь раз превышающую производительность чипа GT200.
Потоковые мультипроцессоры расположены вокруг общей кэш-памяти второго уровня. На слайде каждый такой мультипроцессор представляет собой вертикальный прямоугольник, который содержит оранжевую часть (планировщик и организатор), зелёную часть (исполнительные модули) и голубые части (файлы регистров и кэш-память первого уровня).
На следующем слайде показана внутренняя структура мультипроцессора. Каждый из 16 мультипроцессоров имеет 32 шейдерных ядра, что в сумме даёт 512 так называемых CUDA-ядер.
Что касается памяти, новый GPU оснащён шестью 64-разрядными контроллерами памяти GDDR5, что даёт 384-битную шину памяти и поддержку до 6 ГБ памяти GDDR5. Fermi является первой архитектурой, поддерживающей код коррекции ошибок (ECC) для данных, хранящихся в памяти. Технология NVIDIA Parallel DataCache значительно ускоряет математические вычисления и выполнение других функций.
На слайде показано сравнение производительности в вычислениях чисел с плавающей запятой двойной точности между видеокартой Tesla C1060 и новой моделью на архитектуре Fermi. В тесте с 20480 объектами новинка показывает результат 18,16 кадров в секунду, производя за секунду 7,61 млрд итераций. Её предшественница способна лишь на 3,52 кадра в секунду, выполняя за секунду 1,47 млрд итераций.
Решения на архитектуре Fermi называют первыми в мире вычислительными GPU. Благодаря набору инструкций Parallel Thread eXecution второго поколения (PTX 2.0), в них реализована аппаратная поддержка таких средств программирования, как C, C++, Fortran и множество других функций (таких как унифицированное адресное пространство, OpenCL и DirectCompute).
Основной задачей Fermi считают перенос вычислений больших массивов данных на GPU, оставив в ответственности центрального процессора обработку множества различных инструкций.
К сожалению, на конференции GPU Technology Conference не были упомянуты даты выхода продуктов на архитектуре Fermi. Ожидается, что в ближайшие месяцы компания NVIDIA закончит работу над чипом GT300, и на его основе появятся продукты серий GeForce, Quadro и Tesla.
В заключение, приводим сравнительную таблицу характеристик чипа GT300 и его предшественников:
GPU
|
|
|