NVIDIA GeForce GTX 470M SLI - это мобильное видеорешение класса high-end, основанное на двух GeForce GTX 470M, объединенных при помощи SLI. В этом режиме, как правило, каждая видеокарта занимается обработкой своего кадра. Из-за этого при низкой общей частоте смены кадров (меньше 30 fps) могут возникать микрозадержки, так как для обработки различных двух кадров может понадобиться разное время: например, причиной задержек могут быть ситуации, когда один обрабатываемый кадр сложнее, чем другой, или, скажем, когда после пары простых кадров идет пара сложных. Каждая GTX 470M основана на ядре GF104 и поддерживает DirectX 11и OpenGL 4.0.
Архитектура GF104
Само по себе ядро GF104 ничем не отличается от ядра GF100, используемого, например, в GeForce GTX 480 M: оно также имеет 384 шейдеров, шину памяти с разрядностью 256 бит и поддерживает GDDR5. Однако GF104-ядро GTX 470M имеет только 288 шейдеров из 384, а разрядность его шины памяти составляет 192 бита. Архитектура GF104 значительно отличается от архитектуры ядер GT215 (например, лежащего в основе GeForce GTS 350M) или G92b (GeForce GTX 285M). По сравнению с GF100, младшие GF104, GF106 и GF108 были не только урезаны, но и значительно переработаны. Если GF100 разрабатывалось специально для работы с профессиональными приложениями, то младшие ядра сразу нацеливались на покорение потребительского рынка. Они имеют больше шейдеров (3х16 вместо 2х16), больше текстурных блоков (8 вместо 4) и дополнительный блок специальных инструкций (SFU) в пересчете на потоковый мультипроцессор (SM). В силу того, что в мультипроцессоре до сих пор содержится всего 2 планировщика варпов (Warp Scheduler) вместо 3 шейдерных групп, Nvidia использует суперскалярное исполнение для того, чтобы более эффективно задействовать возросшее число шейдеров. В теории, это позволяет повысить производительность каждого индивидуального ядра. На практике же, в худшем случае производительность может быть даже хуже, чем у GF100 (и его предшественников). Защита памяти ECC, имеющая большую важность для профессиональных приложений, была полностью убрана, а возможности по осуществлению вычислений с плавающей точкой с двойной точностью были урезаны (число шейдеров, способных осуществлять такие вычисления составляет треть от общего, и они работают примерно в 12 раз медленнее шейдеров с одинарной точностью). Из-за этих изменений число потоковых мультипроцессоров увеличилось всего на 25% несмотря на большее число шейдерных процессоров и увеличенные планировщики варпов с возможностью суперскалярной раздачи. В силу иной архитектуры шейдеров и более высокой тактовой частоты доменных шейдеров, число ядер нельзя напрямую сравнивать с числом ядер в продуктах AMD серии Radeon 5000 (например, HD5850).
Более детальную информацию об архитектуре GF104 (а также GF106 и GF108) можно найти в статье от Anandtech, посвященной десктопной версии GTX 460.
Производительность
Производительность связки GTX 470M SLI должна примерно соответствовать таковой у GTX 480M SLI за счет более высоких частот работы GTX470M. Вообще, прирост производительности от использования SLI режима сильно зависит от конкретного приложения/игры и драйверов. На текущий момент, программная реализация поддержки SLI от Nvidia сделана более качественно, чем у аналогичного предложения от AMD, за счет чего видеокарты от Nvidia использовать парами выгоднее. В среднем, при работе или игре в высоких разрешениях с активированным сглаживанием, результаты GTX 470M SLI могут на 30% превосходить результаты одиночной GTX 470M. Таким образом, в любые игры, вышедшие в 2010 году, за исключением, пожалуй, Metro 2033, данная связка позволяет играть при максимальных настройках графики. Что касается Metro 2033, то в наших тестах с участием GTX 480M SLI результатом бенчмарка были 23 кадра в секунду – примерно того же можно ожидать и от GTX 470M SLI.
Особенности
В серии чипов GF104/106/108 появилась поддержка вывода Bitstream HD Audio(Blu-Ray) через HDMI. Таким образом, как и Radeon HD 5850, наш GTX 470M способен выводить звук в стандартах Dolby True HD и DTS-HD без потерь на внешний Hi-Fi ресивер
Также, GTX470M поддерживает технологию декодирования видеоконтента PureVideo HD. Встроенный Видео Процессор 4 (VP4) поддерживает набор инструкций C и позволяет GPU декодировать MPEG-1, MPEG-2, MPEG-4 Part 2 (MPEG-4 ASP – например, DivX or Xvid), VC-1/WMV9, и H.264 (VLD, IDCT, Motion Compensation и Deblocking). В тестовой модели X500, GTX 470M смог декодировать закодированное в VC— видео Elephants Dream с загрузкой процессора около 3-6% (по показаниям диспетчера задач). Big Buck Bunny в H.264 было проиграно с загрузкой 1-3% (оба видеофайла имели разрешение 1080p).
Более того, GPU вполне способен декодировать два видеопотока в 1080p одновременно (например, Картинка-в-картинке Blu-Ray).
Поддержка CUDA, OpenCL, и DirectCompute 2.1 позволяет использовать GeForce GTX 470M для различных вычислений. Например, потоковые процессоры позволяют значительно быстрее кодировать видеоданные, чем даже современные высокопроизводительные процессоры. Вычисления физики можно производить на GPU с использованием PhysX (данная функция поддерживается, например, в Mafia 2 и Metro 2033). В SLI-связке одна карта может полностью быть задействована под PhysX-вычисления.
Nvidia также говорит о поддержке новыми картами GTX технологии 3D Vision. Она позволяетпозволяет ноутбуку выводить 3D контент (3D игры, 3D потоковое видео, 3D фото, 3D Blu-Ray видео) на встроенный (если таковой установлен производителем ноутбука) или внешний 3D экран.
По слухам, энергопотребление GeForce GTX 470M должно быть в районе 75 Ватт (TDP включает в себя MXM карту и память), что примерно соответствует Mobility Radeon HD 5870. Таким образом SLI-связке понадобится не более 2х75 Ватт энергии, что значительно меньше 2х100 Ватт у GTX 480M SLI.Без нагрузки, карта работает на частотах 50/100 МГц (чип/ шейдеры) в 2D и 200/400 в 3D для экономии энергии.
Если сравнивать данное мобильное решение с десктопными видеокартами, то примерно аналогичную производительность будет демонстрировать SLI связка из GTS 450 SLI, так как GTX 470 для настольных компьютеров значительно быстрее одиночной 470M.
- Разброс результатов видеопроцессора - Средний результат видеопроцессора * Меньше = лучше
Игровые тесты
Тесты на производительность, результаты которых выведены ниже, получены лично нами при тестировании различной электроники. Производительность графического процессора зависит от качества питания и охлаждения, установленных производителем ограничений TDP, параметров видеопамяти, версии драйвера, версии ОС и других факторов. Если в приведённых ниже таблицах игровых тестов кликнуть по количеству к/с, будут выведены условия проведения теста.