Topic: IvyBridge и SVP

Я, видимо, первый, кто собрал себе систему на IvyBridge для использования с SVP. Получилось весьма бюджетно:

Процессор: Intel Core i5 3570K

7 тыс. руб.

Материнская плата: ASUS P8Z68-V LX (обзор)
3 тыс. руб.

Память: 2x4ГБ Samsung M378B5273CH0-CH9 (обзор)
1,6 тыс. руб.

Это первый процессор, чье графическое ядро Intel HD Graphics 4000 поддерживает OpenCL-расчеты и может быть использовано для ускорения работы SVP.

Краткие выводы по процессорам IvyBridge из всего обсуждения:

Скоростные характеристики:
- аппаратный декодер QuickSync 2.0 в состоянии декодировать H.264 FullHD на скорости 600 к/сек tongue
- лучшую скорость расчетов на встроенном графическом ядре дает драйвер 9.17.10.2729 Beta: прирост скорости 19%
- Сравнение iGPU против dGPU:
-- применение встроенного графического ядра для ускорения расчетов дает ускорение максимум на 71%

(применение дискретной видеокарты - на 97%)

-- максимально доступная скорость построения кадров для Intel HD Graphics 4000 находится в районе 150 к/сек
(для GTX 260 - в районе 300 к/сек)

-- скоростная оперативная память (1866, 2133 и 2400 МГц) может дать прирост скорости 4-11% на этом процессоре без применения GPU-ускорения, 6-9% при использовании встроенного графического ядра
(7-23% при использовании дискретной видеокарты)

Повышение плавности + повышение резкости/качественная отрисовка:
- на мониторе 1920x1200 GPU-ускорение расчетов SVP и отрисовка на madVR встроенное графическое ядро не потянуло sad
- на мониторе 1680x1050 - потянуло, еще и запас остался cool
-- загрузка при повышении плавности (SVP) + повышение резкости (sharpen complex 2) = 43% CPU + 75% GPU
-- загрузка при повышении плавности (SVP) + качественная отрисовка (madVR) = 57% CPU + 76% GPU

Разгон:
- разгон памяти дает прирост скорости 7-20%, чем мощней GPU, тем прирост выше
- графическое ядро без поднятия напряжения разогналось на 30% и заработало на частоте 1500 МГц

Оставшиеся вопросы:
- что может дать разгон графического ядра?
- возможно ли ускорение проигрывания 10 бит видео?
- на сколько снижается производительность при включении бикубической интерполяции в SVP? Какое разрешение при этом тянет?

Приглашаю к обсуждению владельцев IvyBridge и всех заинтересованных wink

2 (edited by vivan 14-05-2012 05:16:01)

Re: IvyBridge и SVP

Chainik
можешь что-нибудь из файлов тут: http://forum.doom9.org/showthread.php?t=163110 прогнать (в LAV'е в DXVA нативе и QS)?
Интересно, просто, насколько заоблачными будут результаты нового QS big_smile
З.ы. фуджипег sad

Re: IvyBridge и SVP

Я так понимаю, обсуждение QuickSync 2.0 в этой теме должно ответить на вопрос:
"А что если собрать систему на IvyBridge без дискретной видеокарты?" big_smile

Тогда нужно еще доукомплектовать систему быстрой памятью 2133 МГц, вот тогда встроенное видео покажет себя во всей красе. Плюс я не включал еще всяких там бустов, турбы и т.д. для графич. ядра процессора. Результаты получены в режиме работы на номинале с памятью 1333 МГц. wink

Хотел графики сегодня строить и выставлять, но Chainik меня опередил. За что ему спасибо!

vivan
прогнать (в LAV'е в DXVA нативе и QS)?
Ага, приду домой, прогоню.

Правда я не понял по ссылке, как он три цифры мерял?
hmm

Re: IvyBridge и SVP

MAG79
"А что если собрать систему на IvyBridge без дискретной видеокарты?"
Хорошо бы на  IvyBridge , но в бюджетном сегменте , будет и быстро и холодно ...и  недорого .
Как я понимаю , разговор идет о построении на встроенном видео в качестве Гпу ускорения ?
Хватает ли на фул построение ? Можно ли при этом наложить шейдеры ?

Re: IvyBridge и SVP

vivan
можешь что-нибудь из файлов тут: http://forum.doom9.org/showthread.php?t=163110 прогнать (в LAV'е в DXVA нативе и QS)?
Я так понял они рендрят конкретное видео на скорость? Посвятите меня в этот обряд, плиз, как это делается?

Re: IvyBridge и SVP

Patcher
Посвятите меня в этот обряд, плиз, как это делается?

http://bluesky23.yu-nagi.com/en/#DXVAChecker
Закладка DSF/MFT, Check decoders -> DirectShow..., выбрать видяшку.
Около интересующего декодера тыкнуть в стрелочку, Benchmark -> EVR

Re: IvyBridge и SVP

MAG79
Правда я не понял по ссылке, как он три цифры мерял?
DXVAChecker выдает их. Вот, например: http://3.firepic.org/3/images/2012-05/1 … 4veb92.png Эти три цифры - это Min и Max FPS, а средняя - Average FPS.

Re: IvyBridge и SVP

Chainik
vivan
Спасибо. Разобрался. smile

Re: IvyBridge и SVP

Действительно, Quick Sync 2.0 показывает высокие результаты.
Core i5 3570K (Ivy Bridge с декодером Quick Sync 2.0 на ядре Intel HD Graphics 4000):

Avatar60p.mkv

LAV DXVA Native 562/615/644

10% CPU load

MS DTV-DVD 565/601/625
19% CPU load

LAV DXVA cb 122/136/139
40% CPU load

LAV SW 130/138/153
98% CPU load

7.Vortexx_1088p24fpsRef3-109Mpbs.mp4

LAV DXVA Native 283/283/283

13% CPU load

MS DTV-DVD 200/200/200
34% CPU load

LAV DXVA cb 116/129/142
40% CPU load

LAV SW 62/64/66
98% CPU load

LAV CUVID был недоступен, т.к. я не втыкал дискретную карту, а QuickSync-декодер говорил Not alailable, видимо, LAV 50.5 еще не умеет работать напрямую с QS 2.0.
Проверил только на двух файлах. Остальные не дождался. Медленно качает с рапиды.

Re: IvyBridge и SVP

Продолжу тему IvyBrigde и его встроенной графики. Взял хорошо разгоняющуюся память (M378B5273CH0-CH9, 2x4ГБ) и провел замеры скорости его работы на разной частоте памяти.
Вот один самый показательный график:

http://www.svp-team.com/forum/misc.php?item=1626

На рисунке показаны результаты теста high в к/сек (4-ый реальный тест из 6). Синий график - расчет на процессоре, светло-зеленый - расчет на процессоре с использованием встроенной видеокарты Intel HD Graphics 4000 (GPU-acceleration), темно-зеленый - тоже, но при увеличенном числе потоков, равном 10.
Как можно видеть, прирост производительности не линейный, поэтому дальнейшее увеличение частоты памяти скорее всего уже не приведет к
видимому росту скорости.

Прирост скорости по реальным тестам при разгоне памяти с 1333 до 2400 МГц составил от 7 до 19%. Я, конечно, разогнав память почти в 2 раза ожидал большего прироста. wink
Все результаты доступны в базе SVPmark'а.

Так получилось, что процессор работал не с родным множителем (35 вместо 34) и с отключенным авто-разгоном (TurboBoost). Поэтому можно считать, что процессор был немного заторможен и вместо положенных 3,6 ГГц работал на 3,5 ГГц. Замеры не закончены. Хочу завершить замеры с использованием процессора без ускорения, а так же добавить к ним результаты с дискретной картой. Выкладываю сейчас, т.к. вернусь к этому не ранее следующей недели.

Re: IvyBridge и SVP

LAV 50.5 еще не умеет работать напрямую с QS 2.0.

обнови дрова на интель
http://downloadcenter.intel.com/SearchR … amilyId=39
те, что ставятся из интернетов дефолтом кривые и недопиленные

Re: IvyBridge и SVP

Vovanchik
У меня сейчас 8.15.10.2696, по ссылке они же и еще 9.17.10.2729 Beta для Win8.
Спасибо. Скачаю, гляну. cool

Re: IvyBridge и SVP

Установил драйвера от Win8: 9.17.10.2729 Beta.
Драйвер подошел к Win7 x64. Результаты улучшились:

Тест high.
CPU: 45.1 fps
CPU + iGPU (8.15.10.2696): 63.7 fps
CPU + iGPU (9.17.10.2729): 75.55 fps! smile

Результаты доступны в базе SVPmark'а.

Re: IvyBridge и SVP

Судя по циферкам скорости передачи данных, чуваки наконец догадались что в данном случае общей памяти

(и общего кеша (?))
передавать ничего никуда не надо  big_smile
Однако сама числодробилка все еще на уровне AMD 5450 / NV 8600. А массовый HD2500 в 2.5 раза медленнее...

------
MAG79
До сих пор не раскрыта тема, что с ним происходит при одновременном декодировании + SVP + madVR?
Написал бы более-менее развернутую "статью" на тему... smile

Re: IvyBridge и SVP

Chainik
что с ним происходит при одновременном декодировании + SVP + madVR?
К сожалению, на текущих драйверах у меня не получилось заставить IviBridge это сделать на встроенном видео Intel HD Graphics 4000. С идеальной плавностью работает либо SVP OpenCL-ускорение вплоть до разрешения для FullHD, либо madVR (на мониторе 1920x1200, размер имеет значение).

Появилось два вопроса:
1. Справится ли встроенная видеокарта с этой же задачей на мониторе 1680x1050?
2. Почему расчетные кадры сдвинуты на пиксел вправо и вниз?

Ответ на первый вопрос смогу дать, когда подключу и проверю это дело, а со вторым вопросом надо будет более подробно поразбираться. Для начала выяснить на обоих ли версиях драйвера происходит такая проблема, а затем уже либо придется вносить изменения в SVP-шейдеры, либо искать настройку драйвера, чтобы кадры не сдвигались.

Re: IvyBridge и SVP

Вчера предварительно проверил разгонный потенциал HD Graphics 4000.
Графическое ядро работает на частоте 350 (в простое), 650 (в нагрузке), 1150 (в максимальной нагрузке). Судя по показаниям GPU-Z, ядро достаточно быстро переключается между частотами.
Так вот в BIOS имеется возможность задать максимальную частоту, на которую будет переключаться видеокарта. Частота задается с шагом 50 МГц. Без поднятия напряжения на графическом ядре у меня оно заработало и прошло тест SVPmark на частоте 1500 МГц. Разгон составил (1500-1150)/1225 = 30%. При этом показатель GPU-calc вырос с 130 до 162, что составило 25%. Это показатель синтетического теста. Влияние на результат реальных тестов проверю позже.

Re: IvyBridge и SVP

MAG79
К сожалению, на текущих драйверах у меня не получилось заставить IviBridge это сделать на встроенном видео Intel HD Graphics 4000. С идеальной плавностью работает либо SVP OpenCL-ускорение вплоть до разрешения для FullHD, либо madVR (на мониторе 1920x1200, размер имеет значение).
С мадвр понятно , но евр польз. ?
Конкретно интересуют следующие настройки гпу ускорение +евр рольз.(настройки рендеринга - форсировать 10 бит вход )+шарпен комплекс 2 .
форсировать 10 бит вход - на выходе должен быть РГБ32 , можно подглядеть в статистике . Думаю про надобность обязательной вертикальной синхронизации повторяться не надо .
Если всё вдруг нормально пойдет , добавь пожалуйста галку управления цветом .
Как вариант - можно пробовать добавить выделенной памяти для видяйки , где-то есть пост - помогает .
Заранее спасибо .

18 (edited by %username% 23-05-2012 07:52:08)

Re: IvyBridge и SVP

HD4000 - лицопальмажыпег

http://www.svp-team.com/forum/misc.php?item=1650

Post's attachments

222.jpg, 95 kb, 658 x 480
222.jpg 95 kb, 403 downloads since 2012-05-23 

Re: IvyBridge и SVP

%username%

Стыдно!

Ни капельки. Это пока лучший показатель GPU-ускорения на встроенной графике Intel smile
Вот если кто-то выбъет больше попугаев, тогда мне будет стыдно big_smile

20 (edited by %username% 23-05-2012 07:49:20)

Re: IvyBridge и SVP

MAG79
я не про Вас, я про мегапафосную HD4000 (под картинкой приметил)
Они еще хотели на ее основе делать аналог квадры
И это топовая голубая (во всех смыслах) интеграшка
HD2.5 будет еще медленнее
http://fc00.deviantart.net/fs27/f/2008/092/2/9/Facepalm_robotnik_by_Dr_Baconman.png

Re: IvyBridge и SVP

iGPU против dGPU

Я неделю назад начал тесты по сталкиванию лбами встроенной и дискретной графики. Далее оформлял результаты. И вот теперь наконец готов предоставить их на всеобщее обсуждение.
Еще перед тестированием было изначально ясно, что встроенная графика проиграет дискретной. Но у меня оставался еще целый список вопросов: насколько встроенная графика слабее в штатном режиме? а если разогнать частоту памяти? нужна ли быстрая память для Ivy Bridge? а если разогнать процессор? а если разогнать графическое ядро?...
На часть вопросов ответы уже есть. О них и пойдет речь. Для начала опишу, что с чем сравнивал.

http://www.svp-team.com/forum/misc.php?item=1654

Привел типичные характеристики железа, работающего в штатном режиме. Отдельно разгонял память с 1333 до 2400 МГц, отдельно центральный процессор с 3400 до 4600 МГц. Измерения производительности и стабильности делал при помощи SVPmark. Ниже приведены результаты только по реальным тестам, т.к. они важней синтетики с точки зрения пользования пакетом SVP на этом железе.
Сравнивались следующие величины:
1. Какую прибавку процессору дает встроенное графич. ядро (iGPU). Старый (iGPU old) и новый драйверы.
2. Какую прибавку процессору дает дискретная видеокарта (dGPU). На сколько процентов результаты ускорения на dGPU быстрее, чем на iGPU.
3. Какой прирост скорости дает разгон памяти с 1333 до 2400 МГц в зависимости от применяемого ускорителя.

http://www.svp-team.com/forum/misc.php?item=1655

Под-тест good. Соответствует оптимальным настройкам плавности в SVP 3.0. набор настроек и скорость расчетов в SVP 3.1 немного поменялись, но можно считать это изменение незначительным. Качество увеличилось, но оптимальные настройки остались примерно на том  же уровне производительности.
Процессор справляется даже без ускорителей, выдавая 71-76 к/сек. Это выше необходимых 60 к/сек.

Анализ отличий.
1. Прирост от iGPU: 22% (на старом драйвере - только 13%).
2. Прирост от dGPU: 63% (это быстрее, чем iGPU в 1,34 раза).
3. Разгон памяти увеличил результаты CPU на 7%, iGPU - на 7%, dGPU - на 11%. Для дискретной видеокарты разгон принес больше пользы, чем для процессора и встройки.

http://www.svp-team.com/forum/misc.php?item=1656

Под-тест high. Соответствует настройкам плавности, немного выкрученным в сторону повышения качества в ущерб производительности.  Процессор без ускорителя не справляется, показывая только 46-48 к/сек из требуемых 60-ти. Применение любого ускорителя сразу решает эту проблему и скорость повышения плавности преодолевает планку в 60 к/сек.

Анализ отличий.
1. Прирост от iGPU: 71% (на старом драйвере - только 43%).
2. Прирост от dGPU: 97% (это быстрее, чем iGPU в 1,15 раза).
3. Разгон памяти увеличил результаты CPU на 4%, iGPU - на 9%, dGPU - на 7%. Для встроенного графического ядра разгон принес больше пользы, чем для процессора и дискретной видеокарты.

http://www.svp-team.com/forum/misc.php?item=1657

Под-тест highest. Соответствует максимально тяжелым настройкам плавности, сильно выкрученным и не гарантирующим повышение качества, но требующим еще больше производительности.  Этот случай уже не такой широкоприменяемый как первые два и представляет собой проверку запаса производительности на перспективу. Как можно увидеть, тест и правда очень требовательный. Процессор не справляется ни без ускорителя, ни с ускорителем, и даже в разгоне до 4600 МГц показывает результат только 54 вместо положенных 60 к/сек.

Анализ отличий.
1. Прирост от iGPU: 54% (на старом драйвере - только 43%).
2. Прирост от dGPU: 70% (это быстрее, чем iGPU в 1,11 раза).
3. Разгон памяти увеличил результаты CPU на 5%, iGPU - на 6%, dGPU - на 5%. Для встроенного графического ядра разгон опять принес больше пользы, чем для процессора и дискретной видеокарты.

Post's attachments

60_good.png, 11.31 kb, 481 x 289
60_good.png 11.31 kb, 390 downloads since 2012-05-23 

60_high.png, 11.23 kb, 481 x 289
60_high.png 11.23 kb, 391 downloads since 2012-05-23 

60_highest.png, 10.61 kb, 481 x 289
60_highest.png 10.61 kb, 381 downloads since 2012-05-23 

HW_config.png, 73.92 kb, 503 x 382
HW_config.png 73.92 kb, 411 downloads since 2012-05-23 

Re: IvyBridge и SVP

Из шести под-тестов три показали полезность встроенной графики, а оставшиеся три показали как будто бы полную (и не очень) бесполезность.

Начну с под-теста simple1. Это стандартное удвоение кадров, в котором эффективнее всего работает построение кадров. Для требуемых 48 к/сек необходимо рассчитать для 24 исходных кадров ровно 24 промежуточных.

http://www.svp-team.com/forum/misc.php?item=1658

Но почему же дискретная графика дает прирост результатов, а встроенная графика не дает? Ответ кроется в цифрах. Если взглянуть на результаты расчета только процессором, то видно, что они лежат в районе 126-133 к/сек. Это в 2,5 раза больше требуемой скорости 48 к/сек. При реальном проигрывании видео с плавностью скорость будет в 2,5 раза ниже, соответственно процессор будет загружен на 100/2,5 = 40%. GPU-ускорение должно еще освободить процессор, что в реальности даст меньшую частоту его работы, меньший нагрев, и как результат, меньший шум от системы охлаждения. smile Правда этот вывод касается горячих процессоров (Core i7 920, например), а IvyBribge - процессор достаточно холодный. wink
Но я не ответил на вопрос, почему встроенная графика не дала прироста? Если посмотреть показатель расчета кадров (GPU-calc), то можно увидеть там цифру 130. Это означает, что она способна рассчитывать 130 вакуумо-кадров на среднестатистических настройках плавности. Кроме этого имеются издержки на передачу данных процессор > видеокарта > процессор, что создает ограничение для применения видеокарты. В данном случае ограничение находится в районе 150 к/сек.

Анализ отличий.
1. Прирост от iGPU: 10% (на старом драйвере отрицательный: -3%).
2. Прирост от dGPU: 50% (это быстрее, чем iGPU в 1,36 раза).
3. Разгон памяти увеличил результаты CPU на 6%, iGPU - на 8%, dGPU - на 14%. Для дискретной карты на таких скоростях обработки и особенно пересылки данных является критичной частота работы оперативной памяти.

Под-тест fastest. Это еще более легкие настройки повышения плавности.

http://www.svp-team.com/forum/misc.php?item=1659

Подтверждается предположение об ограничении скорости встроенного графического ядра в районе 150 К/сек. Теперь даже от использования дискретной видеокарты не наблюдается  прироста. Вся мощь карты (GPU-calc = 935 вакуумо-кадров) съедаются издержками передачи данных. Но опять же причина вполне объяснима: завышенная в 6 раз скорость кадров. В реальных задачах при проигрывании видео таких частот кадров просто не бывает. Да и при обработке и перекодировании скорости куда скромней. А на низких скоростях GPU-ускорение покажет себя уже в более выгодном свете.

Анализ отличий.
1. Прирост от iGPU: -48% (на старом драйвере отрицательный: -52%).
2. Прирост от dGPU: 2% (скорость выше, чем с iGPU в 1,96 раза).
3. Разгон памяти увеличил результаты CPU на 11%, iGPU - на 8%, dGPU - на 23%. Что еще раз говорит о критичности частоты работы оперативной памяти  для дискретной карты на высоких скоростях обработки кадров (250-300 к/сек).

Под-тест simple2. Это соответствует легким настройкам при утроении кадров. Анализ векторов движения процессором выполняется с такими же затратами, как в под-тесте simple1, но при этом построение требует вдвое больших затрат от применяемого ускорителя.

http://www.svp-team.com/forum/misc.php?item=1660

В сравнении с графиком simple1 процессор показал увеличение результата со 131 до 175 к/сек, что говорит о том, что поиск векторов движения с пересчетом на один исходный кадр - это задача более трудоемкая, чем построить один новый кадр.

По грубым подсчетам для этого алгоритма у меня вышло, что построить 1 кадр для процессора в 7 раз легче, чем найти вектора. Странно. Откуда тогда приросты от GPU-ускорения 70%, если освобождается только 2/7 = 29%?
Второй вопрос: почему ограничение частоты кадров для iGPU снизилось со 150 до 120 к/сек? Затраты на расчет одного нового кадра идентичны под-тесту simple1, процессор трудится в 2 раза меньше. Парадокс. hmm

Дискретная видеокарта снова показала наличие ограничения для нее в районе 250-300 к/сек. Не так уже далеко ушла от встроенной графики: всего в два раза.
Но опять же повторю, Снижение результатов при использовании встроенной видеокарты наблюдается только из-за высокой скорости подачи исходных кадров. На нормальной скорости встроенное графическое ядро успешно справляется с построением даже на более тяжелых настройках.

Анализ отличий.
1. Прирост от iGPU: -34% (почти один-в-один как на старом драйвере: -35%).
2. Прирост от dGPU: 46% (скорость выше, чем с iGPU в 2,22 раза).
3. Разгон памяти увеличил результаты CPU на 5%, iGPU - на 7%, dGPU - на 10%. Еще раз подтвердилась критичность частоты работы оперативной памяти  для дискретной карты на высоких скоростях обработки кадров (250-300 к/сек).

Общие выводы
- Встроенное графическое ядро Intel HD Graphics 4000 справляется с повышением плавности вплоть до настроек под-теста high.  Для highest нехватило производтельности процессора, чтобы проверить;
- Несмотря на разницу производительности по синтетическим тестам в 7 раз, разница максимально доступной скорости построения кадров отличается всего в 2 раза и находится в районе 150 к/сек для Intel HD Graphics 4000 и 300 к/сек для GTX 260;
- Работа оперативной памяти на высокой частоте (1866, 2133 и 2400 МГц) может дать прирост скорости на процессоре на 4-11%%, на iGPU - на 6-9%, на dGPU - на 7-23%;
- Применение встроенного графического ядра для ускорения расчетов дает ускорение максимум на 71%, а применение дискретной видеокарты - на 97%.

Выводы касаются результатов теста SVPmark, показывающего OpenCL-расчетные возможности. Для оценки возможностей использования встроенного графического ядра Ivy Bridge не только для расчетов, но еще и для пост-обработки и для отрисовки требуются дополнительные проверки.

Post's attachments

48_fastest.png, 11.08 kb, 481 x 289
48_fastest.png 11.08 kb, 388 downloads since 2012-05-23 

48_simple1.png, 11.41 kb, 481 x 289
48_simple1.png 11.41 kb, 405 downloads since 2012-05-23 

72_simple2.png, 10.86 kb, 481 x 289
72_simple2.png 10.86 kb, 398 downloads since 2012-05-23 

Re: IvyBridge и SVP

MAG79
При этом показатель GPU-calc вырос с 130 до 162

HD4000 оказывается быстрее моей дискретной ноутбучной видяйки. А это значит, что на видяйках от Intel уже можно более-меннее спокойно играть с разрешением 1280*800. Даже не знаю, хорошо это или плохо - ноуту-то 4 года big_smile

Re: IvyBridge и SVP

Вот все-таки, эту бы энергию - да в вики  big_smile

Не раскрыта тема реальной работы в SVP 3.1.1 с бикубиком!

Re: IvyBridge и SVP

Chainik
Не раскрыта тема реальной работы в SVP 3.1.1 с бикубиком!
Прям сейчас НАКОНЕЦ !балуюсь ай5-2500к и свп . Напруга в номинале = работают все сберегайки=холодно=практически бесшумно (винты)
Максимум , чего смог добиться для 1080р : декодирование через ЛАВ guicksynk + evr sync . Шейдер комплекс 2 работает , но дергает - хоть в статистике все пучком . На 1360*768 выводе того же 1080р проблем с наложением шейдеров нет .

Камень грузится чуть более 60% на 4ггц , блоки 16*16 с уточнением + 21 шейдер .
Вопрос : на кой ляд вообще нужна дискретная видяйка ?