Темы Разделы Интересы Top 20
 |
 NVIDIA выпустила новую версию платформы параллельных вычислений CUDA , которая поможет биологам, химикам, физикам, геофизикам и другим исследователям и инженерам ускорить симуляции и вычисления с помощью GPU.
Новая платформа параллельных вычислений NVIDIA CUDA включает три основных изменения, которые упрощают и ускоряют параллельное программирование на GPU:
обновленный Visual Profiler с автоматизированным анализом производительности позволяет быстрее ускорить приложение;
новый компилятор на базе популярной инфраструктуры с открытым кодом LLVM ускоряет работу приложений на 10%;
cотни новых функций вывода изображений и обработки сигнала удваивают размер библиотеки NVIDIA Performance Primitives (NPP) .
Новая версия платформы параллельных вычислений CUDA доступна бесплатно на сайте разработчиков NVIDIA по этому адресу .
Более подробно о ключевых изменениях:
Новый Visual Profiler - самый легкий способ оптимизации производительности
Новый Visual Profiler позволяют разработчикам любого уровня легко оптимизировать свой код для максимальной производительности. Благодаря автоматизированному анализу производительности и искусной системе управления, которая дает пошаговые советы по оптимизации, Visual Profiler определяет узкие места в производительности приложения и предлагает способы их устранения. С новым Visual Profiler проблемы производительности легко находить и устранять.
Компилятор LLVM - мгновенный 10%-ый прирост производительности приложения
LLVM - это популярная инфраструктура с открытым кодом, имеющая модульный дизайн, который позволяет легко добавлять поддержку новых языков программирования и процессорных архитектур. С помощью нового LLVM-компилятора CUDA разработчики могут повысить производительность на 10% в приложениях, ускоряемых графическим процессором за счет простой перекомпиляции. А модульный дизайн LLVM позволяет сторонним разработчикам инструментов создавать LLVM-решения для архитектур, отличных от NVIDIA, чтобы запускать приложения CUDA на графических процессорах не только от NVIDIA, но и от других компаний.
Новые функции вывода изображений и обработки сигнала в библиотеке NPP
NVIDIA удвоила размер библиотеки NPP, добавив сотни новых функций обработки изображения и сигнала. Разработчики, использующие такие алгоритмы, выиграют от GPU, добавив обращение к библиотеке в свои приложения. Обновленную библиотеку NPP можно использовать для широкого спектра алгоритмов обработки изображений и сигналов - от базового фильтрования до передовых технологических процессов. #vk ixbt.com »
|
|
 В грядущих процессорах для портативных устройств NVIDIA Kal-El большое внимание было уделено энергопотреблению , что должно решить одну из актуальных проблем нынешних коммуникаторов и планшетов: малую длительность автономной работы. В нетребовательных задачах четыре основных ядра отключаются и за дело берется пятое ядро-компаньон, при этом в официальных документах также освещалась производительность Kal-El при нагрузке на полную.
В тестовом пакете CoreMark новое детище NVIDIA демонстрирует двукратное превосходство над предыдущей двухъядерной платформой компании, Tegra 2, еще больше увеличивая отрыв в сравнении с Apple A5, использующимся в планшете iPad 2 . Также бросается в глаза скромный результат Qualcomm Snapdragon MSM8660 , который в этом сравнении работал на частоте 1,2 ГГц, что не помогло ему выделиться на фоне Texas Instuments OMAP4430 и NVIDIA Kal-El, а частота последних двух ниже на 200 МГц.
NVIDIA справедливо отмечает, что наибольший эффект от новой платформы будет заметен в хорошо распараллеливаемых задачах: обработка изображений, перекодирование видео- и аудиоматериалов и архивирование. Вероятно, из этого списка на планшетах наибольшей популярностью будет пользоваться первый пункт, если вспомнить о стереоскопических фотомодулях и возрастающем количестве мегапикселей при стабильно неизменном качестве оптики.
Примером возможностей Kal-El в этой области приводятся результаты в приложении для создания панорамных фото Photaf 3D Panorama. В ней новинка демонстрирует неоспоримое превосходство над своим двухъядерным предшественником и справляется с задачей быстрее.
Еще одной дисциплиной, в которой NVIDIA Kal-El блеснул своими четырехъядерными способностями, стал Linpack. Не меньший прирост должен наблюдаться и в реальных приложениях, оптимизированных для многопоточного исполнения.
В конвертере видео Handbrake, как и в предыдущем тесте, у Kal-El отключили два ядра и сравнили результаты с полной версией этой однокристальной системы.
В играх со сложной графикой и физическими эффектами, на которые делает упор NVIDIA, отрыв Kal-El от Tegra 2 более чем двукратный. Очень хочется верить, что разработчики популярного ПО смогут достаточно быстро научить свои программы использовать все доступные ядра.
Источник: NVIDIA ixbt.com » |
|
| |
|