Проводится регулярный семинар «Высокопроизводительные вычисления» на базе ССКЦ, кафедры Вычислительных систем НГУ и Центра Компетенции по высокопроизводительным вычислениям СО РАН - Intel.
Заседания семинара проходят в конференц-зале ИВМиМГ СО РАН по четвергам в 11-00.
Архив семинаров: 2017, 2016, 2015.
Презентации последних семинаров:
к.ф.-м.н. А.Ю. Амбос (ИВМиМГ СО РАН)
Аннотация
Метод Монте-Карло особенно эффективен в тех случаях, когда численно реализуемая вероятностная модель (например, базовый ансамбль траекторий каких-либо частиц) содержит случайные параметры, определяющие распределения элементов траекторий, в частности, длин свободных пробегов квантов излучения. В этих случаях эффективен метод "двойной рандомизации". При решении задач переноса этим методом для каждой реализации среды достаточно моделировать лишь одну траекторию частицы. Кратность рандомизации возрастает при вычислении корреляционных характеристик потоков частиц, дисперсий функционалов и параметров соответствующих асимптотик. Дисперсии статистических оценок существенно возрастают при увеличении кратности рандомизации, поэтому здесь необходимы параллельные вычисления, по-видимому, с использованием сопроцессоров, так как алгоритмы реализации параметров среды и базовых траекторий имеют разную структуру и масштаб. Практически важны реалистические модели случайных сред, которые получаются суммированием независимых реализаций элементарных пуассоновских поле, что можно учесть при организации супервычислений.
В.А. Иващенко (ИТ СО РАН, НГУ)
Аннотация
В работе при помощи прямого численного моделирования уравнений Навье-Стокса (DNS) и метода моделирования крупных вихрей (LES) проводится исследование процессов перемешивания в турбулентных затопленных струях. Рассматривается импульсный и стационарный поток воздуха, вытекающий из длинной трубы круглого сечения в безграничное пространство, затопленное воздухом, гелием или углекислым газом. Входные условия идентичны во всех трёх случаях, что важно для их прямого сравнения, и соответствуют полностью развитому турбулентному течению в трубе, характеристики которого определяются только числом Рейнольдса. Для получение данных активно используется кластер НКС-1П ССКЦ.
к.ф.-м.н. С.А. Соловьев (ИНГГ СО РАН)
Аннотация
Сравнивается производительность двух акустических решателей в контексте геофизической задачи полного обращения волновых полей. Используя высококонтрастную 3-мерную скоростную модель, проводится серия экспериментов с различным числом кластерных узлов и числом источников. При увеличении числа узлов решатель во временной области (TD) работает быстрее решателя в частотной области (FD разработанный автором). Это происходит благодаря идеальной масштабируемости TD решателя. Также при увеличении числа источников FD становится быстрее TD, начиная с некоторого числа источников. Такое поведение FD основано на используемых подходах: факторизация матрицы, переупорядоченная алгоритмом вложенных сечений, и сжатие данных, используя аппроксимацию матрицами малого ранга и иерархический (HSS) формат данных. Таким образом, оба решателя являются актуальными: область использования каждого решателя определяется мощностью кластера (количество узлов) и размером геофизической модели (количество источников).
А.В. Кашковский, А.А. Шершнев, П.В. Ващенков (ИТПМ СО РАН)
Аннотация
Рассмотрен подход, который позволяет использовать расчетный код на различных типах вычислительных устройств, в том числе ГПУ, многоядерных ЦПУ и ускорителях Intel Xeon Phi. Основная идея заключается в конвертировании исходного текста программы, написанной для выполнения на ГПУ с использованием технологии CUDA, в многопоточную параллельную программу, основанную на использовании технологии OpenMP. Дано сравнение времени вычислений на различных архитектурах процессоров (ГПУ, ЦПУ, Intel Xeon Phi) и показана эффективность параллелизации. Часть расчетов проводилась на кластерах НКС-30 и НКС-1П ССКЦ, и были выявлены некоторые особенности вычисления на этих кластерах. На примере гибридного (ГПУ+ЦПУ) расчета продемонстрированы возможности и особенности гибридных вычислений.
И.И. Кулагин (СибГУТИ)
Аннотация
Работа посвящена разработке и исследованию средств архитектурно-ориентированной оптимизации выполнения параллельных программ для вычислительных систем (ВС) с многоуровневым параллелизмом. Предложены алгоритмы оптимизации использования параллелизма для основных функциональных уровней ВС. На уровне вычислительных узлов (ВУ) реализован алгоритм, выполняющий оптимизирующую трансформацию циклических конструкций в параллельных PGAS-программах. Алгоритм реализован в виде расширения компилятора IBM X10. На уровне многопроцессорного ВУ с общей памятью рассмотрены задачи оптимизации реализаций программной транзакционной памяти (software transactional memory - STM). Для параллельных STM-программ разработан метод сокращения числа ложных конфликтов по результатам их предварительного профилирования. Для известных алгоритмов автоматической векторизации циклов в открытых компиляторах GCC и LLVM/Clang выявлены классы трудно векторизуемых циклов из тестового набора ETSVC (J. Dongarra, D. Padua). Построенное подмножество циклов составляет базисный набор для анализа эффективности ядер автовекторизаторов оптимизирующих компиляторов для векторных процессоров класса «регистр-регистр».
д.ф.-м.н. Г.В. Решетова (ИВМиМГ СО РАН)
Аннотация
Рассматриваются проблемы параллельной организации вычислений для решения современных задач сейсмики большой размерности на примере работ с OOO «РН-КрасноярскНИПИнефть» по теме «Разработка технологии выявления трещиновато-кавернозных резервуаров и определения их характеристик на основе инновационных методов обработки и интерпретации рассеянных волн».
к.ф.-м.н. А. В. Снытников (ИВМиМГ СО РАН)
Аннотация
Программа для моделирования динамики плазмы с помощью метода частиц в ячейках реализована с использованием технологии OpenMP. В докладе будут представлены результаты тестирования программы с помощью инструментов Intel Thread Checker (поиск ошибок распараллеливания), Intel Vectorization Advisor (рекомендации по оптимизации кода) и Intel Vtune (профилировка). Также будут показаны результаты оптимизации кода с учетом собранной информации.
к.ф.-м.н. И.Г. Черных (ИВМиМГ СО РАН)
Аннотация
На семинаре рассмотрены архитектура кластера НКС-1П, правила получения доступа (логина) на кластер, особенности компиляции и сборки программ на кластере НКС-1П под разные типы процессоров, работа с очередью задач: KNL и Broadwell.
С.Е. Киреев (ИВМиМГ СО РАН)
Аннотация
Было выполнено сравнение производительности двух кластеров: нового кластера НКС-1П (ССКЦ СО РАН) с узлами на базе процессоров KNL и Broadwell и кластера МВС-10П (МСЦ РАН) 2013 года создания с узлами на базе процессоров Sandy Bridge и ускорителями на базе процессоров KNC. Для оценки производительности использовался разработанный ранее параллельный программный комплекс для двумерного моделирования нелинейной многофазной фильтрации в деформируемой пористой среде. Программный комплекс был оптимизирован для кластеров с процессорами Xeon Phi: выполнена векторизация вычислений, а также распараллеливание с помощью MPI и OpenMP.
А.А. Петров (ФГАОУ ВО «НИ ТГУ»)
Аннотация
Целью настоящей работы является повышение эффективности интеграции вычислительных ресурсов локальной сети, а также эффективности проектирования, создания и эксплуатации распределенных приложений путем создания модели методов распределения вычислительных задач по узлам сети и реализации платформы, объединяющей локальные вычислительные ресурсы в единую вычислительную среду.
T. Gurov (IICT-BAS)
Аннотация
The recent advances in HPC increasingly rely on the use of accelerators and other similar devices that improve the energy efficiency and offer better performance type of computations. The Xeon Phi co-processors combine efficient vector floating point computations with familiar operational and development environment. In order to allow the quasi-Monte Carlo algorithms to make use of hybrid OpenMP+MPI programming, we implemented generation routines that save both memory space and memory bandwidth, with the aim to widen the applicability of quasi-Monte Carlo algorithms in environments with an extremely large number of computational elements. We present our implementation and compare it with regular Monte Carlo using a popular pseudorandom number generator, demonstrating the applicability and advantages of our approach. We present also adapted quasi-Monte Carlo algorithms for numerical integration and matrix algorithms, and their timing and scalability results.
A. Karaivanova (IICT-BAS)
Аннотация
The recent advances in HPC increasingly rely on the use of accelerators and other similar devices that improve the energy efficiency and offer better performance type of computations. The Xeon Phi co-processors combine efficient vector floating point computations with familiar operational and development environment. In order to allow the quasi-Monte Carlo algorithms to make use of hybrid OpenMP+MPI programming, we implemented generation routines that save both memory space and memory bandwidth, with the aim to widen the applicability of quasi-Monte Carlo algorithms in environments with an extremely large number of computational elements. We present our implementation and compare it with regular Monte Carlo using a popular pseudorandom number generator, demonstrating the applicability and advantages of our approach. We present also adapted quasi-Monte Carlo algorithms for numerical integration and matrix algorithms, and their timing and scalability results.
С.С. Журавлев (ИВТ СО РАН)
Аннотация
Ошибки в прикладном программном обеспечении автоматизированных систем управления технологическими процессами (АСУ ТП) могут стать причиной возникновения аварийных ситуаций или сбоев в режиме работы технологического оборудования. На этапе пуско-наладочных работ и опытно-промышленной эксплуатации устранение ошибок в прикладном программном обеспечении требует дополнительного времени, что, в свою очередь, замедляет процесс внедрения АСУ ТП и приводит к появлению экономических потерь. Поэтому важно осуществлять как можно более полное тестирование прикладного программного обеспечения АСУ ТП на предприятии изготовителе. Решение этой задачи возможно с помощью тестирования программ управления прикладного программного обеспечения АСУ ТП, используя проблемно-ориентированные имитационные модели соответствующих технологических процессов. В работе приведен обзор методов и средств повышения надежности прикладного программного обеспечения. Рассматриваются проблемно-ориентированные имитационные модели технологического оборудования угольной шахты подсистем конвейерного транспорта и водоотлива и созданные с их помощью модели технологических процессов. Приведены описания структуры и функционирования имитационного программно-аппаратного комплекса для тестирования программ управления АСУ ТП шахт и рудников.
К.В. Лотов, А.П. Соседкин (ИЯФ СО РАН)
Аннотация
Плазменное кильватерное ускорение — молодое и перспективное направление в области ускорения заряженных частиц. Суть явления сводится к инжектированию частиц в плазму совместно с ультрарелятивистским драйвером, возмущающим плазменные волны и передающим таким образом энергию ускоряемым частицам. В будущем метод сулит возможность разгона пучков до рекордных параметров в коротких линейных ускорителях. В докладе будут доступно изложены физические основы явления, кратко описаны принципы его моделирования и используемый способ распараллеливания вычислений, а также высказаны впечатления и пожелания, возникшие в ходе использования ЦКП ССКЦ.
Ю.Ю. Васькин (ИВМиМГ СО РАН, Politecnico di Milano)
Аннотация
Решение задач потоковой доставки данных биологу, организации разностороннего доступа к полученным экспериментальным данным с помощью предметно-ориентированных языков и вычислительных конвейеров. Отработка методов и систем, которые могут быть применены для решения аналогичных задач в других научных областях.
И. Ю. Просанов (ИХТТиМХ СО РАН), E. Benassi (Scuola Normale Superiore di Pisa, Italy)
Аннотация
Решается задача синтеза неорганических полимеров - галогенидов, оксидов/гидроксидов и халькогенидов. Их стабилизация достигается использованием органической матрицы. Для установления структуры этих материалов применяется комбинированный подход, включающий компьютерное моделирование структуры и свойств и сравнение рассчитанных и экспериментально наблюдаемых колебательных спектров. Среди получаемых неорганических полимеров такие важные для приложений соединения как: CuO, ZnO и CdS.
к.т.н. А.В. Кашковский, к.ф.-м.н. А.А. Шершнёв (ИТПМ СО РАН)
Аннотация
Расчеты на ГПУ Tesla K40 методом прямого статистического моделирования (ПСМ) показали катастрофическое падение вычислительной производительности при увеличении объема задачи. Причиной этого оказалось уменьшение в десятки раз скорости произвольного доступа к памяти, который используется в алгоритме метода ПСМ. Как оказалось, это происходит практически на всех ГПУ с большим объемом памяти. Предложены способы учета этой особенности ГПУ и алгоритмы, позволяющие преодолеть эту проблему и повысить производительность.
Старый сайт