Шаг 75.
5. Паралллельные алгоритмы... Организация парал. вычислений для систем с распределенной памятью. Оценка трудоемкости операций передачи данных

    На этом шаге мы приведем оценку трудоемкости операций передачи данных.

    Время выполнения коммуникационных операций значительно превышает длительность вычислительных команд. Оценка трудоемкости операций приема-передачи может быть осуществлена с использованием двух основных характеристик сети передачи: латентности, определяющей время подготовки данных к передаче по сети, и пропускной способности сети, задающей объем передаваемых по сети за 1 секунду данных.

    Пропускная способность наиболее распространенной на данный момент сети Fast Ethernet - 100 Mбит/с, для более современной сети Gigabit Ethernet - 1000 Мбит/с. В то же время, скорость передачи данных в системах с общей памятью обычно составляет сотни и тысячи миллионов байт в секунду. Тем самым, использование систем с распределенной памятью приводит к снижению скорости передачи данных не менее чем в 100 раз.

    Еще хуже дело обстоит с латентностью. Для сети Fast Ethernet эта характеристика имеет значений порядка 150 мкс, для сети Gigabit Ethernet - около 100 мкс. Для современных компьютеров с тактовой частотой свыше 2 ГГц/с различие в производительности достигает не менее, чем 10000-100000 раз. При указанных характеристиках вычислительной системы для достижения 90% эффективности в рассматриваемом примере решения задачи Дирихле (т.е. чтобы в ходе расчетов обработка данных занимала не менее 90% времени от общей длительности вычислений и только 10% времени тратилось бы на операции передачи данных) размер блоков вычислительной сетки должен быть не менее N=7500 узлов по вертикали и горизонтали (объем вычислений в блоке составляет 5N2 операций с плавающей запятой).

    Как результат, можно заключить, что эффективность параллельных вычислений при использовании распределенной памяти определяется в основном интенсивностью и видом выполняемых коммуникационных операций при взаимодействии процессоров. Необходимый при этом анализ параллельных методов и программ может быть выполнен значительно быстрее за счет выделения типовых операций передачи данных.

    На следующем шаге мы рассмотрим результаты вычислительных экспериментов.




Предыдущий шаг Содержание Следующий шаг