HPC кластеры

          Оптимизация задачи обслуживания больших кластеров, для которых нужно обеспечить надёжною круглосуточною роботу, связана как с рядом задач проектирования инженерных систем в серверных комнатах или дата-центрах так и от инфраструктуры коммуникаций каналов связи, которые дают пользователям удаленный доступ к компьютерным ресурсам кластеров. Инфраструктура должна гарантировать обслуживающему персоналу удобность администрирования и наращивания мощностей, как отдельных кластеров, так и целого дата-центра. Классификация дата-центров обычно может осуществляться по нескольким параметрам, например, по соответствию требований стандартов (ANSI TIA-942, ГОСТы серии 34), по размеру компьютерных ресурсов, по классу надёжности (уровни Tier 1-4).

figure10

        Дополнительно в научно-исследовательской работе удобно проводить классификацию также по типу решаемых задач и установленного программного обеспечения на серверах в дата-центре, что определяет эффективность использования компьютерных ресурсов. С другой стороны продуктивность дата-центра зависит от многих особенностей архитектуры серверов и коммуникационного оборудования межсерверного обмена данных. Важно правильно спроектировать архитектуру кластера, чтобы каналы доступа к распределенной файловой системы или к хранилищу данных кластера были максимально сбалансированы. С ростом научно-технических задач и аудитории пользователей приходиться думать о маштабированости системы расчётных кластеров. Часто продуктивность можно повысить увеличением числа серверов/процессоров или переходом на другой тип серверного оборудования. Как правило, оборудование успевает значительно устареть в течении 3-5 лет, что иногда приводит к нецелесообразности использования и обслуживания последнего в рабочих кластерных системах на площадках дата-центра. Поэтому задачи связанные с оценкой эффективности обслуживания или модернизации дата-цента как и оценкой продуктивности работы многопроцессорных программ очень важны.

figure11

 

       мы делаем

 

  • проектирование кластера и инфраструктурных систем его обслуживания,
  • поставка серверов и другого оборудования,
  • инсталляция и конфигурирования программного обеспечения,
  • монтажные работы и ввод в эксплуатацию кластера,
  • оптимизация работы кластера и создания систем его мониторинга и управление.