並列計算サーバ
並列計算サーバ詳細
基本機能
- LinkAgregation機能
複数台の計算機間のネットワークを高速に接続する手法としてLinkAgregationを利用します。ご要望に応じてInfiniBand接続など高性能機器による計算機間通信の高速化を実装します。
- NIS、NFS機能
並列計算器では接続されている計算機のすべてで同じユーザアカウント、ホームディレクトリが提供される必要があります。NIS、NFSを利用することでユーザ管理を容易にします。
- コンパイル環境導入
クラスタコンピュータで並列計算プログラムを行う場合にはコンパイル環境整備が必要です。数値計算ライブラリの導入などクラスタコンピュータで動作させるプログラムに応じた環境整備を行います。
- 並列計算環境設定
計算機間通信を簡単に実現するための数値計算ライブラリ(MPI、PVM)を導入します。インターネット時刻サーバとの通信により、サーバの内部時間を適切に設定します。
- その他計算機基本設定
計算機間の時刻同期、ネットワーク通信制限、不要サービスの停止、システムアップデート、ホスト名参照設定など計算機利用に必要な基本設定を行います。
- 無停電電源装置(UPS)
複数計算機で構成されるクラスタシステムを安全に運用するためには無停電電源装置が必要です。計算機並びにネットワーク装置に対して電源障害時に安定して電源供給が行える設計・設定を行います。
追加機能
- チューニング
カーネルパラメータ設定により、メモリ利用、CPU利用、ネットワーク通信の最適化を行います。
- 商用コンパイラ
利用する並列計算プログラムによってはコンパイラを指定するケースがあります。コンパイラに限らず、商用計算ライブラリなど必要に応じて導入、設定を行います。
- CUDA環境
近年、GPGPUで数値計算を行うケースが増えてきました。CPU計算に比べて高速計算可能な計算環境としてCUDAの設定を行います。
- バッチジョブシステム
並列計算器環境を複数人で利用する場合には計算機資源の有効利用並びにフェア利用が重要になります。一部ユーザがCPUを独占しないようにバッチジョブシステムの導入を行いましょう。
- パフォーマンスモニタリング
計算機資源の稼働状況をモニタリングすることで資源の有効活用並びに増強計画が立てやすくなります。
- 障害モニタリング
並列計算器は長期間安定に運用されることが大前提となります。ハードディスク障害、ネットワーク障害、電源障害などをいち早く検知し、管理者に通知する設定を行います。
対応OS
- Linux
RedHat Enterprise Linux
Fedora Core
CentOS
OpenSUSE
Ubuntsu
- FreeBSD
FreeBSD 4.x
FreeBSD 5.x
FreeBSD 6.x
FreeBSD 7.x
- UNIX
(コンパイル環境によっては不可)
Solaris
HP-UX
AIX