Unix cluster

ラボのジョブ管理システムを高機能化するべくいじる。

http://upload.wikimedia.org/wikipedia/commons/thumb/7/7c/IBM_bladecenter_%28front%29.jpg/800px-IBM_bladecenter_%28front%29.jpg

 現管理システムはすでに卒業した院生が自作したもので、ジョブの管理はSQL、モニタリングとちょっとした操作はPHP、実際のジョブ発行等は某スクリプト言語で書かれたデーモンが行うというもの。標準的な技術を使っているという点では改変しやすいのだけど、ユーザー間の fairness をどう確保するかとかその辺がごちゃごちゃしていてちょっとはまる。一晩走らせてみて妥当なところに落ち着いているようなので、とりあえずこのまま様子を見る。


 しかし今やっているようなスタイルの研究は、すでにこういう何らかのクラスターシステムがないと出来なくなっているよな、と思う。今は一晩で終わっている計算が、普通の環境では1ヶ月ぐらいかかるかと思うとぞっとする。

 一から構築するとなると500万円ぐらいか。あとは気の利く院生かポスドク。実験環境を整えるのに比べればそう高コストというわけでもないけど、独立していきなりこれを作るのはちょっと大変そう。