distributed.netな日々:2020年4月

2020年4月1日:新型コロナウイルス解析プロジェクト稼働中

3月の一か月で世界はすっかり新型コロナウィルスに染まってしまいましたが、分散コンピューティングの世界でも新型コロナウィルス関連のプロジェクトが始まっています。Folding@homeとRosetta@homeです。参加方法は例えば新型コロナウイルスの解析を自分のPCの計算リソースを使って手助けできる「Folding@home」「BOINC」レビューなどで解説されています。

新型コロナ解析で分散処理プロジェクト「Folding@home」が1EFLOPS超えによりますと、Folding@homeの処理速度が1EFLOPSを超えているそうです。一概に比較できませんが、世界最速のスパコンのSummitが149PFLOPSだそうですから、とてつもないことになっていますね。

一方で参加者が急増していることでサーバがアクセス負荷に耐えられなかったり、十分なワークユニットが用意出来ないということも起こっているようです。

2020年4月5日:【RC5-72】6.5%まで解析が進みました

We have completed 6.5% of the search space of RC5-72. Thank you :) Moo! https://t.co/j6HvBeynR2
— distributed.net (@dnetc) April 5, 2020

あまりつぶやかないDistributed.netのTwitterから久しぶりのツイートが。RC5-72が6.5%まで解析が進んだそうです。0.5%刻みというのも少々細かい気がしないでもないですが、その0.5%進むのに1年以上かかったりしますから、まあいいですかね。

2020年4月11日:Folding@home始めました

世間は新型コロナウィルスの話題でもちきりですね。残念ながら医療職でもないしインフラ職でもない、しがないITエンジニアの私はおとなしく家に引きこもって仕事をしているしかないわけですが、それでも何か出来ることがあればと思い、今更ながらFolding@homeで新型コロナウィルスの解析に参加することにしました。デスクトップPCを1台投入するだけなんで、大したパワーではないんですけどね。私のstatsはhttps://stats.foldingathome.org/donor/saoyagi2になります。

問題というか、Folding@homeではプロジェクトを選択できるものの、新型コロナウィルスだけというプロジェクトは無いため、他のプロジェクトの計算もしてしまいます。まあ、そこんところは気にしないことにしましょうか。

2020年4月15日:【OGR-28】2億9000万スタブ到達しました

We have now verified 290 million stubs on OGR-28! Moo! https://t.co/j6HvBeynR2
— distributed.net (@dnetc) April 15, 2020

公式ツイートで2億9000万スタブ到達が報告されました。普段見てるstatsではGnodesしか表示されませんから、スタブまでは気にしてませんでした。全体としては72.76%の解析が完了しています。プロジェクト開始からの経過日数は2247日。

2020年4月19日:Folding@homeが2.3EFLOPSになりました

私も浮気している(本命はDistributed.netですので(^^))Folding@homeですが、Folding@homeがTOP 500の全スパコンを超える2.4EFLOPSに到達と、2.4EFLOPSもの速度になっているそうです。4月1日時点では1EFLOPSでしたから、1か月も経たない間に2.4倍も速度をアップしているのですね。凄いな。もしかして歴史上最も成功したグリッドコンピューティングプロジェクトなんじゃないんだろうか。いや、知らんけど。

ところでFolding@homeって具体的にどういう計算をしているんでしょうね。Distribuetd.netの場合は自分が知見を持ってる分野ということもあって、概要くらいはわかるんです。暗号解読の場合は暗号鍵の総当たり解析を行っているわけですし、OGRは最適ゴロム定規をこれまた総当たりで探索しています。GIMPSもわかりやすいですね。巨大なメルセンヌ素数をこれまた総当たりで探してます。でも、Folding@homeが新型コロナウィルスに対してどういう計算をしているのか。ウィルス自体の遺伝子解析をしているのかとも思いますが、それは多分違いますよね。かつてヒトゲノム・プロジェクトでは長い年月をかけて人間の遺伝子を解析していましたが、それも20年近くも前の話。今では技術が進んで遺伝子自体の解析はそれほど時間はかからなくなっていたかと思います。

そんなぼんやりした疑問を持ってる中で知ったのが、創薬とスパコン - 理化学研究所計算科学研究センターです。製薬においては対象物質に対して多数の薬候補となる物質が結合するかどうかを試すという過程があり、そこでコンピュータが活躍するそうです。なるほどね。今回の場合で言えば、対象物質は新型コロナウィルス。それに対してデータベースにある多数の物質を試していくと。これは確かに分散コンピューティングが適してますね。そうしてみつかった物質は薬候補となり、さらにブラッシュアップを重ねられていくわけですね。なるほど、ちょっとわかった気になりました。