Esxiに搭載済ストレージ

VMWare Esxi 時々ストレージを見失う時は電源を疑え!

Esxiのストレージが認識されない経緯…

みなさんのご家庭に1台はある、Esxi仮想化基盤サーバー。
今回は、Kixiの家で飼っているEsxiが、時々ストレージを認識しなくなる病になって、解決までの道のりを忘備録として残しておこうと想います。

もし、該当の期間にアクセスされて404画面が表示された方は、申し訳ありませんでした。
以下のような対応を行っておりました。

症状について

SSD/HDDに限らず、しばらく(数日程度)時間が経つと、ディスクが認識しなくなる。

動作中のVMも完全に落ちる訳ではなくて、動いているのかいないのか微妙なラインでした。

具体的な症状

仮想マシン 症状
Linux CentOS (KUSANAGI) アクセスすると404。
Windows10 RDPもNG。接続できない。
FreeNas 接続不可。

いずれの場合も、強制的にKILLするしか落とす方法はありませんでした。
KUSANAGIに関しては、ストレージが無くてもレスポンスは帰ってきていたので、動作中のOSによってまた動きは違うようです。

また、WEBClientは通常通り動作しますが、ストレージを見ようとすると、NGマークが出て(再試行)と表示される有様でした。

トラブルシューティング

まず、あやしい所に目星をつけていきます。

ストレージがあやしいのでは(違った)

やっぱりストレージ(SSD)が認識できなくなっているので、ここを怪しみました。
しかし、よくよく考えてみると、全ての仮想マシンが一斉に落ちるのは納得がいきません。

Esxiに搭載済ストレージ

これだけのディスクが搭載されており、480GBのSSDにKUSANAGIとWindowsを入れていて、FreeNasは60GBのSSDに入れていました。

確かに、SSD/HDDあるあるで、一つおかしなディスクがあると、芋づる式に認識できなくなるなどドライバー周りでの不具合も考えられましたが
今回細かく切り分けをすることで、どのパターンでも時間差で認識しなくなるため、その線はなくなりました。

電源が実はおかしいのでは(あたり)

そして、色々考えた結果、電源があやしいとの仮説に至りました。
理由としては、

寒い日に落ちる事が多かった

夏場は特に問題なく、そういえば去年の冬も似たような事象があった事を思い出しました。
基本再起動すれば問題無かったので、頻度が少なかった去年はスルーしていましたが、今年頻発する所を見ると順調に劣化していたようです。

ディスクを大量に搭載している

SSDやHDDを一般的には乗せないほど搭載しており、尚且24時間365日稼働しています。
当然、電源メーカーの想定よりも負荷が掛かっていたのだと想います。

電源ユニットのみずっと使いまわしていた

ケースと電源は、セットで流用していて、2014年頃よりずっと使われていたものでした。
さすがに劣化も著しいのでは…と思い至った訳です。

PCの故障箇所は限定されている

そもそも、PCで壊れる順で考えると…

壊れやすさランキング パーツ
1位 HDD
2位 SSD
3位 電源
4位 GPU
5位 マザーボード
6位 メモリ
7位 CPU

こんな感じだと想います(Kixiの経験上)

ストレージは、よく死にます。
特に、海外製の激安メーカーのSSDだとコントローラーが死んだり、フラッシュの書き換え回数にも上限があります。
最近のTLCやQLCは、書き換え回数を犠牲にして容量を稼いでいる製品です。常に書き換えが発生するサーバーには向きません…。

電源は、コンデンサを使っているため寿命があります。温度差で症状が出やすいです。

GPUに関しては、多くの場合CPUより発熱するパーツで、Kixiの場合マイニングなど負荷を掛ける事もあったので比較的故障しやすい印象ではありますが、通常使いではCPUと同レベルの耐久性だと想います。

つまり、表の電源より下はほぼ壊れないのです。

以上より、ストレージではなさそうだなーと思った時点で「電源か…」と思ったわけです。

解決方法

電源を交換しました。

玄人志向 STANDARDシリーズ 80 PLUS 500W ATX電源 KRPW-L5-500W/80+

玄人志向 STANDARDシリーズ 80 PLUS 500W ATX電源 KRPW-L5-500W/80+

6,040円(03/29 04:56時点)
Amazonの情報を掲載しています
予想通り、一発で解決しました。

一般のご家庭には、ATX電源の1つや2つ転がっていると想います。

それを使って、まず症状が再現しないか確認してみてください。

自作PCの世界は、予備パーツでの検証によって、問題のあるパーツや故障の診断を行います。
つまり予備パーツが無ければ今すぐ買ってください。何も問題が起きていなくても念の為買ってください。

そうすることで、気付いたら予備パーツだけでPCが1台組めるようになっており、細胞分裂するかのようにPCが生えます。
そうなれば、あなたも立派なジサカーと呼んで差し支えないと想います。

最後に

自宅サーバーなんて馬鹿がやることです。
電気代も掛かるし、WEBサイトのホスティングなら優秀なレンタルサーバーやVPSがたくさんあります。

しかし、それらは手が掛かりません。
つまらないですよね。

自宅サーバーは、敷居が高いように見えますが、そうでもありません。
問題が起きれば土日が潰れ、パーツは次々と寿命が来て交換が発生し、どう考えても割に合わないけれども。

自分がホスティングしているWEBサイトが世界中で見える事。
家に保存しているファイルがどこからでも使えること。
すきにイジれる検証環境が常に存在すること。

これらが大事なのであれば、導入する価値はあります。

それでは、良き自宅サーバーライフを。

面倒な人は、レンタルサーバーを使ってください

ConoHa

Kusanagi等、VPSも扱っているConoHaのレンタルサーバー。
速度面、サービス面でも非常に評判が高い。

スターサーバー

電話での問い合わせができないなど、ConoHaと比べるとサポート面があれだが、
自分で設定できる玄人からすると、非常に安価で契約できる。

※使わないサポートの経費分、安くなっています。