バックアップの基本をマスター!仕組み・種類・保管先を徹底解説

もっち

  • 関東大手SIer勤務
  • 10システム、仮想サーバ約200台の基幹系システムが稼働する仮想化基盤のインフラ運用リーダー

以下3点について、ブログで役立つ情報を発信

  1. インフラ技術・システム運用
  2. キャリア・マネジメント
  3. エンジニア実務・仕事術

​みなさんも誤ってファイルを消してしまったり、間違った更新などをした後にやっぱり元のデータに戻したいなと思ったことはありませんか。

インフラエンジニアにとってもそのような瞬間はあります。そういった場面で活躍するITインフラを守る最後の砦、それはサーバーのバックアップです。

一言でバックアップと言ってもバックアップの方法はいくつかあります。今回はサーバに保存された企業の機密データ、顧客情報、Webサイトのプログラムなど、失われればビジネスが止まってしまうほどの大切な情報を守るバックアップについて紹介します。

この記事の想定読者

  • バックアップのことがよくわからない
  • バックアップについて種類を整理して理解したい

この記事を読むことでのメリット

  • バックアップの種類や仕組みが理解できる

バックアップと似た技術で「スナップショット」という仕組みや、バックアップの基礎となるストレージの記事もあります。そちらに興味のある方は、以下の記事もチェックしてみてください。

目次

設計の鉄則:バックアップの「3-2-1の法則」とは?

まず最初に、世界中のエンジニアが共通認識として持っている「3-2-1の法則」を紹介します。

この法則はバックアップを設計するにあたり、「保持するデータの個数」、「保存先の種類」、「遠隔地にバックアップを持つ」という3つの項目において、必要数を示すものです。

  • 3:データは「3つ」持つべきという意味。
    オリジナル(本番)+バックアップ2つ。合計で3つのコピーを持つようにします。
  • 2:保存先は「2種類」のメディアに分けるべきという意味。
    同じサーバー内の別ディスクではなく、外付けHDDとNAS、ディスクとテープなど、異なる種類の媒体に保存することを推奨しています。同じ種類のメディアは同じ原因で同時に壊れるリスクがあるからです。
  • 1:最低「1つ」は遠隔地に置くべきという意味。
    火災や地震などの災害に備え、物理的に離れた場所(別拠点のデータセンターやクラウドなど)へバックアップデータを保管しておきましょう。

バックアップの「3つの種類」をマスターしよう

サーバーのデータ量は膨大なため、効率的に3つの方式を使い分けて運用されます。

種類内容メリットデメリット
フルバックアップ全てのデータを毎回丸ごと保管する復元(リストア)が最も簡単で確実時間がかかり、保存容量も大量に使う
差分バックアップ前回取得した「フルバックアップ」からのすべての更新データを保管する復旧が比較的早い(フル+最新の差分1つでOK)日が経つにつれて容量が増えていく
増分バックアップ前回取得したバックアップから更新された分だけをコピーするバックアップ時間が最短で、容量も節約できる復旧時に「フル+全ての増分」が必要で手間がかかる

差分バックアップと増分バックアップの違いが、複雑でわかりにくいと思いますので、以下に図解を示しながら説明します。差分バックアップと増分バックアップの大きな違いはバックアップ保持のデータ量です。

  • 差分バックアップ
    フルバックアップ後に差分バックアップを複数回取得した場合、フルバックアップからのすべての更新分を毎回保管するため、バックアップ容量が毎回大きくなっていきます。
  • 差分アックアップ
    フルバックアップ後に増分バックアップを複数回取得した場合、差分バックアップと違い、前回取得した分からの更新データのみを保管するため、毎回のバックアップ量はそれほど変化しません。
種類火曜日時点にリストア水曜日時点にリストア
差分バックアップ「差分1」のみ「差分2」のみ
増分バックアップ「増分1」のみ「増分1」と「増分2」が必要

リストアに関しての違いとして、差分バックアップは、水曜日の状態にリストアするの際、フルバックアップと水曜日のバックアップを利用すればリストアできます。しかし、増分バックアップは、フルバックアップと火曜日、水曜日と増分を取ったすべてのバックアップデータをひとつひとつ遡らないとリストア出来ないため、リストアに時間がかかるのです。

バックアップの「方法」と「保管先」

現場では、コストや復旧スピードに合わせて以下の手法を組み合わせることが一般的です。

  • 別ボリューム・別筐体(NASなど)ネットワーク経由で別の機器に保存します。最も一般的な方法で、サーバーが物理的に壊れてもデータは守られます。
  • ネットワーク越しの共有フォルダWindowsの共有フォルダ(CIFS/SMB)やLinuxのNFSなどを利用して保存します。
  • クラウド・外部保管(DR対策)AWS S3やAzure Blob Storageなどのクラウド、または別拠点のサーバーへ転送します。
  • テープ(LTO)「古い」と思われがちですが、大容量を安価に長期保管でき、ネットワークから切り離して(エアギャップ)保管できるため、ランサムウェア対策として今非常に重宝されています。

「いつ取るか」と「どう確認するか」

バックアップのタイミング

通常、システムの負荷が低い深夜の時間帯でバックアップを取得することが多いですが、OSのアップデートや重要な設定変更の「直前」にもバックアップを取得します。これは、作業が失敗し、データが消失・破損した場合に、作業の直前の状態に戻せるようにするためです。

運用の3大チェックポイント

バックアップを取得するだけでは、意味はありません。正しく毎回取得できているか確認することと、正しくリストアできるか試験することが重要です。バックアップは取得出来ていたが、データが壊れていたなど、インフラエンジニアとしては、よくある事象です。

そのような事態を避けるため、日々の確認はシステム運用を行う上でとても大切となります。

  1. 成功ログの確認: 毎朝、バックアップジョブが「SUCCESS(成功)」で終わっているか、エラーが出ていないかを確認します。
  2. リストア確認: 定期的に実際にデータを戻せるかを確認します。取得したバックアップデータが正しいかの確認と、バックアップ・リストア手順が正しい手順となっているかの確認が必要です。

まとめ:バックアップは最後の砦

バックアップは、インフラエンジニアにとっての「最後の砦」です。

「3-2-1の法則」を意識し、システムの特性に合わせて「種類」と「保存先」を正しく選べるようになりましょう。

まずは、自分の担当しているシステムが「もし今壊れたら、どの手順で、いつのデータに戻せるか?」をシミュレーションすることから始めてみてください。


技術の話題はいちど一休みして、睡眠についてや、思考の整理などの記事を見て、働き方そのものを見直しませんか。興味のある方は、以下の記事もチェックしてみてください。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

もっちのアバター もっち インフラエンジニア/サービスマネージャ

・関東大手SIer勤務
・10システム、仮想サーバ約200台の基幹系システムが稼働する仮想化基盤のインフラ運用リーダー

以下3点について、ブログで役立つ情報を発信
1.インフラ技術・システム運用
2.キャリア・マネジメント
3.エンジニア実務・仕事術

目次