HPE Blog, Japan
キャンセル
次の結果を表示 
次の代わりに検索 
もしかして: 

エアボーン・デデュープでデータ爆発問題を解決するハイパーコンバージドがある

Yoji_Inoue

GettyImages-637350592s.jpg

 2020年には世界のデータ量は44ZB、さらにそのわずか5年後にはおよそ4倍の175ZBになるとIDCは予測しています。ほとんどはセンサーデータやビデオデータだったりするのですが、企業データも増え続けるのは間違いなく、ここ数年でデータ圧縮技術がかなり変わってきたと感じています。その最新ムーブメントはグローバル・デデュープというもので、それはまさにスタートレックに出てくる「転送装置」なのです。

  

データ容量削減技術の歴史digital media transition.jpg

  デジタルデータは産声を上げてからまだ70年程度しか経っていないのですが、現代社会ではすでになくてはならない技術となっています。世界最初のコンピュータENIACにはもちろんハードディスクなどなく、メモリー容量はたったの100バイトでした。当時の外部出力は紙ベースのパンチカード(紙に穴をあけたもの)、その後世界最初のストレージ製品である磁気テープ装置が発明され、ハードディスク(HDD)、そして現代の半導体ディスク(SSD)と続きます。当時とても高価だった磁気テープでは容量の圧縮技術は必然のものと思われ、様々な圧縮技術を搭載した製品が開発されました。現代のデータ圧縮方式はほとんどが1977年に開発されたLZ方式が基礎となっています。この仕組みを簡単に言うと、あるデータ列に対して同じデータ配列の繰り返しがある場合はそれをコード化することで(エンコード)データを圧縮しています。この方式はシンプルなプロセスで実装も簡単なのですが、圧縮率は通常50%程度と限界があります。そんな中1980年代から始まったWintel(Windows - Intel)時代にはコンピュータの民主化と共にクライアントの爆発的増加が始まり、従来とは比較にならない程のデジタルデータが大量に生成されてきました。そこで登場したのが重複排除(Deta Deduplication:以降「デデュープ」)技術です。これは従来の圧縮技術とは違い大量のデータの中から共通のデータパターンをいくつも抽出し、重複したデータを記録する代わりにそのデータパターンのID(ハッシュ値)を「名前」として管理して、その名前の人がどこに住んでいるのかを「地図」に記録します。この名前と地図情報の台帳があると、日本中の「鈴木さん」が1つの名前データと地図情報で管理できるようになるわけです。この重複排除技術は「名前」と「地図」情報を検索するのに時間がかかるため、当初は性能のあまり求められないバックアップ製品に搭載されていました。ところが近年SSD(半導体ディスク)やメモリーの容量単価の低下により、これらの高速なデバイス上で重複排除をリアルタイムで実現できるようになり、性能の求められる1次ストレージでも使われるようになりました。

 

スタートレックの転送装置Stocksy_760969s.jpg

 私の世代であればUSSエンタープライズにあこがれた方も多いのではないでしょうか? USSエンタープライズはスタートレックに出てくる宇宙船ですが、Mr. スポックをはじめとするユニークな宇宙人に加え、ワープ航法などの先進的な技術が出て来るたびにとてもわくわくしたものでした。その中でも特に印象深いのは「転送装置」ですね。宇宙船から遠く離れた天体の地表にすぐに移動できるものです。私なりの解釈ですが、原理は「どこでもドア」という時空を湾曲させるものではなく、どちらかというと映画の「ザ・フライ」に出てきた装置と似ていて自分の体の原子レベルをデータ化してそのデータまたは少し変更したデータから新しい肉体を再生するというものです。実はこの装置に似たものもすでに開発されています。 Nature Biotechnologyの2017年5月号に掲載された記事で、遺伝子コードから化学的にDNAのらせん構造を合成する「デジタル・生物変換器(DBC:digital-to-biological converter)」というものが紹介されていますが、これが実現すれば、3Dプリンターと素材さえあればどんなに遠く離れていても世界中、いや宇宙でもあっという間に人体を「転送」できることになります。

 

エアボーン・デデュープ

 ではなぜこの転送装置がHPE SimpliVityのデ・デュープ技術と関係あるかというと、データ転送の原理が似ているからです。HPE SimpliVityの特徴は仮想マシンのモビリティ(移動)を超高速で実現できることですが、この技術を使って地球の反対でも、テラバイトクラスの仮想マシンデータを数秒で移動することができます。その原理をわかりやすく説明すると以下のようになります。

SVT-global-dedupe.png

 SimpliVityのデデュープでは、データを小さな塊(オブジェクト)に加工します。それぞれのオブジェクトにはIDが振られ、台帳管理されます。上記の例でいうと元素記号の「H(水素)」、「O(酸素)」、「C(炭素)」です。SimpliVityではユーザーデータ(化合物)、例えば「水」が入ってくるとそれを化学式(H2O)に変換して、さらにそこに含まれる元素(「H」が2個と「O」が1個)に分解します。そして遠くのサイトで同じデータである「水」を再生したいとしたら、そのサイトにあらかじめ存在する「H」と「O」から「水(H2O)」が再生できます。このような原理で、大容量のデータを含む仮想サーバーでも数秒で同じものが作れるのです。 その意味で私はこのデデュープ技術を「エアボーン・デデュープ」と呼んでいます。

 化学物質情報の世界標準である CAS REGISTRYSMによると現段階でも1億4,400万件以上の有機および無機物質が発見されていますが、これらの構成要素はたった百十数種類の元素から成り立ちます。つまりこれら百数十種類の元素と希望する物質を構成するための設計図さえあれば、世界中どこでも同じ物質、仮にそれが人体であっても、全く同じコピーを作成できることになります。ここで3Dプリンターの役割をするのがSimplivityというHPEのハイパーコンバージド製品です。このハイパーコンバージド製品は仮想化環境を1つの箱に詰め込んだもので、導入が簡単で早く、運用も遠隔地から出来るため、特に複数拠点を管理されているユーザーの方々には最高のツールでしょう。

 

 マルチサイト化のススメ

 日本は元々自然災害も多いのですが、最近では気候変動により過去に例がない災害も多々発生してきています。当然、事業継続、データ保護の観点から複数サイトにIT環境を配置したいのですが、それなりにコストがかかること、ネットワークの帯域問題で満足にマルチサイト管理ができているところは少ないのではないでしょうか? 当然クラウドという選択肢も出てきますが、セキュリティやコストの面で利用メリットがないケースが多いことも広く知られるようになってきました。 しかしながら上記したような仕組みを持ったHPE Simplivityを利用することで、比較的低コストで複数サイトのIT環境を刷新することができます。移動するデータ量が極限まで削減できるため、今あるネットワーク環境のままでも十分なパフォーマンスが発揮できるだけでなく、バックアップやリストア時間の大幅な削減が可能なので、ネットワークの広帯域化に投資するよりもはるかに効果的な投資となるのではないでしょうか? また管理も世界中のサイトを一元管理できます。現地にITの専門家がいなくても導入・管理が可能なハイパーコンバージドならではのメリットとデータの移動を極限まで低減するエアボーン・デデュープでマルチサイト環境の刷新、またはこれからのマルチサイト化を検討してみてはいかがでしょうか? SVT-2node.png

 

関連ブログ

ハイパーコンバージドの取扱説明書 2:正しいクラウドとの比較方法

ハイパーコンバージドの取扱説明書

ランサム時代のハイパーコンバージドとは?

華々しくデビュー! 待望の次世代ハイパーコンバージドSimpliVityついに日本初上陸!

 

関連リンク

HPE SimpliVity公式ページ

 

 
0 感謝
作者について

Yoji_Inoue

Technology Evangelist, Composable Infrastructure, Software Defined Data Center and Cloud Technology Architect, Hyper Converged, Storage, Memory centric-Data driven computing, Specialist

イベント
Read for dates
HPE at 2019 Technology Events
Learn about the technology events where Hewlett Packard Enterprise will have a presence in 2019.
続きを読む
Read for dates
HPE Webinars - 2019
Find out about this year's live broadcasts and on-demand webinars.
続きを読む
すべて表示