HPE Blog, Japan
1824645 メンバー
4708 オンライン
109672 解決策
新規ポスト
Masazumi_Koga

インドのマイナンバーでは、なぜHPE Ezmeral(エズメラル)が採用されているのか

■マイナンバーカードを持っていますか?

みなさんは、マイナンバーカードを持っていますか? 筆者も、マイナンバーカードを持っています。日本のマイナンバーカードは、健康保険証と公金受取口座の登録ができるようになっていますよね。また、マイナンバーカードの情報と「ねんきんネット」の関連付けも可能になっていて、スマホから自分がもらえる年金の額などが確認できるようになっています。役所にわざわざ行かなくても、各種手続きが可能ですし、マイナ保険証を使うと医療費もお得になるので、マイナンバーカードは、持っておくとよいでしょう。

ちなみに、マイナンバーのID自体は、日本の全国民にすでに振られていますので、ID自体を無くすことはできません。マイナンバーカード自体を持っていない人や、なぜか、マイナンバーカードを返却してしまった人は、今後、役所の手続きが煩雑になったり医療費の面で損をすることになります。

今後、日本は、あらゆる手続きがマイナンバーカードを通じて行われる国になっていくので、マイナンバーカードがない人は、どんどん不便になっていく、ということです。なので、「今後も日本に住む日本人で在り続けたい」というのであれば、マイナンバーカードを作っておいて損はないと思います。

■海外のマイナンバー

EDF_India_NoSQL_database.png日本政府は、マイナンバーの普及を推進していますが、実は、インド政府にもマイナンバーがあります。日本のマイナンバーは、個人が所有するプラスチック製の物理的な「マイナンバーカード」と、スマホを組み合わせることで個人を認証し、様々な手続きが可能です。一方、インドでは、生体認証データを使って、国民の身元と住所を確認できる仕組みが整備されています。

 

EDF_Aadhaar.pngこのインド政府のマイナンバーは、Aadhaar(アドハー)プロジェクトとよばれ、国民の膨大な生体情報(ビッグデータ)を保管・検索できる巨大IT基盤で構成されています。世界的に見ても、史上最大規模の生体認証システムと言われています。

このIT基盤のビッグデータ基盤ソフトウェアには、HPEの Ezmeral Data Fabric - Customer Managed(エズメラル・データファブリック・カスタマーマネージド、通称、EDF-CM、旧称、MapR)が全面採用されています。

このEDF-CMは、物理サーバーマシンを複数並べて、巨大なファイルの入れ物(ファイル保管庫)を作るソフトウェアです。物理サーバーの台数を増やすことで、ファイルを入れる空き容量を拡張できるので、マイナンバーのシステムを停止させることなく、システムを24時間動かしたまま、サーバー機器をどんどん追加して、空き容量を増やせます。また、EDF-CMは、サーバーを並べる台数が増えれば増えるほど、ファイル検索などの処理性能も向上します。そのため、マイナンバーの登録者や、マイナンバーを利用する事業者などが増えても、サーバー機器を追加することで、マイナンバーに関連する業務アプリケーションの処理性能を向上させることができます。すなわち、インド国民や関連事業者の利便性を損なわないソフトウェアが採用されている、というわけです。

■生体認証のビッグデータ基盤がなぜ必要なのか

EDF_India_NoSQL_database02.pngこのインドのマイナンバープロジェクトの目標は、インドの約14億人のすべての人に認証するために、一意の12桁の識別番号と生体認証データを提供することです。

ところで、このマイナンバーがインド国内で必要な理由は、一体何でしょうか?実は、インドには、社会保障カードがなく、多くの人がパスポートを持っていません。多くの人は、身分証明書を持っていないため、銀行口座を開設することすらできず、お金を使った経済活動に参加できない国民が非常に多かったのです。

そのため、インド政府は、栄養不足の人々への穀物補助金や政府による失業者向けの職業訓練の支援など、経済的に困窮している人の救済プログラムを用意していました。

しかし、支援を必要とする多くの人は、自分にプログラムの資格があるかどうかすら確認できず、識字率の問題もあり、福利厚生プログラムにアクセスできない場合が少なくなかったのです。

また、政府援助に乗じた詐欺行為も横行し、推定では、貧困層の人々に穀物を届ける資金のなんと50%以上が不正に失われていたと言われています。

この諸問題を解決するために、インド政府は、生体認証を使ったデータベースを構築したわけです。

■マイナンバーが国民に急速に普及

EDF_India_Case_Study.pngアドハーでは、携帯電話やマイクロスキャナーなどのモバイル端末を使用して、ユーザーをデータベースに登録します。このデータベースによって、地方の村の現場でも、市民のID認証が可能になりました。

生体認証データには、両目の虹彩スキャンに加え、10本の指すべての指紋パターンのデータが含まれます。そして、インド政府から、一意の識別番号が提供されます。

この識別番号は、アドハーIDと呼ばれ、コンピューターが決定したランダムな数値(乱数)が割り当てられます。宗教、信条による分類や区別なども一切なく、身分の平等性が完全に保証されているID管理システムです。ユーザーIDで認証が行われ、携帯端末(マイクロATM)を使って、決済処理も行えるようになっています。これにより、地方の農村部や遠隔地の人々に銀行や金融サービスへのアクセスができるようになりました。また、物資配達の資格があるかどうかも確認できるため、高齢者への年金の支払い等にも利用されています。

この大規模な生体認証システムのおかげで、経済的に困窮している人への救済プログラムの利用促進に加え、不正行為や詐欺行為を防止できるようになり、インドでは、経済活動が大幅に拡大しました。

■数値でみるインドのマイナンバー

EDF-CMの導入により、膨大な生体認証ID情報を保管し、それらのデータを素早く操作できるようになったため、システムは、いまだに拡張を続けています。現在、EDF-CMに記録されるデータは、一日あたり5テラバイト、一日あたりの監査記録は数十億件、IDの確認処理は、一週間あたり、なんと1兆件を超えます。新規登録者は、一日あたり約70万人で、銀行口座は、2億4000万件に上ります。

非常に速いペースでマイナンバーが普及し、政府補助プログラムの不正受給比率も以前に比べて20%減少したことで、なんと500億ドルの節約を達成しています。

マイナンバーのビッグデータIT基盤の導入により、公共サービスだけでなく、金融取引なども含め、様々な事業者が提供するサービスを享受できるようになっており、IT化の推進によって、国民の生活が一変しているのです。

■マイナンバーのビッグデータIT基盤で求めらる要素技術

EDF_India_NoSQL_database03.pngこのようなビッグデータの政府調達プロジェクトでは、信頼性だけでなく、スケーラビリティが重要なシステム要件となることが多く、非常に高いパフォーマンスを実現する機能が要求されます。

また、データ数が膨大な個人情報の登録処理自体にも、十分な検討が必要です。特定の個人の住所や生体認証データが収集されると、登録は、重複排除のチェック処理が行われます。

EDF_India_NoSQL_database04.pngインドにおけるマイナンバーシステムへの新規登録における重複排除処理は、数十億件のレコード(レコードとは、分かりやすく言えば、データベースにおける表データのようなもの)と比較処理が行われます。

システムが拡大するにつれて、重複(ちょうふく)排除は、さらに大きな課題に直面します。重複排除処理だけでなく、すでに登録されている大量の人々の各トランザクションに関する認証の処理も行わなければならないのです。

インドのマイナンバーシステムでは、「200ミリ秒程度の応答時間で数千件規模の同時トランザクション処理をさばけること」という、厳しいシステム要件が設定されていました。

しかも、システムは、素早い認証処理に加えて、非常に厳格な可用性要件を満たしつつ、インド国内の数カ所に散らばる複数のデータセンターの建屋でデータをバックアップしなければなりませんでした。

当初、インド政府は、認証システムに、ビッグデータ基盤ソフトウェアのHadoop(ハドゥープ)を使った製品と、オープンソースベースの列指向型データベース(OracleなどのRDBMSではなく、いわゆるNoSQLとよばれるデータベース)であるHBase(エイチベース)を検討しました。

しかし、Hadoop自体の性能面や運用面での問題が顕在化したことから、現在の認証システムは、HBaseHadoopではなく、EDF Database(旧称、MapR-DB)を採用しています。

EDF Databaseは、列指向型のデータベースであるオープンソースのHBaseと互換性を維持したNoSQLデータベースです。また、EDF-CMが持つ超高速ファイルシステムであるEDFファイルシステム(旧称、MapRファイルシステム)の恩恵を受けられます。そのため、オープンソースのHadoop分散ファイルシステムであるHDFS(Hadoop Distributed File System)を持つHadoop製品よりも、圧倒的すぐれた性能を発揮します。

EDF-CMは、災害対策を見据えた遠隔地へのコピー機能を有し、Hadoopよりも使い勝手が良く、HadoopのHDFSよりも圧倒的な性能を発揮しつつも、非常に安定して動作することから、EDF-CMが採用されました。

ちなみに、インド政府のマイナンバーIT基盤におけるEDF-CMの採用事例は、旧MapR時代からインターネットで情報が公開されていて、ビッグデータ分析を手掛けるIT界隈では、MapR社の大規模事例として、昔からかなり有名だったものです。

アドハーは、社会的影響が大きい大規模なプロジェクトであり、高可用性とパフォーマンスに対する非常に厳しい要件があります。しかし、データ量に関しては、企業に導入されるビッグデータプロジェクトと比較して異常に大きいというわけではありません。たとえば、大手自動車製造業、産業用IoT、金融業界では、アドハーのデータ量を超える場合もありますし、高信頼性とスケーラビリティの要件もアドハーと変わらない要件も数多く存在します。

アドハーは、ビッグデータ基盤に共通する数多くの技術要素が組み込まれており、ID認証のビッグデータ基盤におけるベストプラクティスを体現したものといっても過言ではありません。インドと同じ規模のID認証のIT基盤がそのまま他の国でもそのまま利用できるというわけではありませんが、ソリューション設計の観点において、インドのマイナンバーは、日本の政府・自治体のプロジェクトにも応用できるでしょう。

そして、インド政府のように、経済活動の拡大、詐欺防止、金融での利用など国民生活の質の向上に資するツールとして、HPEが提供するビッグデータ基盤ソフトウェアのEDF-CMが活用されている点は見逃せません。今後もインドだけでなく、あらゆる国や地域で、アドハーに似たビッグデータ基盤が広がっていくことでしょう。

みなさんも、お買い物でマイナポイントをためる際は、少しだけ、マイナンバーを支えるビッグデータ基盤のテクノロジーに思いを馳せてみてください。

Masazumi Koga (Twitter:  @masazumi_koga)

【書籍のご案内】HadoopとMapRと機械学習を学べる本

Hadoop_Book.jpgMapRは、Hadoop互換でありながら、Hadoop HDFSHadoop分散ファイルシステム)よりも圧倒的に高速なMapRファイルシステムを搭載しています。その非常に高いI/O性能に加え、高可用性NFSサービスを提供する単純なNASとしても利用できます。それらの使い勝手の良さから、大手自動車会社の自動運転車のAI開発基盤や、インド政府のマイナンバーシステムで採用されているデータ基盤ソフトであり、日本国内でも100社以上の導入実績を誇ります。本書では、その豊富な導入実績をもとに、頻繁に利用されている基礎技術を「Hadoopクラスター構築実践ガイド」に収録しています。主に、以下に挙げるMapRとその上で動くオープンソースソフトウェアのノウハウを学べます。
Hadoop v3とMapR v6の構築手順
運用管理手法
Spark:SQL、StreamingGraphXRMLlibの使用法
ニューラルネットワークによる学習
データベース操作(HiveImpalaHBaseMapR-DBPig
データのインポートとエクスポート(SqoopFlume
フライトデータ分析、植物の分類、おすすめ映画のタイトル表示、Wikipediaドキュメント分類といった具体例をもとに、ステップバイステップで学べる一冊です。

0 感謝
作者について

Masazumi_Koga

Hewlett Packard Enterprise認定のオープンソース・Linuxテクノロジーエバンジェリストの古賀政純が技術情報や最新トピックなどをお届けします。保有認定資格:CCAH(Hadoop)/RHCE/RHCVA/Novell CLP/Red Hat OpenStack/EXIN Cloud/HP ASE DataCenter and Cloud等