SAP HANAプラットフォーム エバンジェリストの松舘です。
SAP ERPに代表される基幹系業務データと、昨今話題のビッグデータ分散フレームワークHadoopのデータを連携したいというニーズがあるかと思います。
しかし、ERPのデータはデータベースに格納されているためSQLを使ってアクセスする必要があり、一方で、Hadoopで分析を行っているデータサイエンティストはScalaやRといったオープンソース言語を日々扱っています。両者がデータのやり取りを行おうと思うと、ERP管轄のITに依頼したり、一筋縄ではいかないのが現実です。
そこで、SAPは、このERPとビッグデータを結びつけるべく、SAP HANA Voraをリリースしました。
SAP HANAの特徴はインメモリのリアルタイムプラットフォームです。Hadoopの高速分散フレームワークとして、インメモリのSparkがあります。
SAP HANA Voraは、このSparkのプラグインとして動作するため、両者でインメモリ環境が活用できます。
Hadoopにビジネス分析の機能を
Hadoopの世界では、基幹系で格納され分析される売上のデータなどのように階層構造で格納されているケースはほとんどなく、データの階層を深掘り(ドリルダウン)や分析軸の切り替え(スライス&ダイス)といった、ビジネスデータの分析では当然のように行われているOLAP分析を行うことができません。
SAPの代表的なセンサーデータの事例である、F1チームマクラーレンの事例を考えてみても、センサーといっても、車体から、エンジンユニット、タイヤユニット、末端のブレーキテーブルの温度センサやタイヤの摩耗センサーまで、階層構造になっていることに気がつきます。
そこで、SAP HANA Voraは、上記で説明した両プラットフォームをつなぐだけではなく、以下の機能をSparkに対して提供します。
- Hadoopデータに対する階層機能の提供
- OLAPモデラーによるモデリング *SAP HANA VORA1.2新機能
- Hadoopデータへの通貨換算・数量単位変換(将来リリース対応予定)
Sparkに対して、上記のビジネスデータ分析に必須の機能を提供することにより、Sparkのパフォーマンスを損なうことなく自然なビジネス分析を可能にします。
また、言語に関しても、RおよびScalaの文法で直接SAP HANAのデータにアクセスできるため、新たな言語スキルを習得する必要がありません。
すべてのHadoopディストリビューションに対応
SAP HANA Voraは、以下の代表的なHadoopの商用ディストリビューション(アルファベット順)に対応しています。インストーラも各ディストリビューションごとに用意されていため、既存のHadoopクラスタに追加してインスールが可能で、各社のGUIの管理ツールのコンポーネントとして追加が可能です。
- Cloudera
- Hortonworks
- MapR Technologies *SAP HANA VORA1.2新機能
外部ストレージ
SAP HANA VoraのDeveloper版(英語版のみ)を提供しています。
すぐ触ってみたい方はぜひご登録ください。
SAP HANA Vora Developer Edition - YouTube
※Amazon EMRを利用
SAP HANA Vora 1.2の新機能については、以下のブログもご参照ください。
Introducing SAP HANA Vora1.2