EDUCAÇÃO E TECNOLOGIA

SAP HANA Cloudで航路を辿ろう:マルチモデル分析を実践

SAP HANAはSAPを代表するデータベースです。世界中の基幹システムで使われ、様々な企業の情報をリアルタイムで保存、処理するための単一のプラットフォームです。

効率的に且つ安全にデータを格納するデータベースは他にもたくさん提供されています
では、SAP HANAにしかない独自の価値は何ですか?

  1. インメモリー情報管理:全ての情報をカラム型で保持、圧縮し、非常に速く処理する技術
  2. トランザクション(大量のデータ更新)にも、分析(大量のデータ参照)にも対応
  3. マルチモデルデータ処理

他にも、世界中の企業の基幹システムを支えるために必須な機能も備えています:ACID特性、セキュリティー機能、堅朗なバックアップや高可用性の仕組みもありますが、これらは独自の価値ではありません。

1. インメモリー情報管理、2.トランザクション/分析の2つのワークロードへの対応はすでに多くのメディアで紹介されています。本ブログではマルチモデル分析がビジネスにもたらす価値についてご紹介します。

マルチモデルデータベースは、さまざまな種類のデータの保存、アクセス、処理により複数タスクを実行できるデータベースです。特定目的ごとに個別テクノロジーを使用するのではなく、さまざまデータタイプやモデルを 1 つのソリューションに統合します。
SAP HANAでは具体的に構造化データ地理空間データグラフデータJSONデータテキストデータ、そしてストリーミングデータを扱うことが可能です。

それらのデータタイプを単一のデータベースで格納し、重複することなく様々な業務で活かせることこそSAP HANAの価値です。
特に、SAPの業務アプリケーションで発生したデータに対して高度な統計分析を同じデータベース内で行い、分析結果を同じ業務アプリケーションを通して担当者に提供する。無駄のない、効率的なアーキテクチャで業務の行動化・自動化をはかることができます。

下記のフローでは、SAP HANAデータベース内の機械学習の一連の流れを描いています。
組み込まれている関数を活用すると、データ取得からモデル作成、スコアリングまでSAP HANAでクラスタリング、時系列予測や分類が可能です。

SAP TechEdでは毎年新しい技術を世界中の開発者向けに披露しています。
2021年はDAT262セッションでSAP HANA Cloudの地理空間情報処理、グラフ処理、検索、JSON処理、機械学習について詳細に説明しています。解決する課題、およびコードは全てGitHubにチュートリアル形式で掲載されているため、誰でも再現できます!再現するにはSAP HANA Cloudシステム、そしてSQLの知識が必要です。本ブログではDAT262で紹介されている内容の価値をIT以外の分野の担当者向けに解説することを目的にしています。

SAP HANA Cloudのマルチモデル機能を紹介するため、Marine Cadastreの自動識別システム(AIS)で公開されている船舶の位置観測データを使います。シカゴ付近、五大湖の船舶位置情報を2ヶ月間分SAP HANA Cloudにインポートします。緯度経度情報を基に船舶の経路や速度を計算します。位置データを集計(クラスタリング)し、船舶の密度を計算します。次に、グラフ機能を使用して最短航路を特定します。例として、船舶用運河の閉塞をシミュレーションし、適切な代替ルートを自動的に特定します。空間クラスタリングの拡張機能を使用して「時空間キューブ」を導出し、HANAの組み込みの予測分析ライブラリ(PAL)を使用して船舶交通量を予測します。自然言語検索モデルを作成し、いくつかの検索クエリを実行し、検索UIを確認します。

データ確認

データは標準のSQL /空間関数を使用して処理されます。

どの船が国立公園の境界を越えていたかを確認する

航路、速度の計算

船舶密度の計算

最短航路の特定

再計算

船舶交通量の予測

自然言語検索


最後まで読んでいただきありがとうございました。

Maxime SIMON