DLIとは

  • 使いやすさ

    DLIでは、運用と保守の負担なしで、標準SQLを使ってデータレイク内の数TBのデータを数秒で簡単に調査可能。

    DLIでは、運用と保守の負担なしで、標準SQLを使ってデータレイク内の数TBのデータを数秒で簡単に調査可能。

  • ワンストップ分析

    Apache Spark、Flink、およびopenLooKengと完全な互換性があり、ストリーミングおよびバッチ処理とインタラクティブ分析を1つの場所で実行可能。

    Apache Spark、Flink、およびopenLooKengと完全な互換性があり、ストリーミングおよびバッチ処理とインタラクティブ分析を1つの場所で実行可能。

  • 拡張性が高いリソース

    プールされたリソースへのオンデマンドの共有アクセス、プリセットの優先度に基づく柔軟なスケーリング。

    プールされたリソースへのオンデマンドの共有アクセス、プリセットの優先度に基づく柔軟なスケーリング。

  • クロスソース接続

    容易なクロスソースデータアクセスで、データを移行する必要なく、DLIデータソース接続による連携分析が可能。

    容易なクロスソースデータアクセスで、データを移行する必要なく、DLIデータソース接続による連携分析が可能。

機能

  • 完全なSQL互換性

    SQLステートメントでビッグデータ分析を簡単に実行。ANSI SQL 2003構文に完全に対応。

    SQLステートメントでビッグデータ分析を簡単に実行。ANSI SQL 2003構文に完全に対応。

  • サーバーレスSpark/Flink/openLooKeng

    サーバーレステクノロジーでオフラインアプリケーションをクラウドにシームレスに移行。DLIはApache Spark、Apache Flink、PrestoのエコシステムとAPIに完全に対応。

    サーバーレステクノロジーでオフラインアプリケーションをクラウドにシームレスに移行。DLIはApache Spark、Apache Flink、PrestoのエコシステムとAPIに完全に対応。

  • クロスソース分析

    データベース間でデータを分析。移行は不要。データの統合ビューで、データを包括的に理解できるようにし、迅速な変革を促進。データ形式、クラウドデータソース、またはデータベースをオンラインまたはオフラインのどちらで作成するかについての制限なし。

    データベース間でデータを分析。移行は不要。データの統合ビューで、データを包括的に理解できるようにし、迅速な変革を促進。データ形式、クラウドデータソース、またはデータベースをオンラインまたはオフラインのどちらで作成するかについての制限なし。

  • エンタープライズマルチテナント

    コンピューティングまたはリソース関連の権限をプロジェクトまたはユーザー単位で管理。きめ細かい制御で、個々のタスクのデータの独立性を容易に維持。

    コンピューティングまたはリソース関連の権限をプロジェクトまたはユーザー単位で管理。きめ細かい制御で、個々のタスクのデータの独立性を容易に維持。

活用場面

分析

データベース分析

リレーショナルデータベースに保存されているアプリケーションデータには、より多くの価値を引き出すための分析が必要です。たとえば、登録された詳細からのビッグデータは商業上の意思決定で役立ちます。

問題点

- 複雑なクエリは大規模なリレーショナルデータベースではサポートされません。

- データベースおよびテーブルパーティションは複数のリレーショナルデータベースに分散されているため、包括的な分析は不可能です。ビジネスデータ分析は使用可能なリソースに負荷をかける可能性があります。

特長

  • SQLエクスペリエンスの転送が可能

    新しいサービスにすぐに対応可能。DLIは、標準のANSI SQL 2003リレーショナルデータベース構文をサポートするため、習得に必要な時間はほぼなし。

  • 万能で堅牢なパフォーマンス

    分散型インメモリコンピューティングモデルは、複雑なクエリ、パーティション間分析、およびビジネスインテリジェンス処理に容易に対応。

関連サービス
eコマース

プレシジョンマーケティング

関連性分析は、複数チャンネルの情報を結合し、コンバージョン率を向上させます。

特長

  • クロスソース分析

    OBSに保存されている広告CTRデータとRDS内のユーザー登録データを、DLIに移行せずに直接クエリ可能。

  • SQLのみ必要

    相互接続されたデータソースを、SQLステートメントのみを使用して作成されたテーブルを使ってまとめてマッピング。

関連サービス
ゲーミング

ログ解析

ゲーム会社は、広告の配置、新規プレイヤーの保持、操作、および将来のゲームイテレーションに対するフィードバックを向上させるために高品質なデータ分析プラットフォームが必要です。

問題点

通常、ログ解析は定期的に実行されます。各タスク間のアイドル期間中、リソースは無駄になります。

特長

  • 従量課金制とオートスケーリング

    柔軟なスケーリングポリシーでアイドル状態のリソースを解放し、限定クラスターのコストを半減。

  • 統合された分析

    単一のメタデータコピーのみで、リアルタイムのクリーニングとオフラインETL処理に対応。データの処理結果は、データマイニングのインタラクティブ分析で直接使用可能。

関連サービス
大企業

権限のコントロール

複数の部門でリソースを個別に管理する必要がある場合、きめ細かい権限管理によって、データのセキュリティと運用効率が向上します。

特長

  • 容易な権限割り当て

    カラムまたはINSERT INTO/OVERWRITEなどの特定の操作で権限を付与し、メタデータを読み取り専用に設定。

  • 統合管理

    単一のIAMアカウントですべてのスタッフユーザーの権限を処理。

遺伝学

ライブラリ統合

ゲノム解析は、Spark分散処理フレームワーク上に構築された、サードパーティーの分析ライブラリに依存します。

問題点

- ADAMやHailなどの分析ライブラリをインストールするには、高度な技術スキルが必要です。

- クラスターを作成するたびに、これらの分析ライブラリを再インストールする必要があります。

特長

  • カスタムイメージ

    高度な技術を必要とするプロセスでライブラリをインストールする代わりに、ライブラリをカスタムイメージにパッケージ化し、SoftWare Repository for Container(SWR)に直接アップロード。DLIを使用してクラスターを作成すると、SWRのカスタムイメージが自動的にプルされるため、これらのライブラリの再インストールは不要。

  • 組み込みのベースイメージ

    Huawei拡張SparkおよびFlinkイメージ(複数バージョン)とオープンソースAIイメージ(TensorFlow/Keras/PyTorch)を必要に応じて使用可能。

関連サービス
金融

リアルタイムのリスク管理

金融サービスのほぼすべての面に、包括的なリスク管理とリスク軽減が必要です。

問題点

リスク管理において、過度のレイテンシーはほぼ許容されません。

特長

  • 高スループット

    Apache Flinkデータフローモデルを活用するDLIのリアルタイムデータ分析により、低レイテンシーを維持。1つのCPUで1秒あたり1,000~20,000のメッセージを処理。

  • エコシステムの範囲

    リアルタイムのデータストリームを、CloudTableやSMNなど複数のクラウドサービスに保存して包括的に適用。

関連サービス
政府

リアルタイム表示

全世界でのCOVID-19のまん延により、政府は何かが起こったその瞬間に主要データを監視できる必要があります。

問題点

政府機関の公務員がビッグデータの経験を持っているとは限りません。通常、SQLの方が幅広く使われています。

特長

  • ミリ秒単位の応答

    パワフルなインメモリコンピューティングフレームワークを備えた組み込みのopenLooKengエンジンは、インタラクティブ分析のクエリパフォーマンスを即座に最適化。

  • メインストリームの互換性

    DLIクエリはSQL構文を使用するため、スタッフにビッグデータの経験は不要。使い慣れたSQL構文は、標準のANSI SQL 2003に完全対応。

関連サービス
地理

ビッグデータ分析

膨大なデータには、航空写真や、構造化リモートセンシングラスターデータ、ベクターデータ、非構造化空間位置データなどさまざまなタイプのPB規模のデータが含まれます。このすべてのデータの分析とマイニングには効率的なツールが必要です。

特長

  • 空間データの分析

    DLIのSparkアルゴリズム演算子を使って、リアルタイムのストリーム処理とオフラインのバッチ処理が可能。これらの演算子は、構造型リモートセンシング画像データ、非構造型3Dモデリング、レーザー点群データを含むさまざまなデータタイプをサポート。

  • CEP SQL機能

    ヨー検出やジオフェンシングには、SQLステートメントだけで対応可能。

  • 負荷が高いデータ処理

    最大でEB規模にもなるリモートセンシング画像をクラウドに迅速に移行して、それらをデータソースにスライスし、分散バッチ処理を実行。

関連サービス

DLIと自作Hadoopの比較

Data Lake Insight

自作Hadoopシステム

料金

スキャンされた実データ量または使用された1時間あたりのコンピュートユニット(CUH)に応じて課金

占有リソースに応じて課金

長期の占有は高額で無駄が多い

弾力性があるスケーラビリティ

コンテナベースのKubernetesによるインテリジェントさ

N/A

運用と保守および可用性

すぐに利用可能、サーバーレスアーキテクチャ、およびクロスAZ DR

設定および運用と保守には高度な技術力が必要

学習コスト

最適化パラメータは、10年にわたる数千のプロジェクトでの経験に基づいて標準化。DLIはインテリジェントな最適化のためのGUIも提供

数百のチューニングパラメータの学習が必要

サポートされるデータソース

クラウド:OBS/RDS/DWS/CSS/MongoDB/Redis

オンプレミス:自作のデータベース/MongoDB/Redis

クラウド:OBS

オンプレミス:HDFS

エコシステムの互換性

Data Lake Visualization(DLV)、Tableau、Yonghong BI、およびFanruan BI

ビッグデータエコシステムツール

カスタムイメージ

対応。サービス多様性要件を満たすために、必要に応じて依存関係を追加可能

N/A

ワークフローのスケジュール作成

DataArts StudioのData Lake Factory(DLF)を通じてスケジュール設定

Airflowなど自作のスケジューリングツール

エンタープライズテナントの権限

カラムレベル精度のテーブルベース

ファイルベース

パフォーマンス

最適化されたソフトウェアとハードウェアにより向上

Hadoopオープンソースバージョンと一致

料金

Data Lake Insight

スキャンされた実データ量または使用された1時間あたりのコンピュートユニット(CUH)に応じて課金

自作Hadoopシステム

占有リソースに応じて課金

長期の占有は高額で無駄が多い

弾力性があるスケーラビリティ

Data Lake Insight

コンテナベースのKubernetesによるインテリジェントさ

自作Hadoopシステム

N/A

運用と保守および可用性

Data Lake Insight

すぐに利用可能、サーバーレスアーキテクチャ、およびクロスAZ DR

自作Hadoopシステム

設定および運用と保守には高度な技術力が必要

学習コスト

Data Lake Insight

最適化パラメータは、10年にわたる数千のプロジェクトでの経験に基づいて標準化。DLIはインテリジェントな最適化のためのGUIも提供

自作Hadoopシステム

数百のチューニングパラメータの学習が必要

サポートされるデータソース

Data Lake Insight

クラウド:OBS/RDS/DWS/CSS/MongoDB/Redis

オンプレミス:自作のデータベース/MongoDB/Redis

自作Hadoopシステム

クラウド:OBS

オンプレミス:HDFS

エコシステムの互換性

Data Lake Insight

Data Lake Visualization(DLV)、Tableau、Yonghong BI、およびFanruan BI

自作Hadoopシステム

ビッグデータエコシステムツール

カスタムイメージ

Data Lake Insight

対応。サービス多様性要件を満たすために、必要に応じて依存関係を追加可能

自作Hadoopシステム

N/A

ワークフローのスケジュール作成

Data Lake Insight

DataArts StudioのData Lake Factory(DLF)を通じてスケジュール設定

自作Hadoopシステム

Airflowなど自作のスケジューリングツール

エンタープライズテナントの権限

Data Lake Insight

カラムレベル精度のテーブルベース

自作Hadoopシステム

ファイルベース

パフォーマンス

Data Lake Insight

最適化されたソフトウェアとハードウェアにより向上

自作Hadoopシステム

Hadoopオープンソースバージョンと一致

導入事例

梦餉集団(Mengxiang.com)

梦餉集団は、Huawei Cloud DLIおよびDataArts Studioを使用してリアルタイムの行動データを分析し、顧客に合わせた製品を開発しています。

同社は急成長の最中にあり、トラフィックのピークと販売促進時のサービスの安定性において課題に直面していました。DLI+DataArts Studioソリューションを活用することで、弾力性があるアーキテクチャと高性能データレイクを利用して統合されたバッチおよびストリーミング処理を実現しています。

点触科技(DIANCHU Technology)

点触科技は、Huawei Cloud DLIとインテリジェントなデータレイクDGCを使用して、ゲーム用のデータ分析プラットフォームを確立しました。このプラットフォームは、アクティビティプランニング、精密マーケティング、意思決定に役立つ収益、プレイヤー保持率、および支払い率をリアルタイムで分析します。

成都竜淵網絡科技有限公司(Dragonest)

成都竜淵網絡科技有限公司はHuawei Cloudを使ってゲームデータをクエリおよび分析しています。この分析は、新しいサービスを開始するさまざまな部門で活用されています。データアプリケーションが統合されることで、組織全体にメリットをもたらしています。

新規登録して素晴らしいクラウドジャーニーを開始する

無料で使ってみる