¿Qué es DLI?

  • Facilidad de uso

    DLI le permite explorar fácilmente terabytes de datos en su data lake usando SQL estándar en segundos, sin carga de operación y mantenimiento.

    DLI le permite explorar fácilmente terabytes de datos en su data lake usando SQL estándar en segundos, sin carga de operación y mantenimiento.

  • Análisis unificado

    Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, y análisis interactivo en un solo lugar.

    Totalmente compatible con Apache Spark, Flink y openLooKeng; procesamiento de flujos y por lotes, y análisis interactivo en un solo lugar.

  • Recursos escalables

    Acceso compartido y bajo demanda a grupos de recursos, escalado flexible basado en prioridades preestablecidas.

    Acceso compartido y bajo demanda a grupos de recursos, escalado flexible basado en prioridades preestablecidas.

  • Conexión entre fuentes

    Fácil acceso a datos de distintas fuentes para conseguir el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

    Fácil acceso a datos de distintas fuentes para conseguir el análisis colaborativo con conexiones de fuentes de datos de DLI, sin necesidad de migrar datos.

Características

  • Totalmente compatible con SQL

    Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.

    Realice análisis de big data de forma simple con instrucciones SQL. La sintaxis es totalmente compatible con SQL ANSI 2003.

  • Spark/Flink/openLooKeng sin servidor

    Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

    Migre sin problemas sus aplicaciones fuera de línea a la nube utilizando tecnología sin servidor. DLI es totalmente compatible con los ecosistemas y las API de Apache Spark, Apache Flink y Presto.

  • Análisis entre fuentes

    Analice sus datos entre bases de datos. No es necesaria la migración. Disponer de una visión unificada de sus datos le ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.

    Analice sus datos entre bases de datos. No es necesaria la migración. Disponer de una visión unificada de sus datos le ayudará a comprenderlos de forma integral y a innovar con mayor celeridad. No hay restricciones relacionadas con el formato ni con la fuente de los datos en la nube, así como tampoco resulta relevante si las bases de datos se crearon en línea o fuera de línea.

  • Capacidad multitenant empresarial

    Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control de alta granularidad que permite mantener la independencia de los datos en cada tarea.

    Gestione los permisos relacionados con el cómputo o los recursos por proyecto o por usuario. Disfrute de un control de alta granularidad que permite mantener la independencia de los datos en cada tarea.

Escenarios de aplicación

Analítica

Análisis de bases de datos

Los datos de aplicaciones almacenados en bases de datos relacionales se deben analizar para extraer más valor. Por ejemplo, la big data procedente de detalles de registros ayuda a tomar decisiones comerciales.

Dificultades

- No se admiten consultas complejas para bases de datos relacionales de mayor tamaño.

- No es posible efectuar un análisis completo porque las particiones de las bases de datos y de las tablas están repartidas en múltiples bases de datos relacionales. El análisis de datos del negocio podría sobrecargar los recursos disponibles.

Ventajas

  • Capacidad de transferir la experiencia en SQL

    Comience a trabajar con nuevos servicios. DLI es compatible con la sintaxis estándar de las bases de datos relacionales ANSI SQL 2003, por lo que prácticamente no hay curva de aprendizaje.

  • Rendimiento versátil y robusto

    Los modelos de cómputo distribuido en memoria gestionan sin esfuerzo consultas complicadas, análisis entre particiones y procesamiento de inteligencia empresarial.

Servicios relacionados
Comercio electrónico

Marketing de precisión

El análisis asociativo combina la información de múltiples canales para mejorar las tasas de conversión.

Ventajas

  • Análisis entre fuentes

    Los datos de CTR de anuncios, almacenados en OBS, y los datos de registros de usuarios en RDS se pueden consultar directamente sin necesidad de migrar a DLI.

  • Solo SQL

    Las fuentes de datos interconectadas, puede mapearse junto con una tabla creada únicamente con instrucciones SQL.

Servicios relacionados
Videojuegos

Análisis de logs

Las empresas de videojuegos necesitan una plataforma de análisis de datos de calidad para mejorar la publicación de anuncios, la retención de jugadores nuevos, las operaciones y los comentarios para futuras iteraciones de los juegos.

Dificultades

El análisis de logs suele realizarse por períodos. Durante los períodos de inactividad entre cada tarea, se desperdician recursos.

Ventajas

  • Pago por uso y escalado automático

    Libere recursos inactivos con políticas de escalado flexibles y ahorre la mitad de los costes de los clústeres exclusivos.

  • Análisis convergente

    Solo se necesita una copia de los metadatos para la limpieza en tiempo real y el procesamiento ETL fuera de línea. Los resultados del procesamiento de datos pueden utilizarse directamente en análisis interactivos para la minería de datos.

Servicios relacionados
Empresas grandes

Control de permisos

Cuando múltiples departamentos necesitan administrar recursos de forma independiente, la gestión de permisos de alta granularidad mejora la seguridad de los datos y la eficiencia de las operaciones.

Ventajas

  • Asignación de permisos más sencilla

    Otorgue permisos por columnas o por operaciones específicas, como INSERT INTO/OVERWRITE, y configure los metadatos en modo de solo lectura.

  • Gestión unificada

    Una sola cuenta de IAM gestiona los permisos para todos los usuarios del personal.

Genética

Integración de bibliotecas

El análisis genómico requiere del uso de bibliotecas de análisis de terceros, basadas en el marco de trabajo distribuido de Spark.

Dificultades

- Se requieren grandes habilidades técnicas para instalar bibliotecas de análisis como ADAM y Hail.

- Cada vez que se crea un clúster, hay que volver a instalar estas bibliotecas de análisis.

Ventajas

  • Imágenes personalizadas

    En lugar de instalar bibliotecas mediante un proceso exigente en términos técnicos, empaquételas en imágenes personalizadas que se cargan directamente en SoftWare Repository for Container (SWR). Cuando se utiliza DLI para crear un clúster, las imágenes personalizadas en SWR se extraen automáticamente para no tener que volver a instalar estas bibliotecas.

  • Imágenes base incorporadas

    Las imágenes Spark y Flink mejoradas de Huawei (múltiples versiones) y las imágenes de IA de código abierto (TensorFlow/Keras/PyTorch) están disponibles para su conveniencia.

Servicios relacionados
Finanzas

Control de riesgos en tiempo real

Casi todos los aspectos relacionados con los servicios financieros requieren la gestión y la mitigación exhaustivas de los riesgos.

Dificultades

Cuando se trata del control de riesgos, hay muy poca tolerancia a la latencia excesiva.

Ventajas

  • Alto throughput

    El análisis de datos en tiempo real en DLI con la ayuda de un modelo de flujo de datos de Apache Flink mantiene baja la latencia. Una sola CPU procesa entre 1.000 y 20.000 mensajes por segundo

  • Cobertura del ecosistema

    Guarde flujos de datos en tiempo real en múltiples servicios en la nube, como CloudTable y SMN, para una aplicación integral.

Servicios relacionados
Gobierno

Pantallas en tiempo real

Con la COVID-19 presente en todo el mundo, los gobiernos deben ser capaces de monitorizar los datos clave en el momento en que se presentan los hechos.

Dificultades

Los empleados gubernamentales no están necesariamente capacitados en big data. SQL suele ser mucho más conocido.

Ventajas

  • Capacidad de respuesta en milisegundos

    Gracias a su potente marco de cómputo en memoria, el motor integrado openLooKeng optimiza el rendimiento de las consultas para realizar análisis interactivos sobre la marcha.

  • Compatibilidad general

    Las consultas de DLI usan sintaxis SQL, por lo que el personal no necesita estar especializado en big data. Esta sintaxis conocida es totalmente compatible con ANSI SQL 2003 estándar.

Servicios relacionados
Geografía

Análisis de big data

Volúmenes masivos de datos que incluyen petabytes de imágenes satelitales y muchos tipos de datos: datos rasterizados de teledetección estructurados, datos vectoriales y datos de ubicación espacial no estructurados. El análisis y la minería de todos estos datos requieren herramientas eficientes.

Ventajas

  • Análisis de datos espaciales

    Los operadores de algoritmos de Spark en DLI permiten el procesamiento de flujos en tiempo real y el procesamiento por lotes fuera de línea. Admiten tipos de datos masivos, entre los que se incluyen los datos estructurados de imágenes de teledetección, el modelado 3D no estructurado y los datos de puntos láser en la nube.

  • Funcionalidad de SQL CEP

    Instrucciones SQL son todo lo que se necesita para la detección de guiñadas y las geovallas.

  • Procesamiento de datos pesados

    Migre rápidamente hasta exabytes de imágenes de teledetección a la nube y luego divídalas en fuentes de datos para realizar el procesamiento por lotes distribuido.

Servicios relacionados

DLI versus Hadoop de construcción propia

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日

活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

Data Lake Insight

Sistema Hadoop de construcción propia

Coste

Facturado por el volumen real de datos analizados o la cantidad de unidades de cómputo por hora (CUH) utilizadas.

Se ahorran costes.

Facturado por recursos ocupados.

La ocupación a largo plazo es costosa y excesiva.

Escalabilidad elástica

Inteligente, con Kubernetes basado en contenedores

N/A

O&M y disponibilidad

Arquitectura sin servidor y lista para usar

Se requieren sólidos conocimientos técnicos para la configuración y las tareas de O&M

Coste de aprendizaje

Los parámetros de optimización están estandarizados sobre la base de 10 años de experiencia en miles de proyectos. Además, DLI proporciona una interfaz gráfica de usuario (GUI) para la optimización inteligente.

Es necesario aprender cientos de parámetros de ajuste.

Fuentes de datos compatibles

En la nube: OBS/RDS/DWS/CSS/MongoDB/Redis;

En las instalaciones: base de datos de construcción propia/MongoDB/Redis

En la nube: OBS;

En las instalaciones: HDFS

Compatibilidad con ecosistemas

Data Lake Visualization (DLV), Tableau, Yonghong BI y Fanruan BI

Herramienta del ecosistema de big data

Personalización de imágenes

Se admite. Pueden añadirse dependencias según sea necesario para cumplir con los requisitos de diversidad de los servicios.

N/A

Planificación de flujos de trabajo

Planificación a través de Data Lake Factory (DLF) en DataArts Studio

Herramientas de planificación de construcción propia, como Airflow

Permisos de tenants empresariales

Gestión basada en tablas con granularidad a nivel de columna

Gestión basada en archivos

Rendimiento

Mayor, gracias a la optimización de software y hardware

Coincide con el de las versiones de Hadoop de código abierto

Coste

Data Lake Insight

Facturado por el volumen real de datos analizados o la cantidad de unidades de cómputo por hora (CUH) utilizadas.

Se ahorran costes.

Sistema Hadoop de construcción propia

Facturado por recursos ocupados.

La ocupación a largo plazo es costosa y excesiva.

Escalabilidad elástica

Data Lake Insight

Inteligente, con Kubernetes basado en contenedores

Sistema Hadoop de construcción propia

N/A

O&M y disponibilidad

Data Lake Insight

Arquitectura sin servidor y lista para usar

Sistema Hadoop de construcción propia

Se requieren sólidos conocimientos técnicos para la configuración y las tareas de O&M

Coste de aprendizaje

Data Lake Insight

Los parámetros de optimización están estandarizados sobre la base de 10 años de experiencia en miles de proyectos. Además, DLI proporciona una interfaz gráfica de usuario (GUI) para la optimización inteligente.

Sistema Hadoop de construcción propia

Es necesario aprender cientos de parámetros de ajuste.

Fuentes de datos compatibles

Data Lake Insight

En la nube: OBS/RDS/DWS/CSS/MongoDB/Redis;

En las instalaciones: base de datos de construcción propia/MongoDB/Redis

Sistema Hadoop de construcción propia

En la nube: OBS;

En las instalaciones: HDFS

Compatibilidad con ecosistemas

Data Lake Insight

Data Lake Visualization (DLV), Tableau, Yonghong BI y Fanruan BI

Sistema Hadoop de construcción propia

Herramienta del ecosistema de big data

Personalización de imágenes

Data Lake Insight

Se admite. Pueden añadirse dependencias según sea necesario para cumplir con los requisitos de diversidad de los servicios.

Sistema Hadoop de construcción propia

N/A

Planificación de flujos de trabajo

Data Lake Insight

Planificación a través de Data Lake Factory (DLF) en DataArts Studio

Sistema Hadoop de construcción propia

Herramientas de planificación de construcción propia, como Airflow

Permisos de tenants empresariales

Data Lake Insight

Gestión basada en tablas con granularidad a nivel de columna

Sistema Hadoop de construcción propia

Gestión basada en archivos

Rendimiento

Data Lake Insight

Mayor, gracias a la optimización de software y hardware

Sistema Hadoop de construcción propia

Coincide con el de las versiones de Hadoop de código abierto

Historias de éxito

Mengxiang.com

Mengxiang utiliza DLI y DataArts Studio de Huawei Cloud para analizar datos de comportamiento en tiempo real y relacionar productos con los clientes.

Esta empresa de rápido crecimiento tuvo que hacer frente a desafíos relacionados con la estabilidad del servicio durante las horas de mayor tráfico y las promociones. La solución “DLI+DataArts Studio” proporciona a Mengxiang una arquitectura elástica y un data lake de alto rendimiento que permite procesar flujos y lotes de forma integrada.

DIANCHU Technology

DIANCHU adoptó el producto DLI de Huawei Cloud y el data lake inteligente DGC para establecer una plataforma de análisis de datos para videojuegos. La plataforma analiza los ingresos, la tasa de retención de jugadores y la tasa de pago en tiempo real para la planificación de actividades, el marketing de precisión y la toma de decisiones.

Dragonest

Dragonest y Huawei Cloud realizan consultas y análisis de datos de videojuegos de forma conjunta. Los diferentes departamentos de la empresa utilizan los resultados de dichos análisis durante el lanzamiento de nuevos servicios. Las aplicaciones de datos están integradas, lo que beneficia a toda la organización.