Data Lake Insight | Huawei Cloud

Data Lake Insight (DLI)

{"_id":"pep-solution-page-navigate-v2_f0dad53ce51b4c9aacc6e25805b6d7c6","context":{"bg":"white","btnList":[{"btnUrl":"https://www.huaweicloud.com/intl/es-us/contact-sales.html","btnText":"Contáctenos","btnStyle":"por-btn-primary"}],"moreText":"","actionInfo":{"title":"Data Lake Insight (DLI)","titleUrl":"","actionList":[{"isBlank":false,"actionUrl":"#","isChecked":true,"actionName":"Descripción","selectMenu":{"selectList":[{"url":"https://www.huaweicloud.com","name":"开发者资源开发者资源开发者资源","isBlank":false},{"url":"https://www.huaweicloud.com","name":"客户案例","isBlank":false},{"url":"https://www.huaweicloud.com","name":"最佳实践","isBlank":false}]},"isShowSelect":false},{"isBlank":true,"actionUrl":"https://www.huaweicloud.com/intl/es-us/pricing/calculator.html#/dli","isChecked":false,"actionName":"Precios","selectMenu":{"selectList":[{"url":"","name":"","isBlank":false},{"url":"","name":"","isBlank":false}]},"isShowSelect":false},{"isBlank":true,"actionUrl":"https://support.huaweicloud.com/intl/es-us/bestpractice-dli/dli_05_0043.html","isChecked":false,"actionName":"Prácticas recomendadas","selectMenu":{"selectList":[{"url":"https://www.huaweicloud.com","name":"开发者资源开发者资源开发者资源","isBlank":false},{"url":"https://www.huaweicloud.com","name":"客户案例","isBlank":false},{"url":"https://www.huaweicloud.com","name":"最佳实践","isBlank":false}]},"isShowSelect":false},{"isBlank":true,"actionUrl":"https://www.huaweicloud.com/intl/es-us/solution/","isChecked":false,"actionName":"Soluciones","selectMenu":{"selectList":[{"url":"https://www.huaweicloud.com","name":"开发者资源","isBlank":false},{"url":"https://www.huaweicloud.com","name":"客户案例","isBlank":false},{"url":"https://www.huaweicloud.com","name":"最佳实践","isBlank":false}]},"isShowSelect":false}],"mobileSelectText":""},"columnNumberMB":"2"},"advancedInfo":{"isShowBtn":true,"isShowTitle":true}}

Procesamiento de flujo sin servidor, procesamiento por lotes y análisis interactivo que permiten la importación rápida de grandes cantidades de metadatos a un lago de datos, la rápida ingesta de datos sin procesar a un almacén de datos y la integración sin esfuerzo de las capacidades de inteligencia empresarial (BI) e inteligencia artificial (IA)

Facilidad de uso

Los resultados de los datos a nivel de TB se pueden devolver en cuestión de segundos, además el desarrollo es sencillo gracias al uso del lenguaje de consulta estructurado (SQL) estándar, mientras que las operaciones libres de mantenimiento representan una inversión en mano de obra considerablemente baja.

Análisis todo en uno

Spark, Flink y Trino se combinan para proporcionar una experiencia de análisis interactivo sin inconvenientes para procesar datos por lotes y de flujos.

Alta rentabilidad

La arquitectura de almacenamiento y cómputo desacoplados representan costos más bajos, recursos elásticos, reutilización basada en el tiempo y prioridades flexibles.

Código abierto

Las capacidades de análisis entre fuentes son proporcionadas mediante la admisión de formatos de datos de código abierto populares y la integración con productos de BI convencionales.

Por qué DLI de Huawei Cloud

Todo en SQL

Gracias al uso de los motores multimodelo, DLI hace que el análisis de big data sea accesible incluso para aquellos sin experiencia en este campo, todo lo que necesitan es conocimiento de SQL. Es totalmente compatible con los ecosistemas e interfaces de Apache Spark, Apache Flink y Trino, además las aplicaciones fuera de línea se pueden migrar fácilmente a la nube. Un conjunto de recursos puede manejar múltiples tipos de cómputo, incluyendo procesamiento de flujos, procesamiento por lotes y análisis interactivo.

Grupo de recursos elástico

El grupo de recursos es flexible y se puede ajustar rápidamente a las fluctuaciones de la demanda de recursos fuera de línea, en tiempo real y de manera interactiva. También admite la prioridad a nivel de trabajo y se integra con DataArts Studio para optimizar las operaciones, asegurando la finalización oportuna de las tareas críticas.

Lakehouse

DLI incorpora el formato de lago de datos Hudi para el análisis y admite una solución unificada para múltiples motores, tales como Spark y Flink. Además permite la ingesta de datos en tiempo real y el análisis de lakehouse mediante el uso de SQL.

Análisis entre fuentes

DLI admite múltiples formatos de datos y puede analizar datos de diversas fuentes, tales como la nube, las bases de datos locales y las bases de datos fuera de línea, sin necesidad migrarlos. Esto posibilita la creación de una visión unificada de los datos empresariales, lo que permite a las empresas innovar rápidamente y liberar todo el potencial de sus datos.

Información de datos valiosa para cualquier escenario

Análisis de bases de datos
Comercio electrónico
Videojuegos
Grandes empresas
Genética
Finanzas
Gobierno

Análisis de bases de datos

Analice los datos almacenados en una base de datos relacional, tal como la información de registro para una aplicación.

Ventajas

Familiaridad de experiencia con SQL

La sintaxis SQL de DLI es totalmente compatible con el estándar ANSI SQL 2003 para bases de datos relacionales, no requiere aprendizaje adicional y le permite utilizar SQL como siempre lo ha hecho.

Rendimiento superior

DLI utiliza un modelo de cómputo en memoria distribuido para procesar fácilmente grandes cantidades de datos.

Cuellos de botella resueltos

Las bases de datos relacionales no pueden manejar consultas complejas a medida que crece el volumen de datos.

La fragmentación puede dificultar el análisis exhaustivo.

El análisis de datos empresariales puede afectar a las operaciones en línea.

Servicios relacionados

CDM

Comercio electrónico

Marketing de precisión

En la industria del comercio electrónico, es crucial obtener información desde múltiples fuentes para el análisis correlacional con la finalidad de optimizar el marketing de precisión y mejorar las tasas de conversión. Por ejemplo, correlacionar "datos de eventos de clics en anuncios en la página" con "datos de registro de usuarios" para identificar los tipos de anuncios preferidos por los diferentes grupos de edad, y ofrecer anuncios más precisos a los usuarios según su edad.

Ventajas

Análisis entre fuentes

Los "datos de eventos de clics en anuncios de la página" almacenados en OBS y los "datos de registro de usuarios" almacenados en Relational Database Service (RDS) pueden correlacionarse y analizarse sin necesidad de migrarlos.

Operaciones puramente en SQL

DLI ha integrado múltiples fuentes de datos y su mapeo se puede completar directamente a través de la creación de tablas SQL.

Servicios relacionados

OBS

DIS

Videojuegos

Análisis de registros

Las empresas de videojuegos dependen de plataformas de análisis de datos para superar los desafíos de la industria aprovechando el poder de los datos. Por ejemplo, encontrar canales de publicidad de alta calidad, mejorar la retención de nuevos jugadores, optimizar las actividades operativas para aumentar la actividad de los jugadores e impulsar la iteración del producto a través de los datos.

Ventajas

Pago por uso

El DLI se factura solo durante el uso, lo que reduce los costos en más de un 50 % en comparación con los clústeres de uso exclusivo.

Análisis convergente

Los tres motores de DLI comparten metadatos y los datos se depuran en tiempo real antes de ser almacenados para su posterior procesamiento de extracción, transformación y carga (ETL) fuera de línea. Los resultados del procesamiento pueden utilizarse directamente para el análisis interactivo y la exploración de datos.

Cuello de botella resuelto

El análisis de registros se planifica generalmente por período, lo que resulta en una gran cantidad de tiempo inactivo entre cada planificación.

Servicios relacionados

DIS

RDS for MySQL

Grandes empresas

Análisis de registros

Las grandes empresas a menudo tienen varios departamentos que utilizan servicios en la nube, lo que requiere la gestión de permisos para varios empleados dentro de cada departamento. Esto incluye supervisar la creación, eliminación, uso y aislamiento de los recursos de cómputo. Al mismo tiempo, también es necesario gestionar los datos de cada departamento, asegurando que se establezcan protocolos de aislamiento y uso compartido adecuados.

Ventajas

Control detallado de permisos

Control de permisos a nivel de columnas, control de permisos independiente para INSERT INTO/OVERWRITE, control de permisos de solo lectura para metadatos de tablas.

Gestión unificada

Uso de Identity and Access Management (IAM) para la gestión de usuarios (sin necesidad de crear usuarios DLI aparte) y admisión de autorización precisa a través de IAM.

Servicios relacionados

MRS

Genética

Gestión de datos de genética

En el campo de la genética, existen muchas bibliotecas de análisis de terceros basadas en el framework distribuido de Spark, tales como ADAM y Hail.

Ventajas

Admite la personalización de imágenes

Empaquete bibliotecas de análisis de terceros tales como ADAM y Hail basadas en imágenes base, que se pueden cargar directamente en SWR. Al ejecutar trabajos en DLI, las imágenes personalizadas en SWR se extraerán automáticamente.

Imágenes base incorporadas

Versiones integradas mejoradas por Huawei de Spark/Flink e imágenes de IA de código abierto para TensorFlow, Keras y PyTorch.

Servicios relacionados

SWR

Finanzas

Control de riesgos en tiempo real

Para aumentar la probabilidad de eliminación o reducción de ocurrencias de eventos de riesgo, se necesita un sistema de control de riesgos para escenarios típicos tales como registro, inicio de sesión y control de transacciones.

Ventajas

Alto throughput y baja latencia

Esto es posible gracias al uso del modelo de flujo de datos de Apache Flink, el cual es un framework de cómputo en tiempo real, el cual utiliza recursos de cómputo de alto rendimiento para procesar entre 1,000 a 20,000 mensajes por segundo por unidad central de procesamiento (CPU).

Abundante ecosistema en la nube

Mediante el uso de SQL, los flujos de datos procesados se pueden escribir en múltiples servicios en la nube tales como CloudTable y SMN.

Servicios relacionados

DIS

SMN

Gobierno

Pantallas en tiempo real

Para realizar una mejor gestión de la pandemia de COVID-19, los gobiernos necesitaban utilizar paneles de control en tiempo real para monitorear datos clave, tales como casos confirmados actuales, casos confirmados acumulativos y casos importados, con la finalidad de proporcionar soporte de datos para la siguiente etapa de control de la pandemia.

Ventajas

Rendimiento de consultas a nivel de milisegundos

El motor openLooKeng incorporado utiliza muchas técnicas de optimización de consultas para cumplir con los requerimientos de análisis interactivo de alto rendimiento a nivel de milisegundos, además de un framework de cómputo en memoria.

Fácil de usar

Método de desarrollo puramente en SQL, que ofrece total compatibilidad con la sintaxis estándar ANSI SQL 2003.

Servicios relacionados

CDM

RDS for MySQL

DLV

Continua innovación de servicios con decenas de miles de clientes

Mengxiang Group Dianchu Technology Dragonest

Contribuyendo a que Mengxiang Group resuelva las altas demandas de tráfico del comercio electrónico

A medida que el negocio de la compañía se expande y su base de clientes crece súbitamente, la solución de gobernanza de datos integrada por lotes y de flujos de DLI y DataArts Studio de Huawei Cloud proporciona a Mengxiang una arquitectura flexible y un lago de datos de alto rendimiento para hacer frente a las altas demandas de tráfico ocasionadas por las promociones de comercio electrónico, para garantizar la estabilidad del negocio.

Colaboración con la tecnología de Dianchu en la creación de una plataforma de análisis de datos

Mediante el uso de DLI y DataArts Studio de Huawei Cloud, Dianchu Technology creó una plataforma de análisis de datos de videojuegos que proporciona análisis en tiempo real de ingresos, tasas de retención de jugadores, tasas de pago y otras métricas para ayudar a los operadores a planificar actividades, asistir a los editores en la precisión de las entregas, y apoyar a la gerencia en la toma rápida de decisiones empresariales importantes.

Colaborando con Dragonest para optimizar su eficiencia general

Dragonest se asoció con Huawei Cloud para mejorar su capacidad de consultar y analizar cantidades masivas de datos de una manera rentable, ayudando a los departamentos de operaciones, planificación y promoción a responder rápidamente a las necesidades empresariales y lograr aplicaciones de datos integradas. DLI proporciona herramientas de análisis de big data para ayudar a Dragonest a mejorar su eficiencia general.