Comunicados de prensa > HUAWEI CLOUD, ganador de la medalla de oro de la competencia WSDM Cup

HUAWEI CLOUD, ganador de la medalla de oro de la competencia WSDM Cup

29 de febrero de 2020

Un equipo liderado por HUAWEI CLOUD obtuvo la medalla de oro por su desempeño en la actividad Citation Intent Prediction (Predicción de intenciones de citas) en la 13.ª Conferencia Internacional sobre Búsquedas Web y Minería de Datos (WSDM) organizada por la ACM y celebrada en Houston, Estados Unidos.

La WSDM Cup es una de las conferencias más importantes e influyentes del mundo en relación con las búsquedas web y la minería de datos. Este año marca su 13.a edición. La WSDM Cup se concentra en las búsquedas web y en la minería de datos en las redes sociales. Se hace especial hincapié en la búsqueda y en la minería de datos, por ejemplo, en el diseño y el análisis de algoritmos de búsqueda y en el análisis experimental de aplicaciones industriales. El objetivo es optimizar los niveles de precisión.

image.png

La WSDM Cup de este año abordaba tres temas, y HUAWEI CLOUD se llevó el oro en uno de ellos: Citation Intent Prediction (Report Track) [Predicción de intenciones de citas (seguimiento de informes)]. El desafío consistía en encontrar los tres trabajos más destacados (en una biblioteca de 800,000 documentos) a partir de la descripción de un texto del trabajo citado.

Los documentos académicos contienen los conocimientos más avanzados del mundo. Si una computadora puede entender la información contenida en estos documentos, su capacidad y alcance de comprensión pueden ampliarse en gran medida. En un documento, el autor cita a menudo otros documentos y los describe brevemente. Si una computadora puede entender e identificar automáticamente estas citas, también puede ayudar a profundizar nuestra comprensión del contexto de la investigación. Además, los grafos de conocimiento, las preguntas y respuestas automáticas y la abstracción automática basados en esta información pueden mejorar las investigaciones científicas.

La solución de HUAWEI CLOUD propuesta para esta tarea consistió en la "recuperación global + reclasificación + agrupamiento", una estrategia diseñada por el equipo dirigido por el Laboratorio de Innovación de Idiomas y Habla de HUAWEI CLOUD. Los integrantes del equipo son estudiantes de la Universidad de Tecnología de China Meridional, la Universidad de Ciencia y Tecnología de Huazhong, la Universidad de Wuhan y la Universidad de Jiangnan.

En primer lugar, con el propósito de lograr una mayor tasa de recuperación y garantizar que se obtengan documentos completos y pertinentes, se utilizaron algoritmos ligeros como BM25, TFIDF y Word2Vec para estimar el grado de relación de los documentos. A continuación, se ejecutaron búsquedas más intensivas y precisas para calcular la similitud entre estos posibles documentos seleccionados con la descripción de la cita, y se los reorganizó en función de sus valores de similitud. Para la reclasificación se aplicaron modelos de idiomas preentrenados, basados en el aprendizaje profundo, como BERT. Los documentos proporcionados por el concurso pertenecen al campo biomédico, por lo tanto, utilizamos los modelos preentrenados BioBERT y SciBERT basados en corpus biomédicos para reclasificar los documentos candidatos. Por último, se determinaron los tres documentos más adecuados a la búsqueda mediante la integración de los resultados de todos los modelos.

Esta tecnología de búsqueda de coincidencias de textos utilizada por HUAWEI CLOUD en el concurso puede aplicarse ampliamente a búsquedas, chatbots, grafos de conocimiento y otros campos relacionados.

Además de este premio, HUAWEI CLOUD también ha ganado muchos otros concursos destacados e influyentes, lo que se atribuye a su tecnología full-stack en el campo del procesamiento de lenguaje natural. En octubre de 2019, HUAWEI CLOUD obtuvo el primer lugar en el Concurso de Minería de Datos Científicos DigSci (concurso de búsqueda de documentos académicos), con una tasa de precisión del 5 % mayor que el ganador del segundo premio. En la ronda final del Concurso de Inteligencia de Cómputo y Big Data de CCF celebrado en 2019, HUAWEI CLOUD resultó ganador del análisis de sentimientos a nivel de entidades en el campo financiero.

En el mundo real, los servicios de lenguaje y de voz de HUAWEI CLOUD se han aplicado con éxito en campos que requieren del reconocimiento de voz, la comprensión del lenguaje y la gestión del conocimiento. Estos campos incluyen, entre otros, el gobierno, las finanzas, el petróleo y el gas, la atención sanitaria, el sector automotriz, la logística, los seguros, el comercio electrónico, la tributación y los medios de comunicación.