精选文章 倒排索引与正序索引

倒排索引与正序索引

作者:black_mamba123 时间: 2020-08-05 07:43:54
black_mamba123 2020-08-05 07:43:54

前言

文章主要涉及三点:

1、mysql正序索引

2、es倒排索引简介

mysql正序索引

倒排索引与正序索引1

mysql的聚簇索引的查询:通过索引定位到存储数据的叶子节点。

mysql的非聚簇索引:通过索引定位到叶子节点的聚簇索引值,再根据聚簇索引回表查询数据。

因此正序索引是通过聚簇索引定位到数据,如果select * from table where like '%a%' 则需要捞全表进行匹配。

es倒排索引简介

倒排索引与正序索引2

es如果执行例如:select * from table where xx like '%篮球%'会怎么样?

首先对于es来说mysql中的一行数据对应es中的一个文档(doc),在进行数据存储时,会将索引字段(filed)按照一定的分词方式生成一个term集合(term是索引的最小单位),倒排索引就是实现了term---> doc list的映射,可以通过term快速定位到包含这个term的doc。所以说上述sql的执行过程:根据"篮球"找到对应的term即可以找到对应的doc list。

勿删,copyright占位
分享文章到微博
分享文章到朋友圈

上一篇:第十章,计划任务

下一篇:7.31日阿里笔试题目小强放牛

您可能感兴趣

  • MySQL如何优化CPU消耗?

    谁在消耗cpu? 用户+系统+IO等待+软硬中断+空闲 # 祸首是谁? 用户 用户空间CPU消耗,各种逻辑运算 正在进行大量tps 函数/排序/类型转化/逻辑IO访问… IO等待 等待IO请求的完成 此时CPU实际上空闲 如vmstat中的wa 很高。但IO等待增加,wa也不一定会上升(请求I/O后等待响应,但进程从核上移开了) 产生影响 用户和IO等待消耗了大部分cpu 吞吐量下降(tps...

  • Linux系统内存

    Linux 内存是后台开发人员,需要深入了解的计算机资源。合理的使用内存,有助于提升机器的性能和稳定性。本文主要介绍Linux 内存组织结构和页面布局,内存碎片产生原因和优化算法,Linux 内核几种内存管理的方法,内存使用场景以及内存使用的那些坑。 从内存的原理和结构,到内存的算法优化,再到使用场景,去探寻内存管理的机制和奥秘。 一、走进Linux 内存 1、内存是什么? 1)内存又称主存...

  • 美团数据库运维自动化系统构建之路

    本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和厦门等地举行,要参加下一次最新沙龙活动?赶快关注微信公众号“美团点评技术团队”。 本次沙龙主要围绕数据库相关的主题,内容包括美团数据库自动化运维系统构建、点评侧My...

  • K8s CNI网络最强对比:Flannel、Calico、Canal和W

    介 绍 网络架构是Kubernetes中较为复杂、让很多用户头疼的方面之一。Kubernetes网络模型本身对某些特定的网络功能有一定要求,但在实现方面也具有一定的灵活性。因此,业界已有不少不同的网络方案,来满足特定的环境和要求。 CNI意为容器网络接口,它是一种标准的设计,为了让用户在容器创建或销毁时都能够更容易地配置容器网络。在本文中,我们将集中探索与对比目前最流行的CNI插件:Flan...

  • 盘一盘 Python 特别篇 20 - SciPy 稀疏矩阵

    本文含 6057 字,13 图表截屏 建议阅读 32 分钟 本文是 Python 系列的特别篇的第二十篇 特别篇 1 - PyEcharts TreeMap 特别篇 2 - 面向对象编程 特别篇 3 - 两大利「器」 特别篇 4 - 装饰器 特别篇 5 - Sklearn 0.22 特别篇 6 - Jupyter Notebook 特别篇 7 - 格式化字符串 特别篇 8 - 正则表达式 特...

  • 论文|从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考...

    点击标题下「搜索与推荐Wiki」可快速关注 ▼ 相关推荐 ▼ 1、基于DNN的推荐算法介绍 2、传统机器学习和前沿深度学习推荐模型演化关系 3、论文|AGREE-基于注意力机制的群组推荐(附代码) 4、论文|被“玩烂”了的协同过滤加上神经网络怎么搞? 本文包含(文章较长,建议先收藏再阅读,点击文末的阅读原文,查看更多推荐相关文章): DSSM DSSM的变种 MV-DNN Google Tw...

  • 搞定pandas,我用二八神功!(送书)

    大家好,我是小z 最近天气实在是太**热了,天气一热,群虫乱舞,为了应景,我决定送一本爬虫相关书籍,文末留言就能参与。 回到正题,今天,我们来聊聊不一样的二八定律/神功。 我微信抽样询问了35个好友,二八定律有97%的听说率,只有一位没听过且不愿意透露姓名的朋友,不过他是搞艺术的...

  • 适合新手练习的Python项目有哪些?

    适合新手练习的Python项目有哪些?简单易上手的Python项目汇总:Web 项目设计:内容聚合器、正则表达式查询工具、网址缩短、便利贴、功能、测验、GUI 项目设计:MP3 播放器、闹铃提醒工具、文件管理器、记账功能、命令行项目设计:通讯录、网站连接检查、批量文件重命名工具、目录树生成器。   一、Web 项目设计:内容聚合器(Content Aggregator)   该项目设计的主要...

华为云40多款云服务产品0元试用活动

免费套餐,马上领取!
CSDN

CSDN

中国开发者社区CSDN (Chinese Software Developer Network) 创立于1999年,致力为中国开发者提供知识传播、在线学习、职业发展等全生命周期服务。