精选文章 可视化工具不知道怎么选?深度评测5大Python数据可视化工具!

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!

作者:爬遍天下无敌手 时间: 2020-07-27 02:05:06
爬遍天下无敌手 2020-07-27 02:05:06

相信很多读者学习Python就是希望作出各种酷炫的可视化图表,当然你一定会听说过 Matplotlib 、 Pyecharts 、 Seaborn 、 Plotly 、 Bokeh 这五大工具,本文就将通过真实绘图来深度评测这五个Python数据可视化的库, 看看到底这几种工具各有什么优缺点,在制作图表时该如何选择。

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!1

指标说明

为了更清晰的了解这几款用于可视化的Python在作图时的异同,本文将使用 同一组数据 分别制作多系列条形图来对比,主要将通过以下几个指标来进行评测:

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!2

数据说明

本文使用的数据为Pyecharts中的faker数据

from pyecharts.faker import Faker
x = Faker.choose()
y1 = Faker.values()
y2 = Faker.values()

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!3

x为一列品牌名称,y1/y2为一列相同长度的 无意义 数据,接下来让我们使用不同的库对这组数据进行可视化!

Pyecharts

Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而Python是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时, pyecharts 诞生了,支持 30+ 种图表 。 在pyecharts中制作条形图首先需要导入相关库

from pyecharts import options as opts
from pyecharts.charts import Bar

接着是绘图并不做任何任何调整,首先创建一个Bar实例,接着添加x轴y轴数据,注意 仅接收list格式 数据,最后添加标题并设置在notebook中直接展示。总体来说还是比较符合正常的作图逻辑,整体 代码量并不多 。

c = (
    Bar()
    .add_xaxis(x)
    .add_yaxis("商家A", y1)
    .add_yaxis("商家B", y2)
    .set_global_opts(title_opts=opts.TitleOpts(title="Pyecharts—柱状图", subtitle=""))
).render_notebook()

默认生成的两系列柱状图如下:

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!4

可以看到,该图 支持交互式 展示与点击,默认生成的样式也较为美观,并且Pyecharts有详细的中文文档与demo,网上关于Pyecharts的讨论也较多,如果是刚接触的读者也能比较快的上手。 当然如果对默认样式不满意的话,可以进行一些调整,由于 文档十分完整 ,所以代码修改起来并不困难,比如可以修改主题并设置一些标 记线、DataZoom,添加小组件等

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!5

总体来说,由于Pyecharts是基于Echarts制作的,因此生成图表比较美观,并且 官方中文文档对相关设置讲解非常详细,有关Pyecharts的 讨论也非常多 ,所以如果在使用过程中有相关疑问也很容易通过检索找到答案,但遗憾的是不支持使用pandas中的series数据,需要 转换为list 才可以使用,不过整体还是让我很满意的一款可视化库。主观评分: 85 

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!6

Matplotlib

Matplotlib 应该是最广泛使用的Python可视化工具,支持的图形种类非常多,使用Matplotlib制作相同效果的图需要先导入相关库,并且并不支持原生中文所以还要设置下中文显示

import matplotlib.pyplot as plt
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei'] 

接着就是绘图,但是相比较于pyecharts大多是往写好的代码里面添加数据、配置不同,matplotlib大多数需要我们自己写代码,所以 代码量可能稍多一点

width = 0.35
x1 = np.arange(len(x)) 

fig, ax = plt.subplots()
rects1 = ax.bar(x1 - width/2, y1, width, label='商家A')
rects2 = ax.bar(x1 + width/2, y2, width, label='商家B')

ax.set_title('Matplotlib—柱状图')
ax.set_xticks(x1)
ax.set_xticklabels(x)
ax.legend()

plt.show()

最后生成的默认图像如下

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!7

默认配色不是很好看但也没有很难看,看起来更学术一点,但是 不支持交互式 点击查看等操作,虽然代码量更多一点,但是由于Matplotlib的火热, 网上关于matplotlib的资料比Pyecharts要多很多 ,所以写代码于调整代码的过程也 并不复杂 ,整体主观评分77分

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!8

Plotly

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!9

Plotly 也是一款非常强大的Python可视化库, Plotly内置完整的交互能力及编辑工具,支持在线和离线模式,提供稳定的API以便与现有应用集成,既可以在web浏览器中展示数据图表,也可以存入本地拷贝 。 但是由于官方 未提供中文文档 ,网上关于Plotly的教程也仅限于官方的一些demo,对于一些详细的参数设置并 没有太多资料 ,首先还是先导入相关库并设置notebook显示

import plotly
import plotly.offline as py
import plotly.graph_objs as go
plotly.offline.init_notebook_mode(connected=True)

接下来是绘图代码, 首先要对数据先进行处理 ,剩下的基础配置其实和Pyecharts比较类似

trace0 = go.Bar(
    x = x,
    y = y1,
    name = '商家A',
)
trace1 = go.Bar(
    x = x,
    y = y2,
    name = '商家B',
)
data = [trace0,trace1]
layout = go.Layout(
        title={
        'text': "Plotly-柱状图",
        'y':0.9,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!10

默认样式生成的图如上, 配色也不难看 ,并且可以看到是 支持交互式 操作的,同时是默认添加toolbox小组件,可以更方便的查看, 支持30多种图形 ,总体来说还是比较优秀的一个可视化工具,但是如果真要熟练使用的话可能需要一点时间用于查找相关资料,因为网上 关于Plotly的资料不多 ,大多是基本使用的简单教程,如果想查找一些细节的操作比如我为了查找让标题居中的方法,百度之后用Google在国外某论坛找到类似问题并找到设置,主观评分: 76 

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!11

Bokeh

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!12

Bokeh 是一个专门针对Web浏览器的呈现功能的 交互式 可视化Python库。这是Bokeh与其它可视化库最核心的区别,它可以做出像 D3.js 简洁 漂亮的交互可视化效果,但是使用难度低于D3.js,首先还是导入相关库

from bokeh.transform import dodge
import pandas as pd
from bokeh.core.properties import value
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from bokeh.io import output_notebook
output_notebook() # 导入notebook绘图模块
from bokeh.plotting import figure,show
from bokeh.models import ColumnDataSource# 导入图表绘制、图标展示模块 # 导入ColumnDataSource模块 # 导入dodge、value模块

相关依赖比上面三个要多出很多,并且Bokeh有自己的数据结构 ColumnDataSource ,所以要先对数据进行转换,接着就是创建画布、添加数据及设置

df = pd.DataFrame({'商家A':y1,'商家B':y2},
                 index = x_)
_x = ['商家A','商家B']    # 系列名
data = {'index':x_}
for i in _x:
    data[i] = df[i].tolist()# 生成数据,数据格式为dict
source = ColumnDataSource(data=data)# 将数据转化为ColumnDataSource对象

p = figure(x_range=x_, y_range=(0, 150), plot_height=350, title="boken-柱状图",tools="crosshair,pan,wheel_zoom,box_zoom,reset,box_select,lasso_select")

p.vbar(x=dodge('index', -0.1, range=p.x_range), top='商家A', width=0.2, source=source,color="#718dbf", legend=value("商家A"))
p.vbar(x=dodge('index',  0.1, range=p.x_range), top='商家B', width=0.2, source=source,color="#e84d60", legend=value("商家B"))# dodge(field_name, value, range=None) → 转换成一个可分组的对象,value为元素的位置(配合width设置)
p.xgrid.grid_line_color = None
p.legend.location = "top_left"
p.legend.orientation = "horizontal" # 其他参数设置
show(p)

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!13

可以看到,Bokeh做出来的图也是 支持交互 的,不并且样式之类的看上去还是比较舒服的,不过上面这张图是经过调整颜色的,因为默认不对两个系列进行区分颜色

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!14

Bokeh一个很明显的特点就是 代码量较上面三个工具要多了很多 ,大多是在 数据的处理 上,并且和Plotly一样,有关bokeh相关的 中文资料也不多 ,大多是入门型的基本使用于介绍,虽然从官方给出的图来看能作出很多比pyecharts更精美的图,但是查找相关参数的设置上将会耗费一定时间,主观评分 71 分。

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!15

Seaborn

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!16

从 seaborn 官网给出的标题就知道,seaborn是为了 统计图表 设计的,它 是一种 基于matplotlib 的图形可视化库,也就 是在matplotlib的基础上进行了更高级的API封装,从而使得 作图更加容易 ,在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图,还是我们的数据,使用Seaborn制作首先需要导入相关库,由于是基于Matplotlib,所以还是 需要设置中文

import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] 

接下来只要 一行代码 就能生成我们要的图,默认配色也没有显得很难看

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!17

相比上面四种工具,从 代码量 上来看是非常简洁的,不过还是要先将 数据转换 为DataFrame格式,这里没在代码中体现,但依旧是 最简短的代码 ,同时并不支持交互。并且Seaborn和Plotly、bokeh有一个共同的地方就是虽然强大,但是 网上有关这三个库的教程、讨论都远少于Pyecharts与Matplotlib ,如果是新手的话可能很难快速通过搜索解决你遇到的问题,而需要自己研究别人的代码,主观评分 72 

可视化工具不知道怎么选?深度评测5大Python数据可视化工具!18

小结

以上就是对常见的5个Python数据可视化的评测,可能通过绘制条形图的方式去给每个工具打分不是非常合适,但我想你应该能够大致熟悉到每个库在绘图时的特点,同时也能在选择这些工具之前有一个简单的了解。最后正如我们文中介绍的一样, 不同工具的应用场景、目标用户都不完全相同 ,所以我们在选择工具时需要 先思考自己的使用场景 ,并且需要评估绘制目标图形的难度,就像有些工具虽然强大但是资料太少,不要为了追求高级的样式而浪费太多时间!如果你仍在犹豫学习哪一个工具的话,我的意见是 :熟练掌握一个工具之后,了解其他工具即可 ! 最后留一个 彩蛋,大家可以猜一猜文中的雷达图是使用文中提到的哪一款工具制作。

你用的是哪一个呢?视频教程加群:850591259

 

勿删,copyright占位
分享文章到微博
分享文章到朋友圈

上一篇:用Idea 2019.3+和Gradle5.2.1+ 构建SpringBoot多项目(六)——logback、log4j2

下一篇:逻辑数字电路的卡诺图

您可能感兴趣

  • 计算机转方向的建议(干货)

    转计算机方向其实并不难,但你得知道怎么转。 甚至你不需要上很多课,不需要报任何培训班,不需要花很多钱。 1、只看最短路,你只需要4门课: 编程语言 (Java 或者 C/C++) 算法与数据结构 数据库 一门技能课 (网页开发,移动端开发,云计算,AI等) 别看计算机课很多,什么操作系统,计算机网络等等,那些课固然很好,但对我们转专业的学生来说: 时间有效,精力要用在刀刃上,优先去补那些最核...

  • 美团数据库运维自动化系统构建之路

    本文整理自美团点评技术沙龙第10期:数据库技术架构与实践。 美团点评技术沙龙由美团点评技术团队主办,每月一期。每期沙龙邀请美团点评及其它互联网公司的技术专家分享来自一线的实践经验,覆盖各主要技术领域。 目前沙龙会分别在北京、上海和厦门等地举行,要参加下一次最新沙龙活动?赶快关注微信公众号“美团点评技术团队”。 本次沙龙主要围绕数据库相关的主题,内容包括美团数据库自动化运维系统构建、点评侧My...

  • 美团点评移动网络优化实践

    本文根据第16期美团点评技术沙龙“移动开发实践(上海站)”演讲内容整理而成。 第18期沙龙:高可用系统背后的基础架构(3月25日)火热来袭!快快点击报名吧。 网络优化对于App产品的用户体验至关重要,与公司的运营和营收息息相关。这里列举两个公开的数据: “页面加载超过3秒,57%的用户会离开。” “Amazon页面加载延长1秒,一年就会减少16亿美金营收。” 在做网络优化前,我们首先要为网络...

  • C++基础知识(四)-友元和运算符重载

    整理码字不易,养成好习惯,点赞关注,你的支持就是我写下去的动力,谢谢老板。 本文为C++第三篇后续接着这篇文章写,大家可以持续关注,前三篇在主页 4.5 友元 类的主要特点之一是数据隐藏,即类的私有成员无法在类的外部(作用域之外)访问。但是,有时候需要在类的外部访问类的私有成员,怎么办? 解决方法是使用友元函数,友元函数是一种特权函数,c++允许这个特权函数访问私有成员。这一点从现实生活中也...

  • 如何在科研论文中画出漂亮的插图?

    点击上方“AI遇见机器学习”,选择“星标”公众号 重磅干货,第一时间送达 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:极市平台编译总结于知乎 方法一 作者|冯昱尧 https://www.zhihu.com/question/21664179/answer/18928725 强烈推荐 Python 的绘图模块 matplotlib: python plotting 。画出来的图真...

  • 论文|从DSSM语义匹配到Google的双塔深度模型召回和广告场景中的双塔模型思考...

    点击标题下「搜索与推荐Wiki」可快速关注 ▼ 相关推荐 ▼ 1、基于DNN的推荐算法介绍 2、传统机器学习和前沿深度学习推荐模型演化关系 3、论文|AGREE-基于注意力机制的群组推荐(附代码) 4、论文|被“玩烂”了的协同过滤加上神经网络怎么搞? 本文包含(文章较长,建议先收藏再阅读,点击文末的阅读原文,查看更多推荐相关文章): DSSM DSSM的变种 MV-DNN Google Tw...

  • 搞定pandas,我用二八神功!(送书)

    大家好,我是小z 最近天气实在是太**热了,天气一热,群虫乱舞,为了应景,我决定送一本爬虫相关书籍,文末留言就能参与。 回到正题,今天,我们来聊聊不一样的二八定律/神功。 我微信抽样询问了35个好友,二八定律有97%的听说率,只有一位没听过且不愿意透露姓名的朋友,不过他是搞艺术的...

  • 适合新手练习的Python项目有哪些?

    适合新手练习的Python项目有哪些?简单易上手的Python项目汇总:Web 项目设计:内容聚合器、正则表达式查询工具、网址缩短、便利贴、功能、测验、GUI 项目设计:MP3 播放器、闹铃提醒工具、文件管理器、记账功能、命令行项目设计:通讯录、网站连接检查、批量文件重命名工具、目录树生成器。   一、Web 项目设计:内容聚合器(Content Aggregator)   该项目设计的主要...

华为云40多款云服务产品0元试用活动

免费套餐,马上领取!
CSDN

CSDN

中国开发者社区CSDN (Chinese Software Developer Network) 创立于1999年,致力为中国开发者提供知识传播、在线学习、职业发展等全生命周期服务。