首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏阿黎逸阳的代码

    数据概览神器—Pandas-profiling

    2 方法二:whl文件安装 首先到如下网站下载whl文件:https://pypi.org/project/pandas-profiling/#files,可能会出现没有反应的情况,多进几次就好了。 3 方法三 如果还有小伙伴安装不好,可以试下如下方法: pip install https://github.com/pandas-profiling/pandas-profiling/archive

    3.7K20发布于 2020-09-14
  • 来自专栏DeepHub IMBA

    使用pandas-profiling对时间序列进行EDA

    EDA 是数据科学工作流程的关键步骤,Pandas-profiling可以通过一行代码快速完成EDA报告,并且能够提供有意义的见解。 在这篇文章中,我将利用 pandas-profiling 的时间序列特性,介绍EDA中的一些关键步骤。 我们这里使用的数据集是美国的空气质量数据集,可以从 EPA 网站下载。 深入了解时间序列指标 如果你已经在使用 pandas-profiling,可能知道如何生成报告。 在上面的pandas-profiling图中你会注意到的第一个区别是线图将替换被识别为时间相关的列的直方图。使用折线图,我们可以更好地了解所选列的轨迹和性质。 本文代码 https://github.com/ydataai/pandas-profiling/tree/master/examples/usaairquality 作者:Fabiana Clemente

    1.5K20编辑于 2022-11-11
  • 来自专栏相约机器人

    使用Pandas-Profiling加速您的探索性数据分析

    最近搜索了替代品并且遇到了Pandas-Profiling。 在下面的段落中,将介绍pandas-profiling在Titanic数据集中的应用。 更快的EDA 选择将pandas-profiling应用于 Titanic 数据集,因为数据类型多种多样,缺少值。当数据尚未清理并仍需要进一步的个性化调整时,pandas-profiling特别有趣。 这是pandas-profiling的用武之地。 想知道pandas-profiling究竟是如何计算它的输出的。源代码可以在GitHub上找到。

    4.2K70发布于 2019-06-21
  • 来自专栏小小挖掘机

    pandas_profiling:一行代码生成你的数据分析报告

    pip: pip install pandas-profiling pip install https://github.com/pandas-profiling/pandas-profiling/archive /master.zip conda: conda install -c conda-forge pandas-profiling source: 先下载源码文件,然后解压到setup.py所在的文件目录下 pandas-profiling EDA报告包括数据整体概览、变量探索、相关性计算、缺失值情况和抽样展示等5个方面。 数据整体概览: ? 变量探索: ? 相关性计算: ? pandas-profiling为我们提供了四种缺失值展现形式。 数据样本展示: ? 就是pandas里面的df.head()和df.tail()两个函数。 参考资料: https://github.com/pandas-profiling/pandas-profiling

    94410发布于 2019-10-11
  • 来自专栏Python数据科学

    安利3个Python数据分析EDA神器!

    Jupyter扩展widget jupyter nbextension enable --py widgetsnbextension # 或者通过conda安装 conda env create -n pandas-profiling conda activate pandas-profiling conda install -c conda-forge pandas-profiling # 或者直接从源地址安装 pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip 安装成功后即可导入数据直接生成报告了。 参考: https://github.com/adamerose/pandasgui https://github.com/pandas-profiling/pandas-profiling https

    1.6K31发布于 2020-11-11
  • 来自专栏Datawhale专栏

    pandas_profiling:一行代码生成你的数据分析报告

    pip: pip install pandas-profiling pip install https://github.com/pandas-profiling/pandas-profiling/archive /master.zip conda: conda install -c conda-forge pandas-profiling source: 先下载源码文件,然后解压到setup.py所在的文件目录下 pandas-profiling EDA报告包括数据整体概览、变量探索、相关性计算、缺失值情况和抽样展示等5个方面。 数据整体概览: ? 变量探索: ? 相关性计算: ? pandas-profiling为我们提供了四种缺失值展现形式。 数据样本展示: ? 就是pandas里面的df.head()和df.tail()两个函数。

    2.4K30发布于 2019-08-27
  • 来自专栏炼丹笔记

    三行代码产出完美数据分析报告!

    D-tale Pandas-Profiling Sweetviz AutoViz 这几个工具包可以以短短三五行代码帮新手节省将近一天时间去写代码分析。非常建议大家尝试一下。 02 Pandas-Profiling Pandas-Profiling可以对Pandas DataFrame生成report报告。 Pandas-Profiling对于每一列特征,特征的统计信息(如果与列类型相关)会显示在交互式 HTML的report中: Type:检测数据列类型; Essentials:类型、unique值、缺失值 /data/titanic.csv') d = dtale.show(df) d.open_browser() 02 Pandas-Profiling from pandas_profiling import 参考文献 https://github.com/man-group/dtale https://github.com/pandas-profiling/pandas-profiling/ https:

    1.1K30发布于 2021-11-10
  • 来自专栏数据派THU

    独家 | 用pandas-profiling做出更好的探索性数据分析(附代码)

    探索性数据分析已失势,Pandas-profiling万岁!用更省力的办法完美呈现你的数据。 让我们一起看看如何用pandas-profiling来更省力地动态展现数据。 只有通过观察,我们才能学习。 Pandas-profiling,我们的救世主! Pandas-profiling使用matplotlib作为图形库和jinja2作为其接口的模板引擎。 数据科学家用pandas-profiling可以更省力地产出快速的探索性数据分析报告。这份报告清晰且容易使用, 还可以被任何有点统计基础的人看懂。 我希望您喜欢这个关于pandas-profiling的小介绍!这是我在medium上写的第一篇文章,欢迎评论和改进建议!

    94120发布于 2020-07-02
  • 来自专栏Python数据科学

    安利 3 个 pandas 数据探索分析神器!

    Jupyter扩展widget jupyter nbextension enable --py widgetsnbextension # 或者通过conda安装 conda env create -n pandas-profiling conda activate pandas-profiling conda install -c conda-forge pandas-profiling # 或者直接从源地址安装 pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip 安装成功后即可导入数据直接生成报告了。 参考: https://github.com/adamerose/pandasgui https://github.com/pandas-profiling/pandas-profiling https

    71820发布于 2021-10-19
  • 来自专栏算法进阶

    【工具】安利 3 个 pandas 数据探索分析神器!

    Jupyter扩展widget jupyter nbextension enable --py widgetsnbextension # 或者通过conda安装 conda env create -n pandas-profiling conda activate pandas-profiling conda install -c conda-forge pandas-profiling # 或者直接从源地址安装 pip install https://github.com/pandas-profiling/pandas-profiling/archive/master.zip 安装成功后即可导入数据直接生成报告了。 参考: https://github.com/adamerose/pandasgui https://github.com/pandas-profiling/pandas-profiling https

    70730编辑于 2022-06-01
  • 来自专栏流川疯编写程序的艺术

    python pandas profile 一行代码EDA 探索性数据分析

    matrices Missing values matrix, count, heatmap and dendrogram of missing values 官网:https://github.com/pandas-profiling /pandas-profiling ---- 代码样例 一个完整的样例: https://nbviewer.jupyter.org/github/lksfr/TowardsDataScience/blob tijian_pdf) profile.to_file("output_tijian_chinese.html") ---- 效果 样例链接:https://pandas-profiling.github.io/pandas-profiling

    2.9K20发布于 2019-09-23
  • 来自专栏DeepHub IMBA

    10个自动EDA库功能介绍:几行代码进行的数据分析靠不靠谱

    1) DTale 2) Pandas-profiling 3) sweetviz 4) autoviz 5) dataprep 6) KLib 7) dabl 8) speedML 9) datatile 2、Pandas-Profiling Pandas-Profiling可以生成Pandas DataFrame的概要报告。 libaries before importing import pandas as pd from pandas_profiling import ProfileReport #EDA using pandas-profiling

    1K11编辑于 2022-11-11
  • 来自专栏ShowMeAI研究中心

    一键自动化数据分析!快来看看 2022 年最受欢迎的 Python 宝藏工具库! ⛵

    pandas-profiling很多做过 Python 数据分析的同学都很熟悉 Pandas 的 describe 函数,pandas-profiling 通过其低代码接口扩展了对应的功能,将信息以报告的形式呈现 pandas-profiling 库自动从 pandas DataFrame 生成配置文件报告,整个过程甚至只需要两三行代码。pandas-profiling 会对单字段和关联字段进行分析。 SweetvizSweetviz 的功能与 pandas-profiling 很相似。 它是一个开源 Python 库,可生成精美的高信息量结果报告,只需两行代码即可启动探索性数据分析过程。 它在功能方面与 Sweetviz 和 pandas-profiling 也比较类似。 pandas-profilling 详细教程: https://github.com/ydataai/pandas-profiling?

    2.5K41编辑于 2022-08-09
  • 来自专栏自然语言处理

    自动化数据分析框架比较-EDA Is All You Need

    参考链接 Pandas Profiling GitHub - https://github.com/pandas-profiling/pandas-profiling Dan Roth, AutoViz

    86330发布于 2021-02-04
  • 来自专栏完美Excel

    使用pandas Profiling进行探索性数据分析

    标签:pandas,pandas-profiling 本文介绍一个数据探索库——pandas profiling,有点像pandas中的.describe()方法,但更好。 使用pip安装这个库: pip install pandas-profiling 配置代码环境 本文将使用Jupyter笔记本,这也是pandas_profiling官方文档推荐的。 如果要遵循最佳做法并使用虚拟环境,执行以下操作: 1.创建虚拟环境 2.pip install pandas-profiling ipykernelipywidgets 3.将ipykernel链接到虚拟环境

    1.5K40编辑于 2022-04-13
  • 来自专栏自然语言处理

    【干货】pandas相关工具包

    下面是本篇文章的主要介绍的内容,就是有关在日常使用提高效率的pandas相关的工具包 4 pandas-profiling 从pandas DataFrame对象中创建HTML形式的分析报告 官方链接 :https://github.com/pandas-profiling/pandas-profiling ? 4.1 安装命令 pip install pandas-profiling[notebook] 4.2 简单实例 生成一个DataFrame import numpy as np import pandas 具体报告在:https://pandas-profiling.github.io/pandas-profiling/examples/master/titanic/titanic_report.html

    2K20发布于 2020-12-11
  • 来自专栏进击的Coder

    10 个 Python 自动探索性数据分析神库!

    DTale Pandas-profiling sweetviz autoviz dataprep KLib dabl speedML datatile edaviz 1、D-Tale D-Tale 2、Pandas-Profiling Pandas-Profiling 可以生成 Pandas DataFrame 的概要报告。 libaries before importing import pandas as pd from pandas_profiling import ProfileReport #EDA using pandas-profiling

    2.6K32编辑于 2022-09-13
  • 来自专栏ShowMeAI研究中心

    2022了你还不会『低代码』?数据科学也能玩转Low-Code啦! ⛵

    热图和缺失值的树状图文本分析:了解文本数据的类别(大写、空格)、脚本(拉丁文、西里尔文)和块(ASCII)文件和图像分析:提取文件大小、创建日期和尺寸,并扫描截断的图像或包含 EXIF 信息的图像图片图片大家可以在 pandas-profiling https://github.com/AutoViML/AutoViz/tree/master/Examples Lux 官方 GitHub: https://github.com/lux-org/lux pandas-profiling 项目 GitHub: https://github.com/ydataai/pandas-profiling Pycaret 官方文档: https://pycaret.gitbook.io/ Pycaret

    85841编辑于 2022-08-09
  • 来自专栏早起Python

    Python一行命令生成数据分析报告

    /result.html") 参考资料 [1] GitHub: https://github.com/pandas-profiling/pandas-profiling

    1.4K20发布于 2020-04-22
  • 来自专栏AI研习社

    数据分析从业者必看!10 个加速 python 数据分析的简易小技巧

    Pandas Profiling 包计算统计信息 安装 pip install pandas-profiling or conda install -c anaconda pandas-profiling 2.0.0 version df = pd.read_csv('titanic/train.csv') pandas_profiling.ProfileReport(df) 注:在这篇文章发表一周后,Pandas-Profiling 以下是最新的语法用法: 使用 要在 Jupyter notebook 中显示报告,请运行: #Pandas-Profiling 2.0.0 df.profile_report() 这一行代码就是在 profile.to_file(outputfile="Titanic data profiling.html") 有关更多详细信息和示例,请参阅文档(https://pandas-profiling.github.io/pandas-profiling

    2.6K30发布于 2019-07-30
领券