
学过C、C++,matlab, 现在开始入门Python,目前主要学习如何实用python进行数据分析,特制作此云文档,供学习分享,可随时在云文档里评论,如有不足之处可以指出。简单推荐一下飞书文档,飞书文档是一款由字节跳动推出的团队协作工具,提供文档编辑、表格制作、项目管理、日程安排等功能,旨在帮助团队高效协作和沟通。用户可以在其中创建文档、表格、幻灯片等,实时协作编辑,并支持多种文件格式导入导出。飞书文档也支持与其他飞书产品(如飞书、飞书表格)无缝集成,方便团队成员之间的信息共享和协作。用来记录想法笔记等非常赞👍!
可在飞书云文档阅读
可以复制链接进行阅读,建议实用电脑网页阅读,一直更新
https://jvirndswckh.feishu.cn/docx/RKTqdez8No0817xhGUHczgYvnPb?from=from_copylink
《从Excel到Python 数据分析进阶指南》王彦平 ( 蓝鲸 ) / 著
说明:鉴于 未经授权,不得以任何方式复制和传播本书内容,本文档只是个人学习所做的记录,部分例子参照此书,细致地将相关语法内容汇总在云文档里并进行了相关补充,欢迎阅读原书。
图片
生成数据表
pandas 库
pandas 是一个强大的数据分析库,提供了数据结构和数据分析工具,庄闲和app使得在Python中进行数据处理变得更加简单和高效。pandas 主要提供了两种数据结构:Series 和 DataFrame。
·Series:类似于一维数组的对象,由一组数据和与之相关的索引组成。
·DataFrame:类似于二维表格的数据结构,由多个 Series 组成,每个 Series 表示一列数据。
pandas 提供了丰富的函数和方法,用于数据的导入、清洗、转换、分析和可视化。通过 pandas,用户可以轻松地处理各种数据格式,如CSV、Excel、SQL数据库等,进行数据筛选、聚合、合并等。
NumPy 库
NumPy(Numerical Python)是Python中用于科学计算的一个重要库,提供了多维数组对象(例如数组)和许多用于操作数组的函数。NumPy的核心是ndarray(N-dimensional array)对象,它是一个具有相同类型和大小的元素的多维数组。
NumPy库提供了以下功能和特点:
·强大的N维数组对象
·其他派生对象(如掩码数组、矩阵等)

·广播功能函数
·整合C/C++/Fortran代码的工具
·线性代数、傅立叶变换和随机数生成等功能
NumPy是许多其他科学计算库的基础,如pandas、SciPy等,因此在数据处理和科学计算领域中被广泛应用。通过NumPy,用户可以高效地进行数组操作、数学运算和线性代数计算。
在Python中,要导入pandas库和numpy库,可以使用以下代码:
Python import pandas as pd import numpy as np
这样就可以方便地使用pandas库和numpy库中的函数和工具来进行数据导入和处理。导入这两个库后,可以使用它们提供的丰富功能来处理各种数据类型。
导入数据表
1.从CSV文件导入数据表:
{jz:field.toptypename/}Python import pandas as pd data = pd.read_csv('file.csv')
2.从Excel文件导入数据表:
Python import pandas as pd data = pd.read_excel('file.xlsx')
建站客服QQ:88888888
3.从SQL数据库导入数据表:
Python import pandas as pd import sqlite3 conn = sqlite3.connect('database.db') query = "SELECT * FROM table" data = pd.read_sql(query, conn)
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。