Pandas读取xlsx数据超详细

2022-03-09

Pandas读取xlsx数据（超详细）

本仓库提供了一个详细的教程，介绍了如何使用Pandas库读取Excel文件（.xlsx格式）中的数据。教程内容涵盖了从安装Pandas库到读取Excel文件的各个步骤，并提供了一些常用的操作技巧。

导入所需库和文件
导入Pandas库并读取Excel文件：

import pandas as pd
data = pd.read_excel('鸢尾花训练数据.xlsx')

查看数据
使用Pandas的基本函数和属性查看数据，例如：

print(data.head())  # 查看前几行数据，默认为前5行
print(data.tail())  # 查看后几行数据，默认为后5行
print(data.info())  # 显示数据的基本信息，如列名、数据类型、非空值数量等

提取数据
进行数据处理时，注意数据重排，训练模型时变量要与标签分离。例如：

x = data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']]
y = data[['类型_num']]

通过本教程，你将掌握如何使用Pandas库高效地读取和处理Excel文件中的数据。