Python 中批量提取 Excel 数据的详细指南

Python 中批量提取 Excel 数据的详细指南

更多Python学习内容:ipengtao.com

在数据处理和分析的过程中,Excel 是一种广泛使用的数据存储格式。使用 Python 可以高效地从多个 Excel 文件中提取数据,进行汇总和分析。本文将详细介绍如何使用 pandas、openpyxl 和 xlrd 三种库来批量提取 Excel 数据,并提供相应的示例代码。

使用 pandas 批量提取 Excel 数据pandas 是一个强大的数据分析库,它提供了直接读取和处理 Excel 文件的功能。

1. 安装 pandas首先,确保已安装 pandas 和 openpyxl:

代码语言:javascript复制pip install pandas openpyxl

2. 读取单个 Excel 文件代码语言:javascript复制import pandas as pd

# 读取 Excel 文件

df = pd.read_excel('data.xlsx')

# 显示前几行数据

print(df.head())

3. 批量读取多个 Excel 文件假设有多个 Excel 文件存放在一个文件夹中,文件名格式为 data_1.xlsx, data_2.xlsx,以此类推。

代码语言:javascript复制import os

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的 DataFrame

all_data = pd.DataFrame()

# 逐个读取并合并

for file in file_list:

df = pd.read_excel(file)

all_data = all_data.append(df, ignore_index=True)

# 显示合并后的数据

print(all_data.head())

使用 openpyxl 批量提取 Excel 数据openpyxl 是一个专门处理 Excel 文件的库,适用于处理 .xlsx 格式的文件。

1. 安装 openpyxl代码语言:javascript复制pip install openpyxl

2. 读取单个 Excel 文件代码语言:javascript复制from openpyxl import load_workbook

# 加载 Excel 文件

wb = load_workbook('data.xlsx')

# 选择活动工作表

ws = wb.active

# 读取所有数据

data = []

for row in ws.iter_rows(values_only=True):

data.append(row)

# 打印数据

for row in data:

print(row)

3. 批量读取多个 Excel 文件代码语言:javascript复制import os

from openpyxl import load_workbook

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一个空的列表

all_data = []

# 逐个读取并合并

for file in file_list:

wb = load_workbook(file)

ws = wb.active

for row in ws.iter_rows(values_only=True):

all_data.append(row)

# 打印合并后的数据

for row in all_data:

print(row)

使用 xlrd 批量提取 Excel 数据xlrd 是一个用于读取 Excel 文件的库,适用于 .xls 和 .xlsx 格式的文件。

1. 安装 xlrd代码语言:javascript复制pip install xlrd

2. 读取单个 Excel 文件代码语言:javascript复制import xlrd

# 打开 Excel 文件

workbook = xlrd.open_workbook('data.xls')

# 选择工作表

sheet = workbook.sheet_by_index(0)

# 读取所有数据

data = []

for row_idx in range(sheet.nrows):

row = sheet.row_values(row_idx)

data.append(row)

# 打印数据

for row in data:

print(row)

3. 批量读取多个 Excel 文件代码语言:javascript复制import os

import xlrd

# 存放 Excel 文件的文件夹路径

folder_path = 'path_to_folder'

# 获取所有 Excel 文件路径

file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一个空的列表

all_data = []

# 逐个读取并合并

for file in file_list:

workbook = xlrd.open_workbook(file)

sheet = workbook.sheet_by_index(0)

for row_idx in range(sheet.nrows):

row = sheet.row_values(row_idx)

all_data.append(row)

# 打印合并后的数据

for row in all_data:

print(row)

总结本文详细介绍了如何使用 pandas、openpyxl 和 xlrd 三种库批量提取 Excel 数据,并提供了相应的示例代码。通过这些方法,可以高效地处理多个 Excel 文件,提高数据处理的效率。希望这些内容能够帮助大家在实际开发中更好地处理 Excel 数据。

如果你觉得文章还不错,请大家 点赞、分享、留言 下,因为这将是我持续输出更多优质文章的最强动力!

相关推荐

不仅仅是文化:如何让员工真正“狼性”起来?助力企业快速成长
汽车刹车油更换多少钱?换一次刹车油要多少钱
mobile.365-588

汽车刹车油更换多少钱?换一次刹车油要多少钱

08-21 👁️‍🗨️ 327
成龙属相与哪个生肖最相配?生肖属相揭秘!
365bet信誉怎么样

成龙属相与哪个生肖最相配?生肖属相揭秘!

01-26 👁️‍🗨️ 8648
梦幻西游坐骑任务怎么做 坐骑任务流程攻略
365bet信誉怎么样

梦幻西游坐骑任务怎么做 坐骑任务流程攻略

02-09 👁️‍🗨️ 3097
中国腔调|摇滚MIX,它把中国传统音乐玩出了国际范儿!
365bet信誉怎么样

中国腔调|摇滚MIX,它把中国传统音乐玩出了国际范儿!

07-06 👁️‍🗨️ 2560
4t硬盘存监控视频能存多久
mobile.365-588

4t硬盘存监控视频能存多久

02-01 👁️‍🗨️ 3288
下载传奇私服后显示失败的原因及解决办法
mobile.365-588

下载传奇私服后显示失败的原因及解决办法

09-16 👁️‍🗨️ 9170
【問題】DC直播畫面 lol遊戲內會卡 @電腦應用綜合討論 哈啦板
在我附近购买收货可享受免费送货
365bet信誉怎么样

在我附近购买收货可享受免费送货

11-18 👁️‍🗨️ 6496