Python 提取 Excel 特定列数据的方法与实例

在数据分析和处理中,Excel 文件是一种常见的数据存储格式。Python 提供了多种库来处理 Excel 文件,其中最为常用的是 `openpyxl` 和 `xlsxwriter`。在这篇文章中,我们将介绍如何使用 Python 提取 Excel 文件中的特定列数据。

### 使用 `openpyxl` 库

`openpyxl` 是一个用于读取和写入 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 库。以下是一个使用 `openpyxl` 提取 Excel 文件中特定列数据的示例:

python

import openpyxl

# 打开 Excel 文件

workbook = openpyxl.load_workbook('your_excel_file.xlsx')

# 获取工作表

worksheet = workbook.active

# 获取要提取的列索引(从 1 开始计数)

columns_to_extract = [1, 2, 3] # 假设我们要提取的是 A, B, C 列

# 创建一个列表来存储提取的数据

extracted_data = []

# 遍历每一行

for row in worksheet.rows:

# 初始化一个列表来存储当前行的数据

row_data = []

# 遍历要提取的列

for col_idx in columns_to_extract:

# 获取当前单元格的数据

cell = row[col_idx]

# 将数据添加到当前行的列表中

row_data.append(cell.value)

# 将当前行的数据添加到最终的列表中

extracted_data.append(row_data)

# 关闭工作簿

workbook.close()

# 打印提取的数据

print(extracted_data)

在上面的代码中,我们首先加载了 Excel 文件,然后获取了工作表,并定义了要提取的列索引。接着,我们遍历了工作表中的每一行,并从指定的列中提取数据,最后将这些数据存储在一个列表中。

### 使用 `xlsxwriter` 库

`xlsx

更多文章请关注《万象专栏》