本文概述
Excel是由Microsoft开发的电子表格应用程序。它是一种易于访问的工具, 用于组织, 分析和存储表中的数据。它在全世界许多不同的应用中得到广泛使用。从分析师到首席执行官, 各种专业人员都使用Excel进行快速统计和严重的数据处理。
Excel文件
Excel电子表格文档称为工作簿, 该工作簿保存在扩展名为.xlsx的文件中。电子表格的第一行主要保留给标题, 而第一列则标识采样单位。每个工作簿可以包含多个工作表, 这些工作表也称为工作表。特定列和行上的框称为单元格, 每个单元格可以包含数字或文本值。带有数据的单元格网格构成一张纸。
活动工作表定义为在关闭Excel之前用户当前正在查看或最近浏览过的工作表。
从Excel文件读取
首先, 你需要编写命令来安装xlrd模块。
pip install xlrd
创建工作簿
工作簿包含excel文件中的所有数据。你可以从头开始创建新工作簿, 也可以轻松地从已经存在的excel文件中创建工作簿。
输入文件
代码
# Import the xlrd module
import xlrd
# Define the location of the file
loc = ("path of file")
# To open the Workbook
wb = xlrd.open_workbook(loc)
sheet = wb.sheet_by_index(0)
# For row 0 and column 0
sheet.cell_value(0, 0)
输出
'NAME'
说明:在上面的示例中, 首先, 我们导入了xlrd模块并定义了文件的位置。然后, 我们从已经存在的excel文件中打开了工作簿。
从熊猫读
Pandas被定义为在NumPy库顶部构建的开源库。它为用户提供快速分析, 数据清理和数据准备, 并支持URL的xls和xlsx扩展名。
这是一个python软件包, 提供了一种有益的数据结构, 称为数据框架
代码
import pandas as pd
# Read the file
data = pd.read_csv(".csv", low_memory=False)
# Output the number of rows
print("Total rows: {0}".format(len(data)))
# See which headers are available
print(list(data))
从openpyxl读取
首先, 你需要从命令行使用pip安装openpyxl。
pip install openpyxl
之后, 你需要导入模块。
你还可以使用openpyxl从现有电子表格中读取数据。它还允许用户执行计算并添加不属于原始数据集的内容。
代码
import openpyxl
my_wb = openpyxl.Workbook()
my_sheet = my_wb.active
my_sheet_title = my_sheet.title
print("My sheet title: " + my_sheet_title)
输出
My sheet title: Sheet
评论前必须登录!
注册