PHP前端开发

Python中Pandas读取修改excel操作攻略(代码示例)

百变鹏仔 1个月前 (01-23) #Python
文章标签 示例

本篇文章给大家带来的内容是关于python中pandas读取修改excel操作攻略(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

环境:python 3.6.8

以某米赛尔号举个例子吧:


立即学习“Python免费学习笔记(深入)”;

>>> pd.read_excel('1.xlsx', sheet_name='Sheet2')     名字   等级 属性1   属性2  天赋0  四九幻曦  100  自然  None  211  圣甲狂战  100  战斗  None   02  时空界皇  100   光    次元  27

我们在这里使用了pd.read_excel()函数来读取excel,来看一下read_excel()这个方法的API,这里只截选一部分经常使用的参数:

pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None)
io:很明显, 是excel文件的路径+名字字符串

(有中文的话python2的老铁需要使用decode()来解码成unicode字符串)
例如:

>>> pd.read_excel('例子'.decode('utf-8))
sheet_name:返回指定的sheet
如果将sheet_name指定为None,则返回全表
如果需要返回多个表, 可以将sheet_name指定为一个列表, 例如['sheet1', 'sheet2']

可以根据sheet的名字字符串或索引来值指定所要选取的sheet

>>> # 如:>>> pd.read_excel('1.xlsx', sheet_name=0)>>> pd.read_excel('1.xlsx', sheet_name='Sheet1')>>> # 返回的是相同的 DataFrame
header:指定数据表的表头,默认值为0, 即将第一行作为表头usecols:读取指定的列, 也可以通过名字或索引值
>>> # 如:>>> pd.read_excel('1.xlsx', sheet_name=1, usecols=['等级', '属性1'])>>> pd.read_excel('1.xlsx', sheet_name=1, usecols=[1,2])>>> # 返回的是相同的 DataFrame

直到某一天泰格尔升了一级, 可以这样改一下, 当然用.iloc或.loc对象都可以

>>> # 读取文件>>> data = pd.read_excel("1.xlsx", sheet_name="Sheet1")>>> # 找到 等级 这一列,再在这一列中进行比较>>> data['等级'][data['名字'] == '泰格尔'] += 1>>> print(data)

LOOK!他升级了!!

>>> data     名字   等级 属性1   属性2  天赋0  艾欧里娅  100  自然     冰  291   泰格尔   81   电    战斗  162  布鲁克克  100   水  None  28

现在我们将它保存

data.to_excel('1.xlsx', sheet_name='Sheet1', index=False, header=True)
index:默认为True, 是否加行索引, 直接上图吧!
左为False, 右为Trueheader:默认为True, 是否加列标, 上图吧!
左为False, 右为True而io, sheet_name参数用法同函数pd.read_excel()

如果我们多捕捉几只或者多加几种属性怎么办呢?这里给出参考:

新增列数据:
data['列名称'] = [值1, 值2, ......]
>>> data['特性'] = ['瞬杀', 'None', '炎火']>>> data     名字   等级 属性1   属性2  天赋    特性0  艾欧里娅  100  自然     冰  29    瞬杀1   泰格尔   80   电    战斗  16  None2  布鲁克克  100   水  None  28    炎火

新增行数据,这里行的num为excel中自动给行加的id数值
data.loc[行的num] = [值1, 值2, ...], (注意与.iloc的区别)

>>> data.loc[3] = ['小火猴', 1, '火', 'None', 31, 'None']>>> data     名字   等级 属性1   属性2  天赋    特性0  艾欧里娅  100  自然     冰  29    瞬杀1   泰格尔   80   电    战斗  16  None2  布鲁克克  100   水  None  28    炎火3   小火猴    1   火  None  31  None

说完了增加一行或一列,那怎样删除一行或一列呢?可以使用.drop()函数

>>> # 删除列, 需要指定axis为1,当删除行时,axis为0>>> data = data.drop('属性1', axis=1) # 删除`属性1`列>>> data     名字   等级   属性2  天赋    特性0  艾欧里娅  100     冰  29    瞬杀1   泰格尔   80    战斗  16  None2  布鲁克克  100  None  28    炎火3   小火猴    1  None  31  None>>> # 删除第3,4行,这里下表以0开始,并且标题行不算在类, axis用法同上>>> data = data.drop([2, 3], axis=0)>>> data     名字   等级 属性2  天赋    特性0  艾欧里娅  100   冰  29    瞬杀1   泰格尔   80  战斗  16  None>>> # 保存>>> data.to_excel('2.xlsx', sheet_name='Sheet1', index=False, header=True)