本文概述
我们可以使用不同的方式将新列添加到现有DataFrame中。对于演示, 首先, 我们必须编写代码以读取现有文件, 该文件由DataFrame中的某些列组成。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.head()
上面的代码读取了现有的csv文件, 并将数据值列显示为输出。
输出
Name
Hire Date
Salary
Leaves Remaining
0 John Idle
03/15/14
50000.0
10
1 Smith Gilliam
06/01/15
65000.0
8
2 Parker Chapman
05/12/14
45000.0
10
3 Jones Palin
11/01/13
70000.0
3
4 Terry Gilliam
08/12/14
48000.0
7
5 Michael Palin
05/23/13
66000.0
8
使用[]运算符将新列添加到DataFrame
如果要在表末尾添加任何新列, 则必须使用[]运算符。让我们在” aa” csv文件中添加一个名为” Age”的新列。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa["Age"] = "24"
aa.head()
此代码在aa csv文件的末尾添加了”年龄”列。因此, 添加列后的新表将如下所示:
Name Hire Date Salary Leaves Remaining Age
0 John Idle 03/15/14 50000.0 10 24
1 Smith Gilliam 06/01/15 65000.0 8 24
2 Parker Chapman 05/12/14 45000.0 10 24
3 Jones Palin 11/01/13 70000.0 3 24
4 Terry Gilliam 08/12/14 48000.0 7 24
5 Michael Palin 05/23/13 66000.0 8 24
在上面的代码中, Age值定义了通用值, 这意味着其值对于所有行都是通用的。如果我们指定的列名不存在, Pandas将抛出错误。
例如:
aa["Designation"]
在上面的代码中, Pandas将引发错误, 因为”指定”列不存在。
但是, 如果我们为该列分配一个值, Pandas将在表末尾自动生成一个新列。
使用insert()在DataFrame中添加新列
我们还可以使用方法名称插入在现有DataFrame中的任何位置添加一个新列。
对于演示, 首先, 我们必须编写代码以读取由DataFrame中的某些列组成的现有文件。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.head()s
上面的代码读取了现有的csv文件, 并在输出中显示了data values列。
输出
Name Hire Date Salary Leaves Remaining
0 John Idle 03/15/14 50000.0 10
1 Smith Gilliam 06/01/15 65000.0 8
2 Parker Chapman 05/12/14 45000.0 10
3 Jones Palin 11/01/13 70000.0 3
4 Terry Gilliam 08/12/14 48000.0 7
5 Michael Palin 05/23/13 66000.0 8
让我们使用插入方法将新列名称”部门”添加到现有的” aa” csv文件中。
import pandas as pd
aa = pd.read_csv("aa.csv")
aa.insert(2, column = "Department", value = "B.Sc")
aa.head()
输出
Name Hire Date Department Salary Leaves Remaining
0 John Idle 03/15/14 B.Sc 50000.0 10
1 Smith Gilliam 06/01/15 B.Sc 65000.0 8
2 Parker Chapman 05/12/14 B.Sc 45000.0 10
3 Jones Palin 11/01/13 B.Sc 70000.0 3
4 Terry Gilliam 08/12/14 B.Sc 48000.0 7
5 Michael Palin 05/23/13 B.Sc 66000.0 8
评论前必须登录!
注册