Contents
  1. 1. Pandas备忘录系列文章
  2. 2. 介绍
  3. 3. 查找
    1. 3.1. contains函数
  4. 4. DataFrame增加行
    1. 4.1. append函数
    2. 4.2. 使用特定索引名称增加行

1. Pandas备忘录系列文章

  1. Pandas备忘录

2. 介绍

Note: 如果没有特别说明,pd指的是pandasnp指的是numpy

1
2
import pandas as pd
import numpy as np

3. 查找

3.1. contains函数

主要是用Series.str.contains这个函数,如果参数regex设为True,则查找字符串解析为正则表达式,设为False则用常规查找方式

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
>>> s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', 'frog'])
>>> s1
0 Mouse
1 dog
2 house and parrot
3 23
4 frog
dtype: object
>>> s1.str.contains('og', regex=False)
0 False
1 True
2 False
3 False
4 True
dtype: bool
>>> s1[s1.str.contains('og', regex=False)]
1 dog
4 frog
dtype: object

4. DataFrame增加行

4.1. append函数

可以使用append函数给DataFrame增加行

1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
>>> df
A B
0 1 2
1 3 4
>>> df2 = pd.DataFrame([[5, 6]], columns=list('AB'))
>>> df2
A B
0 5 6
>>> df.append(df2, ignore_index=True)
A B
0 1 2
1 3 4
2 5 6

4.2. 使用特定索引名称增加行

使用DataFrame的loc函数可以指定索引名称增加行,前提是得知道列的排列顺序,因此在创建DataFrame时要用columns参数指定列的排列顺序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
>>> employees = pd.DataFrame(
... data={'Name': ['John Doe', 'William Spark'],
... 'Age': [23, 24]},
... index=['Emp001', 'Emp002'],
... columns=['Name', 'Age'])
>>> employees
Name Age
Emp001 John Doe 23
Emp002 William Spark 24
>>> employees.loc['Emp003'] = ['Sunny', 45]
>>> employees
Name Age
Emp001 John Doe 23
Emp002 William Spark 24
Emp003 Sunny 45
Contents
  1. 1. Pandas备忘录系列文章
  2. 2. 介绍
  3. 3. 查找
    1. 3.1. contains函数
  4. 4. DataFrame增加行
    1. 4.1. append函数
    2. 4.2. 使用特定索引名称增加行