import pandas as pd
data = {'state':['Ohio','Ohio','Merry','Nevaio','Nevada'],
'year':[2000,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]
frame = pd.DataFrame(data,columns=['year','state','pop','debt'],index=['one','two','three','four','five'])
frame
数据如上图所示,现找出state中'state'列中含有字符'io'的行,将其的debt列赋值为'aa',实现代码如下:
frame.ix[frame['state'].str.contains('io'),['debt']] = 'aa'
frame
现找出state中'state'列中等于‘Ohio’行,将其的debt列赋值为'aa',frame还是开头定义的,实现代码如下:
frame.ix[frame['state']=='Ohio',['debt']] = 'aa'
frame
多个选择条件时,用(‘&’、‘|’),如现找出state中'state'列中等于‘Ohio’行或者‘Merry’的行,用'|',将其的debt列赋值为'aa',实现代码如下:
frame.ix[(frame['state']=='Ohio')|(frame['state']=='Merry'),['debt']] = 'aa'
frame
import pandas as pddata = {'state':['Ohio','Ohio','Merry','Nevaio','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9]}frame = pd.DataFrame(data,columns=['year','stat...
Python
Pandas
中
Dataframe
对象,如何根据列值筛选
满足
条件
的
行
,并且返回列的索引值,我们举栗子说明一下:
1.先创建一个
dataframe
变量df:
df = pd.
DataFrame
(np.arange(16).reshape(4,4),
#index = pd.date_range('20200301', periods=4),
问题描述:
目前有以下
dataframe
,想根据‘b’列 以‘*… *’结构保存
dataframe
行
data = pd.
DataFrame
([['aaa', '*ac*', 'aad'], ['aae', 'ddd', 'fff'], ['aae', '*dddddd*', 'fff']], columns=['a', 'b', 'c'])
a b c
0 aaa *ac* aad
1 aae ddd fff
2 aae *dddddd*
1.1 创建
DataFrame
data = {"col1":['
Python
', 'C', 'Java', 'R', 'SQL', 'PHP', '
Python
', 'Java', 'C', '
Python
'],
"col2":[6, 2, 6, 4, 2, 5, 8, 10, 3, 4],
"col3":[4, 2, 6, 2,
data = df['column_name'] # 按照指定列名选取
data = df[['column_name1', 'column_name2']] # 取多列
data = df.iloc[:, 0:5] # 按位置取某几列
取指定某
行
某列的元素
# 取指定第2
行
第3列的元素
data = df.loc[2][3]
......
好的,对于你的问题,我可以为你提供一些帮助。
首先,我们需要使用
Pandas
库来读取和
操作
CSV 文件。可以使用 `
pandas
.read_csv()` 函数读取 CSV 文件并将其转换为
DataFrame
对象。
例如,如果我们有一个名为 `data.csv` 的 CSV 文件,我们可以使用以下代码读取它:
```
python
import
pandas
as pd
df = pd.read_csv('data.csv')
接下来,我们可以使用
Pandas
的
条件
过滤器来
选择
满足
某些
条件
的
行
。这可以通过在
DataFrame
对象上使用布尔索引来实现。
例如,假设我们想要
选择
`data.csv` 文件
中
所有 `age` 列
中
大于 30 的
行
,我们可以使用以下代码:
```
python
filtered_df = df[df['age'] > 30]
这将返回一个新的
DataFrame
对象,其
中
包含所有 `age` 列大于 30 的
行
。
最后,我们可以使用
Pandas
的 `to_csv()` 函数将筛选后的
DataFrame
对象写入新的 CSV 文件
中
。
例如,假设我们想要将上面
选择
的所有
行
写入新文件 `filtered_data.csv`,我们可以使用以下代码:
```
python
filtered_df.to_csv('filtered_data.csv', index=False)
这将在当前目录下创建一个名为 `filtered_data.csv` 的新文件,其
中
包含所有
满足
条件
的
行
。
希望这些代码能够帮到你,如果你还有其他问题,可以随时问我。