pandas用正则表达式筛选一列中只包含数字的行
时间: 2024-06-13 20:09:57
浏览: 110
可以使用pandas的str.contains()方法和正则表达式来筛选一列中只包含数字的行。具体步骤如下:
1.导入pandas库并读取数据集:
```python
import pandas as pd
df = pd.read_csv('data.csv')
2.使用str.contains()方法和正则表达式来筛选只包含数字的行:
```python
df_numeric = df[df['column_name'].str.contains('^\d+$')]
其中,'^\d+$'是一个正则表达式,表示只包含数字的字符串。
3.输出筛选结果:
```python
print(df_numeric)
相关问题
padnas列中内容正则表达式筛选
假设你有一个 Pandas DataFrame,里面有一列数据需要用正则表达式筛选。以下是一个例子:
```python
import pandas as pd
# 创建一个 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'email': ['[email protected]', '[email protected]', '[email protected]', '[email protected]', '[email protected]']}
df = pd.DataFrame(data)
# 使用正则表达式筛选 email 列中以 gmail.com 结尾的邮件
filtered_df = df[df['email'].str.contains(r'gmail\.com$')]
# 输出筛选后的结果
print(filtered_df)
```