添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

我有一个CSV文件,在实际的CSV开始之前有一些头信息。

我想 跳过1-19的所有行 然后从行开始读取我的CSV 20th (highlighted in yellow) then 跳过第21和第22行以及最后一行第30行 然后开始处理文件的其余部分。

请看所附快照。

我试图运行的代码是。

import pandas as pd
df=pd.read_csv("C:\\Users\\xyz\\Downloads\\Spark\\avltest.csv",error_bad_lines=False)
temp = df.loc[20:]    
print(temp)

How can I achieve my use-case? 我想parse/read-only the rows I have mentioned above through Python script.

编辑:我在使用所提供的解决方案时,得到了以下错误。

1 个评论
包括参数skiprows = list(range(19))+[20,21,29]
python
python-3.x
pandas
Shrads
Shrads
发布于 2019-09-13
1 个回答
Chris
Chris
发布于 2019-09-13
已采纳
0 人赞同

替换代码0】的skiprows可以接受可调用。

import pandas as pd
from io import StringIO
# Sample data: need to skip from 0 to 4 and then 6
text = """garbage 1
garbage 2
garbage 3
garbage 4
indexTITLE a b c
garbage LONG LONG LONG
0 1 2 3
df = pd.read_csv(StringIO(text), sep='\s+', skiprows = lambda x: x in [0,1,2,3,4,6])
print(df)

Output: