在python中读取csv文件时跳过几行

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

知识渊博的花卷 · Unable to load data ...· 昨天 ·

聪明的麦片 · 人民日报海外版-人民网· 8 月前 ·

傲视众生的抽屉 · 我们为什么培养不出优秀足球人才-新华网· 8 月前 ·

坚韧的马克杯 · 侯蓉代表：成都熊猫基地大熊猫数量近30年增长 ...· 11 月前 ·

英俊的哑铃 · 【海棠推文】死对头变情人文学！《没想到我会变 ...· 1 年前 ·

着急的黄瓜 · 【纪录片】露西亚的普京大帝-网易公开课· 1 年前 ·

我有一个CSV文件，在实际的CSV开始之前有一些头信息。

我想 跳过1-19的所有行 然后从行开始读取我的CSV 20th (highlighted in yellow) then 跳过第21和第22行以及最后一行第30行 然后开始处理文件的其余部分。

请看所附快照。

我试图运行的代码是。

import pandas as pd
df=pd.read_csv("C:\\Users\\xyz\\Downloads\\Spark\\avltest.csv",error_bad_lines=False)
temp = df.loc[20:]    
print(temp)
How can I achieve my use-case? 我想parse/read-only the rows I have mentioned above through Python script. 
编辑：我在使用所提供的解决方案时，得到了以下错误。
    1 个评论
onyambu：
包括参数skiprows = list(range(19))+[20,21,29]。
python
python-3.x
pandas
Shrads发布于 2019-09-13
1 个回答
Chris发布于 2019-09-13
已采纳
0 人赞同

替换代码0】的skiprows可以接受可调用。
import pandas as pd
from io import StringIO
# Sample data: need to skip from 0 to 4 and then 6
text = """garbage 1
garbage 2
garbage 3
garbage 4
indexTITLE a b c
garbage LONG LONG LONG
0 1 2 3
df = pd.read_csv(StringIO(text), sep='\s+', skiprows = lambda x: x in [0,1,2,3,4,6])
print(df)
Output:

推荐文章

知识渊博的花卷 · Unable to load data from csv file into DB2 on Cloud after recent migration | Cloud Global

昨天

聪明的麦片 · 人民日报海外版-人民网

8 月前

傲视众生的抽屉 · 我们为什么培养不出优秀足球人才-新华网

8 月前

坚韧的马克杯 · 侯蓉代表：成都熊猫基地大熊猫数量近30年增长了12倍-中新网

11 月前

英俊的哑铃 · 【海棠推文】死对头变情人文学！《没想到我会变成这样》pawer（txt全文）_哔哩哔哩_bilibili

1 年前

着急的黄瓜 · 【纪录片】露西亚的普京大帝-网易公开课

1 年前