粉丝群里面的一个小伙伴遇到问题跑来私信我,想用Pandas读取Excel,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴)如下所示:
报错信息内容如下所示
:
ValueError
:
Excel file format cannot be determined
,
you must specify an engine manually
报错原因
:
这个错误通常是由于 Pandas 不能自动检测 excel 文件的类型所致。解决此问题的方法是手动指定使用的 Excel 引擎,例如 openpyxl 或 xlrd。
小伙伴按下面的代码设置指定引擎即可解决!!!
解决方法1:在使用 pd.read_excel() 函数时,可以通过 engine 参数来指定使用的引擎。例如,如果你想要使用 openpyxl 引擎,可以按如下方式调用函数:
import pandas as pd
df = pd.read_excel('your_file.xlsx', engine='openpyxl')
如果你已经安装了 openpyxl,但仍然无法读取 excel 文件,可能需要升级 openpyxl 版本。可以使用以下命令升级 openpyxl:
pip install --upgrade openpyxl
解决方法2:使用xlrd模块
1、安装模块:
pip install xlrd
2、通过 engine 参数来指定使用的引擎设置为xlrd:
import pandas as pd
df = pd.read_excel('your_file.xlsx', engine='xlrd')
如果你仍然遇到问题,请确保你正在使用正确的文件路径,并且文件确实是一个 Excel 文件。
以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!
由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html
-
优点:作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!
-
专栏福利:简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等
-
注意:如果希望得到及时回复,和大佬们交流学习,订阅专栏后私信博主进千人VIP答疑群
免费资料获取,更多粉丝福利,关注下方公众号获取
这个问题我搞了很久,最后终于搞明白了,先贴图,网上各种什么utf-8呀,格式化或者另存都不行,我都试过了。 问题在于原表格格式有些问题,最直接的办法就是把表格的内容复制到一个自己新建的表格中,然后改成先表格的路径。再安装这个模块,就可以了,conda install openpyxl。
如果有效,请点赞或者评论。...
【BUG】已解决:ValueError: Excel file format cannot be determined, you must specify an engine manually.
Python -- Pandas读取Excel失败:Excel file format cannot be determined, you must specify an engine manually.
指定参数 engine 为'openpyxl' 或者'xlrd' 同样失败
后发现 将read_excel 改为read_html 即可解决
大家在利用pandas读取excel文件的时候,一定会碰到类似的问题;这里主要写一下我踩过的坑:
#官网pandas对engine的解释
enginestr, default None
If io is not a buffer or path, this must be set to identify io. Supported engines: “xlrd”, “openpyxl”, “odf”, “pyxlsb”. Engine compatibility :
“xlrd” supports old-