添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

数据说明:MovieLens数据集,它包含来自于943个用户以及精选的1682部电影的100K个电影打分。每个用户至少为20部电影打分,数据类型user id | item id | rating | timestamp.

地址:https://grouplens.org/datasets/movielens/

1、引入pandas,numpy包

基于Python的影片数据分析 python统计电影信息_数据集

2、读取数据:首先,文件如果不在默认路径下,需要更改路径,使用下面两行命令,另外要注意正反斜杠的应用。

os.getcwd()

os.chdir("新的路径")

基于Python的影片数据分析 python统计电影信息_数据集_02

3、由于数据包含了打分数据,用户数据,但在两个文件里,因此需要合并。首先,使用header=['l列名1','列名2'.....]格式给两个文件添加列名

基于Python的影片数据分析 python统计电影信息_数据_03

然后数据合并

基于Python的影片数据分析 python统计电影信息_数据_04

结果:

基于Python的影片数据分析 python统计电影信息_数据集_05

将文件转换成字典类型,并按照列名读取两列

基于Python的影片数据分析 python统计电影信息_数据统计_06

基于Python的影片数据分析 python统计电影信息_数据集_07

基于Python的影片数据分析 python统计电影信息_数据集_08

数据统计分析,data.describe()

基于Python的影片数据分析 python统计电影信息_数据_09


基于Python的影片数据分析 python统计电影信息_数据集_10