你将学到什么？

1、鸢尾花（iris）数据集
数据集导入、查看特征
    DESCR
    feature_names
    target
    target_names
将鸢尾花数据集转为DataFrame数据集
2、matplotlib.pyplot.scatter法绘制散点图 （参数详解）
3、matplotlib.axes.Axes.scatter法绘制散点图 （参数详解）
更好的阅读体验请戳：手把手教您python matlibplot绘制散点图（scatter）
1、鸢尾花（iris）数据集详细介绍
数据集导入、查看特征
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
from sklearn import datasets 
iris=datasets.load_iris()
dir(iris)
['DESCR', 'data', 'feature_names', 'target', 'target_names']
DESCR
#DESCR为数据集的描述信息，输出来看看：
print(iris.DESCR)
Iris Plants Database
====================
Notes
-----
Data Set Characteristics:
    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:#四列数据的四个特征
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:#数据描述三类鸢尾花
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
    :Summary Statistics:#四列数据的简单统计信息
    ============== ==== ==== ======= ===== ====================
                    Min  Max   Mean    SD   Class Correlation
    ============== ==== ==== ======= ===== ====================
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20  0.76     0.9565  (high!)
    ============== ==== ==== ======= ===== ====================
    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%[email protected])
    :Date: July, 1988
This is a copy of UCI ML iris datasets.
http://archive.ics.uci.edu/ml/datasets/Iris
The famous Iris database, first used by Sir R.A Fisher
This is perhaps the best known database to be found in the
pattern recognition literature.  Fisher's paper is a classic in the field and
is referenced frequently to this day.  (See Duda & Hart, for example.)  The
data set contains 3 classes of 50 instances each, where each class refers to a
type of iris plant.  One class is linearly separable from the other 2; the
latter are NOT linearly separable from each other.
References
----------
   - Fisher,R.A. "The use of multiple measurements in taxonomic problems"
     Annual Eugenics, 7, Part II, 179-188 (1936); also in "Contributions to
     Mathematical Statistics" (John Wiley, NY, 1950).
   - Duda,R.O., & Hart,P.E. (1973) Pattern Classification and Scene Analysis.
     (Q327.D83) John Wiley & Sons.  ISBN 0-471-22361-1.  See page 218.
   - Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New System
     Structure and Classification Rule for Recognition in Partially Exposed
     Environments".  IEEE Transactions on Pattern Analysis and Machine
     Intelligence, Vol. PAMI-2, No. 1, 67-71.
   - Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule".  IEEE Transactions
     on Information Theory, May 1972, 431-433.
   - See also: 1988 MLC Proceedings, 54-64.  Cheeseman et al"s AUTOCLASS II
     conceptual clustering system finds 3 classes in the data.
   - Many, many more ...
鸢尾花四个特征的数据。
print(type(iris.data))
print(iris.data.shape)
iris.data[:10,:]
<class 'numpy.ndarray'>#数据格式为numpy.ndarray(150, 4)#数据集大小为150行4列array([[5.1, 3.5, 1.4, 0.2],#数据集前十行

       [4.9, 3. , 1.4, 0.2],

       [4.7, 3.2, 1.3, 0.2],

       [4.6, 3.1, 1.5, 0.2],

       [5. , 3.6, 1.4, 0.2],

       [5.4, 3.9, 1.7, 0.4],

       [4.6, 3.4, 1.4, 0.3],

       [5. , 3.4, 1.5, 0.2],

       [4.4, 2.9, 1.4, 0.2],

       [4.9, 3.1, 1.5, 0.1]])
feature_names
以上4列数据的名称，从左到右依次为花萼长度、花萼宽度、花瓣长度、花瓣宽度，单位都是cm。
print(iris.feature_names)
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
target
使用数字0. ,1. ,2.标识每行数据代表什么类的鸢尾花。
print(iris.target)#150个元素的list
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2]
target_names
鸢尾花的名称，Setosa（山鸢尾花）、Versicolour（杂色鸢尾花）、Virginica（维吉尼亚鸢尾花）。
print(iris.target_names)
['setosa' 'versicolor' 'virginica']
将鸢尾花数据集转为DataFrame数据集
x, y = iris.data, iris.target
pd_iris = pd.DataFrame(np.hstack((x, y.reshape(150, 1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'] )
#np.hstack()类似linux中的paste
#np.vstack()类似linux中的cat
pd_iris.head()
2、matplotlib.pyplot.scatter法绘制散点图 （参数详解）
取数据集前两列绘制简单散点图
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
#数据准备
from sklearn import datasets 
iris=datasets.load_iris()
x, y = iris.data, iris.target
pd_iris = pd.DataFrame(np.hstack((x, y.reshape(150, 1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'] )
plt.figure(dpi=100)
plt.scatter(pd_iris['sepal length(cm)'],pd_iris['sepal width(cm)'])
#根据sepal length(cm)和sepal width(cm)两列，每一行两个数值确定的点绘制到figure上即为散点
三种不同鸢尾花的数据使用不同的图形（marker）和颜色表示
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
#数据准备
from sklearn import datasets 
iris=datasets.load_iris()
x, y = iris.data, iris.target
pd_iris = pd.DataFrame(np.hstack((x, y.reshape(150, 1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'] )
plt.figure(dpi=150)#设置图的分辨率
plt.style.use('Solarize_Light2')#使用Solarize_Light2风格绘图
iris_type=pd_iris['class'].unique()#根据class列将点分为三类
iris_name=iris.target_names#获取每一类的名称
colors = ['#c72e29','#098154','#fb832d']#三种不同颜色
markers = ['$\clubsuit,'.','+']#三种不同图形
for i in range(len(iris_type)):
    plt.scatter(pd_iris.loc[pd_iris['class'] == iris_type[i], 'sepal length(cm)'],#传入数据x
                pd_iris.loc[pd_iris['class'] == iris_type[i], 'sepal width(cm)'],#传入数据y
                s = 50,#散点图形（marker）的大小
                c = colors[i],#marker颜色
                marker = markers[i],#marker形状
                #marker=matplotlib.markers.MarkerStyle(marker = markers[i],fillstyle='full'),#设置marker的填充
                alpha=0.8,#marker透明度，范围为0-1
                facecolors='r',#marker的填充颜色，当上面c参数设置了颜色，优先c
                edgecolors='none',#marker的边缘线色
                linewidths=1,#marker边缘线宽度，edgecolors不设置时，该参数不起作用
                label = iris_name[i])#后面图例的名称取自label
plt.legend(loc = 'upper right')
3、matplotlib.axes.Axes.scatter法绘制散点图（参数详解）
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
#数据准备
from sklearn import datasets 
iris=datasets.load_iris()
x, y = iris.data, iris.target
pd_iris = pd.DataFrame(np.hstack((x, y.reshape(150, 1))),columns=['sepal length(cm)','sepal width(cm)','petal length(cm)','petal width(cm)','class'] )
fig,ax = plt.subplots(dpi=150)
iris_type=pd_iris['class'].unique()#根据class列将点分为三类
iris_name=iris.target_names#获取每一类的名称
colors = ['#c72e29','#098154','#fb832d']#三种不同颜色
markers = ['$\clubsuit,'.','




    
+']#三种不同图形
for i in range(len(iris_type)):
    plt.scatter(pd_iris.loc[pd_iris['class'] == iris_type[i], 'sepal length(cm)'],#传入数据x
                pd_iris.loc[pd_iris['class'] == iris_type[i], 'sepal width(cm)'],#传入数据y
                s = 50,#散点图形（marker）的大小
                c = colors[i],#marker颜色
                marker = markers[i],#marker形状
                #marker=matplotlib.markers.MarkerStyle(marker = markers[i],fillstyle='full'),#设置marker的填充
                alpha=0.8,#marker透明度，范围为0-1
                facecolors='r',#marker的填充颜色，当上面c参数设置了颜色，优先c
                edgecolors='none',#marker的边缘线色
                linewidths=1,#marker边缘线宽度，edgecolors不设置时，改参数不起作用
                label = iris_name[i])#后面图例的名称取自label
plt.legend(loc = 'upper right')
4、参考资料
scikit-learn.org/stable/data…
matplotlib.org/api/_as_gen…
matplotlib.org/api/_as_gen…
更好的阅读体验请戳：手把手教您python matlibplot绘制散点图（scatter）
同系列好文
Python可视化|matplotlib07-Matplotlib Colormap（三）
Python可视化|08-Palettable库中颜色条Colormap（四）
Python|R可视化|09-提取图片颜色绘图（五-颜色使用完结篇）
欢迎关注公众号：pythonic生物人
  
分类：
 人工智能
 
  
   相关推荐
   
        gyratesky
        数据可视化
      
     在UE中加载html
 介绍 在数字孪生大屏开发中，使用UE集成场景和数据图表是一个常见需求。本文将探讨第一种做法，即如何在UE中加载html，我搜罗了互联网上开发者们的做法，然后自己实践了一遍形成这个记录。
  606
 
 
        德育处主任
        数据可视化
        Canvas
      
     Fabric.js 使用自定义字体
 🀄️ 如果你使用Fabric.js做编辑类的产品，有可能需要给用户配置字体。这次就讲讲在Fabric.js中创建文本时怎么使用自定义字体、在项目运行时怎么修改字体、以及推一个精简字体库的工具
  349
 
 
        京东云开发者
        数据可视化
      
     京东云分布式链路追踪在金融场景的最佳实践 | 京东云技术团队
 微服务是近几年最流行的软件架构设计理念，和容器、devops 一起构成了云原生的技术基础。微服务源于对产品快速交付的市场诉求，通过采取一系列的自动化测试、持续集成等敏捷开发实践，激活了组织效率，也增强
  300
 
 
        数据可视化
        Vue.js
      
     可视化大屏：autofit.js 一行搞定自适应




    
 困扰着前端人自适应大屏适配的噩梦可能要被这短短的几行代码破解了，难道这就是大屏适配的最优解？快来看看这款名为autofit的小工具，用了都说好！
  4.3w
 
 
        Python
        数据可视化
      
     pytorch tensorboard使用教程
 介绍了在pytorch下tensorboard使用教程，总结了常见的的可视化图表类型，以及安装和启动教程。
  371
 
 
        数据可视化
      
     「AntV」用 S2 写一个属于你的透视表
 S2 是一个面向可视分析领域的数据驱动的表可视化引擎。本篇文章通过两个案例介绍了 S2 的自定义机制和其它的自定义方式，帮助读者能够完成定制化需求，创造一个自己的透视表。
  222
 
 
        德育处主任
        Canvas
        数据可视化
      
     Fabric.js 复制粘贴元素
 🐱 当你要复制一个 fabric 的元素时，你考虑到的是什么？是深拷贝当前选中对象再添加到画布中？ 其实，fabric.js 提供了一个克隆方法。
  461
 
 
        alsmile
        数据可视化
      
     开源、易扩展、方便集成的Web绘图工具（流程图、架构图、组态、SCADA、大屏）
 乐吾乐Meta2d.js是一个完全从零自主研发的国产开源Web绘图工具。能够方便快速的集成到自己的前端项目，实现专属自己的前端可视化平台
  606
 




    
 
        数据可视化
        JavaScript
      
     前端可视化大屏自适应工具，开箱即用
 大屏适配解决方案 做可视化大屏时，在适配屏幕上，有四种常用的解决方案： 根据屏幕尺寸随意缩放 适用场景：留白不可接受的情况下使用 优点：占满屏幕，美观 缺点：屏幕尺寸比和设计稿尺寸比不一致时，导致变形
  906
 
 
        WebGL
        数据可视化
      
     写给前端工程师的向量知识
 前言 时光飞逝，不知不觉地已经在前端领域已经练习时长五年半了。工作内容无非就是做做后台管理系统的增删改查居多，也做过一些可视化方面的项目，现在看来也是太普通，太没技术含量的活了。随着 ChatGPT 
  617
 
 
        数据可视化
      
     「AntV」45天减肥20斤!? 我是如何用可视化技术辅助自己减肥的?
 45天减肥20斤! 听着很不可思议? 其实不难, 管住嘴迈开腿就行. 但是这几个字的背后藏着很多理论知识. 本篇文章我将通过理论+实践相结合方式,向大家介绍我是如何利用无代码+可视化技术辅助自己减肥的
  1023
 
 
        晴天蜗牛不一般
        ECharts
        数据可视化
      
     数据大屏搭建与开发的秘诀
 今天6月1号，希望大家怀有童心，赶走烦心，留住开心，祝愿每一个大朋友小朋友笑口常开，快乐常在。 前言 小半年没有更新文章了，最近时间比较充裕，写了一个大屏项目，在这里系统的介绍一下自己的开发过程。 多
  479
 
 
        MarvinZhang
        数据可视化
      
     实战数据分析: 开源的自动化数据探索神器 Rath
 本篇文章将介绍一个非常酷的自动化数据探索开源工具 Rath，可以自动化的完成 EDA，成为数据分析界的 Autopilot 或 Copilot
  3176
 




    
 
        前端下饭菜
        数据可视化
        JavaScript
      
     从炫酷的波浪动画学习anime.js设计原理
 学习优秀的开源库是了解底层原理的重要手段，anime.js的star数接近45k，也证明了它的优秀。相比其他动画库，anime.js提供stagger、timeline、control模块为动画...
  316
 
 
        小小张说故事
        Python
        数据可视化
      
     探索Python中的数据可视化利器：Plotly Express
 一. 引言 在数据分析和可视化领域，数据的有效呈现是至关重要的。Python作为一种强大的编程语言，提供了多种数据可视化工具和库。其中，Plotly Express是一款受欢迎的数据可视化库，它提供了
  299
 
 
        冬日的暖阳balala
        数据可视化
      
     快速搞定可视化大屏
 由于我最近一直开发大屏，所以累计了一些经验（yuanqi）,在此分享给大家，也方便后续自己复制粘贴... 内容主要是大屏一些可复用的模块，项目技术栈：vite + vue3 + echarts + v
  1266
 
 
        德育处主任
        Canvas
        数据可视化
      
     物理世界的互动之旅：Matter.js入门指南
 🦄 Matter.js是一个强大的JavaScript物理引擎，可帮助你创建逼真的动画和交互式效果。如果你正在寻找一种能够增强你网站用户体验的方式，那么Matter.js是一个很好的选择。
  6058
 
 
        蚂蚁集团数据体验技术
        JavaScript
        数据可视化
      
     「AntV」热力图 heatmap 绘制原理解析
 最近在 G2 5.0 中加上了 heatmap 热力图的 mark，让 G2 5.0 可以轻松绘制热力图，应该社区上大部分绘制热力图的库，原理基本都是类似的，可以参考 heatmap.js 源码，所以
  249
 
 
        华山令狐冲
        数据可视化
      
     拿走吧，你！可视化大屏一次性解决！
 前言 授人以渔，不如授人以鱼。 我把最近开发大屏的项目，抽象为一个最简版的demo，放到 github 上。保证拿来即用，可以帮助大家省去一些调研的时间。 半成品demo的github地址如下：
  5.8w
 
 
        蚂蚁集团数据体验技术
        JavaScript
        数据可视化
      
     AntV 首届有奖征文：揭示数据之美，赢取丰厚奖品！
 征稿活动将从 2023 年 5 月 25 日开始，截止于 2023 年 6 月 25 日。 特等奖 1 名、一等奖 2 名、二等奖 4 名、三等奖 8 名，入围奖 10名，参入就送可视化小册子。
  876
 
 
          
 
 
  
 
 友情链接：
 
        mysql 数据库表结构
    pythonic生物人
        中级数据挖掘工程师
你将学到什么？

更好的阅读体验请戳：手把手教您python matlibplot绘制散点图（scatter）

1、鸢尾花（iris）数据集详细介绍

数据集导入、查看特征

DESCR

feature_names

target

target_names

将鸢尾花数据集转为DataFrame数据集

2、matplotlib.pyplot.scatter法绘制散点图 （参数详解）

3、matplotlib.axes.Axes.scatter法绘制散点图（参数详解）

4、参考资料

更好的阅读体验请戳：手把手教您python matlibplot绘制散点图（scatter）

同系列好文

2、matplotlib.pyplot.scatter法绘制散点图（参数详解）