添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

1 什么是词云图?

词云图,也叫文字云,是对网络文本中出现频率较高的“关键词”予以视觉上的突出,出现越多,显示的字体越大,越突出,这个关键词也就越重要。让浏览者通过词云图一眼就可以快速感知最突出的文字,迅速抓住重点,了解主旨。 词云图

2 安装wordcloud2包,以及主要参数介绍

wordcloud2包里绘制词云图的函数是wordcloud2(),而它常用的参数有以下几种:

  • data:词云生成数据,包含具体词语以及频率;
  • size:字体大小,默认为1,一般来说该值越小,生成的形状轮廓越明显;
  • fontFamily:字体,如‘微软雅黑’;
  • fontWeight:字体粗细,包含‘normal’,‘bold’以及‘600’;;
  • color:字体颜色,可以选择‘random-dark’以及‘random-light’,其实就是颜色色系;
  • backgroundColor:背景颜色,支持R语言中的常用颜色,如‘gray’,‘blcak’,但是还支持不了更加具体的颜色选择,如‘gray20’;
  • minRontatin与maxRontatin:字体旋转角度范围的最小值以及最大值,选定后,字体会在该范围内随机旋转;
  • rotationRation:字体旋转比例,如设定为1,则全部词语都会发生旋转;
  • shape:词云形状选择,默认是‘circle’,即圆形。还可以选择‘cardioid’(苹果形或心形),‘star’(星形),‘diamond’(钻石),‘triangle-forward’(三角形),‘triangle’(三角形),‘pentagon’(五边形);
  • 3 准备数据

    wordcloud2包默认自带了一个 英文词频 数据框,包含了两个变量 word:字符,freq:字符的出现频率,我们可以利用这个数据来做词云图的示例。

             word freq
    oil       oil   85
    said     said   73
    prices prices   48
    opec     opec   42
    mln       mln   31
    the       the   26

    还有一个中文词频数据框,包含两个变量 V2 词汇,V1词汇频率。

            V2   V1
    1     数据 2304
    3     统计 1413
    4     用户  855
    5     模型  846
    7     分析  773
    8 数据分析  750