Stata是如何检验极端值的呢?检验极端值有哪些步骤?本期
艾思云课堂
小编带大家学习一下stata检验极端值数据的步骤。
常见命令:tabulate、stem、codebook、summarize、list、histogram、graph box、gragh
matrix
step1.用codebook、summarize、histogram、graph boxs、graph
matrix、stem看检验数据的总体情况:
可以看出数据分布状况,尤其是最大、最小值
step2.用tabulate、list细致寻找极端值
tabulate code if
x1==极端值(作出x1等于极端值时code的频数分布表,code表示地区、年份等序列变量,这样便可找出那些地区的数值出现了错误)
list code if x1==极端值(直接列出x1等于极端值时code的值,当x1的错误过多时,不建议使用该命令)
step3.用replace命令替换极端值
replace x1=? if x1==极端值
去除极端值:
keep if y<1000
drop if y>1000
对数据排序:
sort x
gsort +x
(对数据按x进行升序排列)
gsort -x
(对数据按x进行降序排列)
gsort -x, generate(id) mfirst
(对数据按x进行降序排列,缺失值排最前,生成反映位次的变量id)
对变量进行排序:
order y x3 x1 x2
(将变量按照y、x3、x1、x2的顺序排列)
生成新变量:
gen logx1=log(x1)(得出x1的对数)
gen x1`=exp(logx1)(将logx1反对数化)
gen r61_100=1 if
rank>=61&rank<=100(若rank在61与100之间,则新变量r61_100的取值为1,其他为缺失值)
replace r61_100 if
r61_100!=1(“!=”表示不等于,若r61_100取值不为1,则将r61_100替换为0,就是将上式中的缺失值替换为0)
gen abs(x)(取x的绝对值)
gen ceil(x)(取大于或等于x的最小整数)
gen trunc(x)(取x的整数部分)
gen round(x)(对x进行四舍五入)
gen round(x,y)(以y为单位,对x进行四舍五入)
gen sqrt(x)(取x的平方根)
gen mod(x,y)(取x/y的余数)
gen reldif(x,y)(取x与y的相对差异,即|x-y|/(|y|+1))
gen logit(x)(取ln[x/(1-x)])
gen x=autocode(x,n,xmin,xmax)(将x的值域,即xmax-xmin,分为等距的n份)
gen x=cond(x1>x2,x1,x2)(若x1>x2成立,则取x1,若x1>x2不成立,则取x2)
本期的
艾思科蓝
资讯就分享到这里了,学海无涯,我们的每一天都在学习,艾思科蓝一直伴随在您的学习之路上。
【IEEE出版|连续3届会后2个月EI检索】第七届复杂系统数据驱动优化国际会议(DOCS 2025)
人工智能(AI)、深度学习、强化学习、迁移学习、自我监督学习、分布式和联合机器学习、可信机器学习、生成模型、大型语言模型(LLMs)、LLMs的自动验证、小型和大型模型的协调、
2025-08-19
【EI期刊出版】第四届电力工程与电气技术国际学术会议(ICPEET 2025)
智慧储能研究院、内蒙古工业大学电力学院、澳大利亚莫道克大学和加利福尼亚大学尔湾分校支持的第四届电力工程与电气技术国际学术会议(ICPEET 2025)将于2025年6月27-29日在中国呼和浩特市举办
2025-07-18
【高录用 - 稳检索】第五届教育、信息管理与服务科学国际学术会议(EIMSS 2025)
第五届教育、信息管理与服务科学国际学术会议 (EIMSS 2025)将于2025年07月11-13日在马来西亚召开。EIMSS 2025致力于推动教育、信息管理与服务科学的前沿研究,促进多学科交叉和合
2025-07-18
【EI稳定检索|往届会后四个月检索】第二届大数据与数字化管理国际学术会议 (ICBDDM 2025)
第二届大数据与数字化管理国际学术会议 (ICBDDM 2025),将于2025年7月18-20日在中国新疆召开。在当今这个数据驱动的时代,大数据与数字化管理已经成为推动组织变革、优化决策过程和增强竞争
2025-07-18
【快速EI检索|见刊后1个月检索】第三届教育知识与信息化国际学术会议(EKI 2025)
2025第三届教育知识与信息化国际会议(EKI 2025)将于2025年7月11日至13日在中国重庆召开。EKI 2025的目的和目标是展示教育知识和信息化的最新研究和成果。
2025-07-11
【IEEE出版 | 西安邮电主办】第四届半导体与电子技术国际研讨会(ISSET 2025)
2025年第四届半导体与电子技术国际研讨会(ISSET 2025)将于2025年7月25日-27日在中国西安举行。ISSET 2025将围绕“半导体”与“电子技术”等相关最新研究领域展开。
2025-07-24