内容简介
《R数据分析方法与案例详解》是一本R语言和数据分析的入门教材,循序渐进、深入浅出,每个知识点尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R语言的基本使用以及编程技巧。全书内容涵盖R数据结构、函数与优化、抽样模拟、统计分析、假设检验、回归分析、统计绘图和R包制作等内容。作者简介
方匡南,厦门大学经济学院统计系副教授、博士生导师、美国耶鲁大学博士后。主要研究大数据与数据挖掘、计量经济学等。主持过多项国家自然科学基金、国家社会科学基金以及企业横向课题。精通R语言并编写过多个R软件包。r数据分析方法与案例详解章节目录
第 1 章 初识R语言 1 1.1 什么是R语言 1 1.2 为什么用R语言 2 1.3 安装R 4 1.4 R扩展包 4 1.4.1 R扩展包的安装与载入 5 1.4.2 R包的使用 6 1.5 R编辑器 7 1.6 工作空间 11 第 2 章 数据结构与基本运算 13 2.1 数据类型 13 2.2 数据对象 14 2.2.1 向量 15 2.2.2 矩阵 21 2.2.3 数组 31 2.2.4 因子 32 2.2.5 列表 33 2.2.6 数据框 34 2.3 习题 36 第 3 章 函数与优化 38 3.1 常用的R内置函数 38 3.2 条件控制语句 38 3.2.1 if/else语句 38 3.2.2 ifelse 语句 39 3.2.3 switch语句 39 3.3 循环语句 40 3.3.1 for循环 40 3.3.2 while循环 40 3.3.3 repeat语句 41 3.4 编写自己的函数 41 3.4.1 函数名 42 3.4.2 关键词function 42 3.4.3 参数 42 3.4.4 函数体和函数返回值 44 3.5 程序调试 45 3.6 程序运行时间与效率 46 3.7 用R做优化求解 47 3.7.1 一元函数优化求解 48 3.7.2 多元函数优化求解 48 3.7.3 约束条件下的优化求解 50 3.8 习题 52 第 4 章 随机数与抽样模拟 54 4.1 一元随机数的产生 54 4.1.1 均匀分布随机数 54 4.1.2 正态分布随机数 56 4.1.3 指数分布随机数 57 4.1.4 离散分布随机数的生成 58 4.1.5 常见分布函数表 59 4.2 多元随机数的生成 61 4.2.1 多元正态分布随机数 61 4.2.2 多元正态分布密度函数、分位数与累积概率 63 4.2.3 多元t分布随机数 64 4.3 随机抽样 65 4.3.1 放回与放回抽样 65 4.3.2 bootstrap重抽样 66 4.4 统计模拟 67 4.4.1 几种常见的模拟方法 67 4.4.2 模拟函数的建立方法 70 4.5 习题 73 第 5 章 数据读写与预处理 74 5.1 数据的读入 74 5.1.1 直接输入数据 74 5.1.2 读R包中的数据 75 5.1.3 从外部文件读入数据 75 5.2 写出数据 79 5.3 数据预处理 80 5.3.1 变量预处理 81 5.3.2 变量重编码 82 5.3.3 变量重命名 84 5.3.4 变量类型的转换 85 5.3.5 日期变量的变换 86 5.4 缺失数据处理 87 5.4.1 缺失数据的识别 87 5.4.2 缺失数据的探索与检验 88 5.4.3 缺失数据的处理 89 5.5 数据集的合并与拆分 90 5.5.1 数据框的合并与拆分 90 5.5.2 数据集的合并 92 5.5.3 数据集的抽取 92 5.6 习题 93 第 6 章 探索性数据分析 94 6.1 主要分析工具 94 6.1.1 探索性数据分析的工具 94 6.1.2 数据的类型 98 6.2 单变量数据分析 99 6.2.1 分类型数据 99 6.2.2 数值型数据 101 6.2.3 离群值探索 106 6.3 双变量数据分析 109 6.3.1 分类数据对分类数据 109 6.3.2 分类数据对数值型数据 111 6.3.3 数值型数据对数值型数据 112 6.4 多变量数据分析 115 6.4.1 访问数据框数据 115 6.4.2 多变量数据的分析. 118 6.5 习题 124 第 7 章 参数假设检验 126 7.1 假设检验的思想与步骤 126 7.1.1 假设检验的基本思想 126 7.1.2 假设检验的基本步骤 128 7.2 正态总体单样本参数假设检验 129 7.2.1 均值的检验 130 7.2.2 方差检验 132 7.3 正态总体双样本参数假设检验 134 7.3.1 双样本方差的检验(方差齐性检验). 134 7.3.2 两样本均值检验 135 7.4 比例假设检验 139 7.4.1 单样本比例检验 139 7.4.2 两样本比例检验 141 7.5 习题 142 第 8 章 非参数假设检验 144 8.1 图示法 144 8.2 卡方检验 146 8.2.1 卡方分布(χ 2 distribution) 147 8.2.2 卡方拟合优度检验. 148 8.2.3 卡方独立性检验 151 8.2.4 卡方两样本同质性检验 151 8.3 秩和检验 152 8.3.1 秩的概念 153 8.3.2 单样本符号秩检验. 153 8.3.3 两独立秩和检验 154 8.3.4 多个独立样本的秩和检验 155 8.3.5 多个相关样本的秩和检验 158 8.4 K-S检验 160 8.4.1 K-S单样本总体分布验证 160 8.4.2 K-S两独立样本同质检验 160 8.5 常用正态性检验 162 8.5.1 偏度、峰度检验法. 162 8.5.2 Shapiro-Wilk(W检验) 163 8.5.3 其他常用正态检验. 165 8.6 习题 167 第9 章 方差分析 169 9.1 单因素方差分析 170 9.2 双因素方差分析 174 9.2.1 不考虑交互作用的双因素方差分析 174 9.2.2 考虑交互作用的双因素分析 178 9.3 习题 183 第 10 章 线性回归模型 184 10.1 问题提出 184 10.2 一元线性回归 185 10.2.1 一元线性回归概述 186 10.2.2 一元线性回归的参数估计 188 10.2.3 一元线性回归模型的检验 195 10.2.4 一元线性回归的预测 197 10.2.5 一元线性回归综合案例 201 10.3 多元线性回归分析 205 10.3.1 多元线性回归模型及假定 206 10.3.2 参数估计 207 10.3.3 模型检验 209 10.3.4 预测 211 10.3.5 多元线性回归综合案例 213 10.4 习题 218 第 11 章 线性回归模型的扩展 220 11.1 多重共线性 220 11.1.1 问题的提出 220 11.1.2 多重共线性定义及后果 222 11.1.3 多重共线性检验 222 11.1.4 多重共线性克服 225 11.2 异方差性 229 11.2.1 问题的提出 229 11.2.2 异方差性定义及后果 231 11.2.3 异方差性检验 232 11.2.4 异方差性克服 236 11.3 序列相关性 240 11.3.1 问题的提出 241 11.3.2 序列相关性定义及后果 243 11.3.3 序列相关性检验 245 11.3.4 序列相关性克服 248 11.4 习题 251 第 12 章 非线性回归分析 254 12.1 问题的提出 254 12.2 可线性化的非线性回归 255 12.2.1 Cobb-Douglas生产函数 255 12.2.2 多项式方程模型 257 12.2.3 指数函数模型 259 12.3 不可线性化的非线性回归 260 12.3.1 非线性模型的参数估计与迭代算法 262 12.3.2 初始值选取 269 12.3.3 收敛性 270 12.4 非线性回归评价和假设检验 271 12.4.1 可决系数 271 12.4.2 参数显著性的F 检验 271 12.4.3 似然比检验 272 12.5 习题 274 第 13 章 二元选择模型 275 13.1 问题的提出 276 13.2 线性概率(LP)模型原理 277 13.3 Probit模型原理 279 13.4 Logit模型原理 280 13.5 边际效应分析 281 13.6 最大似然估计(MLE) 282 13.7 似然比检验和拟合优度 282 13.8 案例分析:经济学教学新方法的效果 284 13.9 扩展案例:信用卡违约预测分析 289 13.9.1 描述性统计 290 13.9.2 模型建立与参数估计 291 13.9.3 系数意义与边际分析 295 13.9.4 拟合与预测 296 13.9.5 结论与建议 297 13.10 习题 297 第 14 章 多元选择模型 299 14.1 有序选择模型 299 14.1.1 问题的提出:本科生申请研究生的影响因素 300 14.1.2 有序选择模型 300 14.1.3 案例分析:本科生申请研究生的影响因素 302 14.2 多元序Logit模型 304 14.2.1 问题的提出:关于钓鱼模式的选择 304 14.2.2 多元序Logit模型 305 14.2.3 案例分析:关于钓鱼模式的选择 307 14.3 嵌套Logit模型 309 14.3.1 问题的提出:旅行交通方式选择 309 14.3.2 嵌套Logit模型原理 310 14.3.3 案例分析:旅行交通方式选择 311 14.4 习题 313 第 15 章 计数模型与受限因变量模型 314 15.1 计数模型 314 15.1.1 问题的提出:轮船事故的计数数据模型 314 15.1.2 计数数据模型的设定 316 15.1.3 计数数据模型的估计 317 15.2 受限因变量模型 319 15.2.1 截断模型的问题提出 319 15.2.2 截断模型原理 319 15.2.3 审查模型问题的提出 321 15.2.4 审查模型原理 322 15.2.5 最大似然估计(MLE) 323 15.3 习题 328 第 16 章 分位数回归 330 16.1 问题的提出 330 16.2 总体分位数和总体中位数 332 16.3 经验分位数估计 333 16.4 分位数回归原理 334 16.5 扩展案例:社会保障与城乡家庭消费 339 16.5.1 问题的提出 339 16.5.2 数据说明 339 16.5.3 实证分析 342 16.5.4 结论与建议 345 16.6 习题 345 第 17 章 高级统计绘图 346 17.1 绘制地图 346 17.2 高阶绘图工具――ggplot2 355 17.2.1 散点图 355 17.2.2 散点图上添加平滑曲线 358 17.2.3 条形图和箱线图 360 17.2.4 直方图和密度曲线图 362 17.2.5 时间序列图 364 17.2.6 图形标注 365 17.3 三维图形与等高线图 366 17.3.1 三维图形 366 17.3.2 等高图/等高线 368 17.4 词云 369 17.5 散点图矩阵与关系矩阵图 370 17.6 马赛克图 372 17.7 习题 374 第 18 章 如何制作自己的R包 375 18.1 R包基础 376 18.2 在Windows中制作R包 377 18.3 在RStudio中制作R包 381 18.4 习题 383 参考文献 384
使用说明
1、下载并解压,得出pdf文件炽刃是影之刃3中魂的转职之一,相比于无锋地面和防御方面更强,那么技能链如何搭配呢?下面就让小编为大家介绍一下吧。
忘川风华录韩非猫值得培养吗?好多玩家不是太清楚,现在小编给大家说下韩非喵培养技巧攻略。
使用微商水印相机的时候,用户可以创建自己的团队,也可以选择加入其他人创建的团队,然后就可以更加方便的与团队中的好友互相交流了。那么微商水印相机怎么加入团队呢?这里小编
打开今日头条,选中要分享的内容, 点击右下角的分享图标, 选择朋友圈,点击发表即可。
黎明觉醒消音器怎么得?消音器在游戏中的作用还是很大的,消音器是枪械的一个配件,枪械在装备消音器之后可以减小开火的声音,在偷袭埋伏的时候可以使用,不会轻易地惊动敌人。那
近日腾讯推出微信聊天记录云储存服务,小伙伴们可以将自己的聊天记录储存在云端,云储存年费需要188元。不过话说回来,微信聊天记录云储存功能要如何使用呢?下面一起来看看了解一
来不及了快上车角色怎么升级?很多玩家都非常喜欢这款游戏,该游戏目前已经和玩家们见面了,在游戏中,我们可以通过升级我们的角色,让游戏更加的有乐趣,不少玩家都想知道该如何
来不及了快上车宝箱怎么打开?宝箱是我们在游戏中和其他玩家对局的时候获得的奖励,玩家存活的时间越久,击败的人数越多,就可以获得更高质量的宝箱,那么不少玩家就会有一个疑问
黎明觉醒武器怎么改造?游戏中的武器在获得之后都是可以进行改造的,玩家可以根据自己的想法结合武器的性能来改造武器,改造之后的武器性能属性都会有所改变。那么黎明觉醒中的武
IE浏览器是Windows电脑自带的浏览器,兼容性强,受到很多用户的喜欢,但是在使用的过程中难免会出现一些问题,比如就有用户发现自己的IE浏览器打不开网页了,这该如何解决?下面就让小编来给大家分析分析吧。