R语言实战(第2版) 您所在的位置:网站首页 书源网络导入格式不对 R语言实战(第2版)

R语言实战(第2版)

2023-04-23 12:03| 来源: 网络整理| 查看: 265

前言

要是一本书里没有图画和对话,那还有什么意思呢?

——爱丽丝,《爱丽丝梦游仙境》

它太神奇了,满载珍宝,可以让那些聪明狡猾和粗野胆大的人得到充分满足;但并不适合胆小者。

——Q,“Q Who? ”,《星际迷航:下一代》

在开始写这本书时,我花了很多时间搜索适合于开始本书的名言警句。最后,我找到了这两句话。R是一个非常灵活的平台,是专用于探索、展示和理解数据的语言,因此我引用了《爱丽丝梦游仙境》的句子来表示当今统计分析的潮流——一个探索、展示和理解的交互式过程。

第二句话反映了大部分人对R的看法:难学。但你完全没必要这样想。虽然R很强大,应用广泛,不论你是新手还是略有经验的用户,众多的分析和绘图函数(超过50000个)都很容易让你望而却步,但实际上并非无规律可循。只要有合适的指导,你就可以畅游其中,选择所需的工具,用最优雅、最简洁、最高效的方式来完成工作——那真的很酷!

多年前,我在申请一个统计咨询职位时,第一次遇到了R。雇主在正式面试前发来的材料中问我是否熟悉R。根据猎头的建议,我立马回答“是的,我很熟悉”,然后开始恶补R。在统计和研究方面我有丰富的经验,作为SAS和SPSS程序员也有25年的工作经验,而且对各种编程语言也颇为精通。学习R能有多难?但事与愿违。

在学习这门语言的过程中(因为要面试,我要尽可能快),我发现这门语言无论是底层的结构还是各种高级的统计方法,都是由各具体领域的专家为同行专家编写的。看在线帮助简直就是折磨,那不是教程,都是参考手册。每当我觉得自己已经对R的结构和功能有足够把握时,就会发现一些闻所未闻的新东西,它们让我感觉自己很渺小。

为了解决这些问题,我开始以数据科学家的角度学习R。我开始思考如何才能成功地处理、分析和理解数据,包括:

❏ 获取数据(从各种数据源将数据导入程序);

❏ 整理数据(编码缺失值、修复或删除错误数据、将变量转换成更方便的格式);

❏ 注释数据(以记住每段数据的含义);

❏ 总结数据(通过描述性统计量了解数据的概况);

❏ 数据可视化(一图胜千言);

❏ 数据建模(解释数据间的关系,检验假设);

❏ 整理结果(创建具有出版水平的表格和图形)。

然后,我试图用R来完成这些任务。通过教授别人来学习是最好的方式,所以我创建了一个网站(www.statmethods.net),不断把我学到的东西放在上面。

大概一年后,Marjan Bace(Manning的出版人)打电话给我,问我能否写一本关于R的书。那时我已经写了50篇期刊文章、4份技术手册,以及大量章节的内容,还写了一本关于研究方法的书,所以我想,写一本关于R的书能有多难?结果依然是事与愿违。

本书的第1版于2011年出版,一年后,我开始编写第2版。R的平台在不断完善,我想一直跟进。我也想在本书中覆盖更多有关预测性分析及数据挖掘的内容——这都是大数据时代很火的主题。最后,我还想加一些关于数据可视化、软件发展以及动态报告撰写的章节。

你现在捧着的这本书是我多年来梦寐以求的。我试图提供一份R的指南,让你能尽快感受到R的强大以及开源的魅力,不再感到沮丧和忧虑。我希望你能喜欢本书。

另外,虽然当年我成功地申请到了那个职位,但并未入职。不过,学习R的经历改变了我的职业方向,这是我未曾想到的。真可谓人生如戏。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有