R语言的现状、优势及其未来发展趋势 您所在的位置:网站首页 达州房价未来发展趋势分析 R语言的现状、优势及其未来发展趋势

R语言的现状、优势及其未来发展趋势

2024-06-22 22:57| 来源: 网络整理| 查看: 265

是 否 +2 论坛币 k人 参与回答 经管之家送您一份

应届毕业生专属福利!

求职就业群 赵安豆老师微信:zhaoandou666 经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取 感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

R语言的现状、优势及其未来发展趋势

R语言的现状

R 语言在国际和国内的发展差异非常大,国际上R语言已然是专业数据分析领域的标准,但在国内依旧任重而道远,这固然有数据学科地位不高的原因,国人版权概念薄弱以及学术领域相对闭塞的原因也不容忽视。R语言之所以能够被广大的数据分析工作者接受,这其中有诸多原因。

R语言的优势

  从R语言的发展历史上看,R主要是统计学家为解决数据分析领域的问题而开发的语言,因此R具有一些独特的优势。

统计学家和前沿算法(3400+ 扩展包)。

开放的源代码(自由且免费),可以部署在任何操作系统,例如 Windows、Linux、Mac OS X、BSD、Unix。

强大的社区支持。

高质量、广泛的统计分析、数据挖掘平台。

重复性的分析工作(Sweave = R + LaTeX),借助R语言的强大分析能力 +LaTeX 完美的排版能力,可以自动生成分析报告。

方便的扩展性。

  – 可通过相应接口连接数据库,例如 Oracle、DB2、MySQL。

  – 同 Python、Java、C、C++等语言进行互调。

  – 提供 API 接口均可以调用,例如 Google、Twitter、Weibo。

  – 其他统计软件大部分均可调用R,例如 SAS、SPSS、Statistica 等。

  – 甚至一些比较直接的商业应用,例如 Oracle R Enterprise、R add-on for Teradata、Sybase RAP 等。

R语言的未来发展趋势

  虽然R语言有诸多优势,但它并不是万能的——它毕竟是统计编程类语言。受到其算法架构的通用性以及速度性能方面的影响,因此其初始设计完全基于单线程和纯粹的内存计算。虽然一般情况下无关R的使用,但在当今大数据条件下,这两个设计思路的劣势逐渐变得愈加刺眼。好在R的一些优秀的扩展性包解决了上述问题,例如:

snow 支持 MPI、PVM、nws、Socket 通信,解决单线程和内存限制;

multicore 适合大规模计算环境,主要解决单线程问题;

parallel R 2.14.0 版本增加的标准包,整合了 snow 和 multicore 功能;

R + Hadoop 在 Hadoop 集群上运行R代码;

RHIPE 提供了更友好的R代码运行环境,解决单线程和内存限制;

Segue 利用 Amazon’s Web Services(EC2)。

  这里需要着重提一下 parallel 包,该包是R核心团队为了解决大数据计算问题而在标准安装程序下新增的功能包

  

一些误区

  很多人认为R语言是 GNU 开源项目软件,因此软件的使用是“没有任何保证”的。但在美国,R的计算结果被 FDA(Food and Drug Administration) 所承认;并且有报告指出与其他商业软件相比,R的 Bug 数量非常少【注:UCLA (2006). R relative to statistical packages. Technical report, UCLA.】。

  R 开发的核心团队对于R的新功能持异常谨慎的态度,比如 cairographics 从 2007 年开始酝酿,直到上一个大版本(2011年)才引入到R标准安装程序;byte-compile 功能更是经历了从 1999-2011年近 12 年的孵化【注:Ripley,B. (2011). The r development process. Technical report,Department of Statistics,University of Oxford.】。从这个角度讲,R语言的代码质量以及运算结果的可信性是完全可以保证的。

  当然,这里所说的是R的标准安装程序包,并不代表所有扩展包的质量。毕竟 3400+ 的扩展包质量良莠不齐,虽然不乏一些优秀的包(如 Rcpp、RODBC、VGAM、rattle),但必然存在一些扩展包质量不佳的情况。

  

应用的思考

  R 语言并不是人人都能接触到的语言,相对要小众很多,有些人即便接触到没准也搞不清楚R到底有什么用途。对于走上这条路的人,经常会有一些应用困难,比如从个人学习角度而言。

虽然R语言的设计之初就是避免通过大量编程实现统计算法,但最基本的编程能力还是需要的,因此对于一般非计算机专业的工作者来说无疑提高了难度。

还有很多人提到,R语言的学习曲线非常陡峭。但从我多年的使用经验上看,陡峭的学习曲线并不是因为R语言本身,而是隐藏在后面的统计知识很难在短时间内掌握的缘故。

  从公司商业应用的角度而言,也存在一些不可回避的问题。

首先是人力资源成本如何核算。

软件成本问题,由于R是自由软件,可以随时随地下载,因此对于企业来说如何度量成本是一个问题。

R的技能核定并没有官方或机构标准,简历上“熟练使用R语言”可能没有任何意义。

实际上,即便没有上述两个问题,企业想招到R相关的人才也不那么简单。

对于大量工作已由其他软件实现(比如用 SAS)的公司来讲,转化成本很高。

技术支持获取的问题。

二维码 扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

分享0 收藏1 回帖 关键词:R语言的现状 未来发展 发展趋势 R语言 Development R语言的现状、优势及其未来发展趋势 R语言的现状 R语言的优势 R语言的未来发展趋势


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有