如果你从事数据科学的工作,可能会立即想到两种编程语言:R和Python。
专注于为中小企业提供成都做网站、成都网站建设服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业寿宁免费做网站提供优质的服务。我们立足成都,凝聚了一批互联网行业人才,有力地推动了上1000家企业的稳健成长,帮助中小企业通过网站建设实现规模扩充和转变。
事实上,R和Python本身是很好的工具,但通常被认为是竞争对手。今天推荐的这篇文章将会把两者进行比较,而不是将它们视为两种选择。
如果你在Google搜索栏中输入R vs Python,会立即获得大量有关一方的优势的文章。
产生这种结果的原因之一,是人们根据他们根据对编程语言使用的选择将数据科学领域划分为阵营,一个R营地和一个Python营地。而且这两个阵营往往不能和谐相处,其中的成员都相信他们的语言优于对方。因此,在某种程度上,分歧并不在于工具,而在于——
为什么不同时使用呢?
数据科学中有很少一部分人同时使用Python和R。但事实上,有很多人虽然只用一种编程语言,但他们也想要使用另一个软件的某些功能。例如,R用户有时会想要使用Python本机的面向对象能力,同样,一些Python用户也想用R中的各种统计分布。
上图是Red Monk在2018年第三季度进行的调查结果。这个调查数据来源于Stack Overflow和Github上的语言的流行度,它清楚地表明R和Python普及度都比较高。因此,没有内在的理由说明为什么我们不能在同一个项目上同时使用二者。我们的最终目标应该是更好地分析并获得更好的理解,编程语言的选择不应成为实现这一目标的障碍。
R与Python回顾
让我们来看看这些语言以及它们的优缺点。
Python
自1991年发布以来,Python一直非常受欢迎,并广泛用于数据处理。优点有:
但是,与R不同,Python没有用于统计计算的专用包。
R
R的***个版本发布于1995年,从那时起它就成为业界最常用的数据科学工具之一。
性能良好的R不是最快的语言,并且在处理大型数据集时有时可能会内存过多。
充分利用这两种语言
我们能否同时利用R的统计能力和Python的编程能力?当我们可以轻松地在R或Python脚本中嵌入SQL代码时,为什么不将R和Python混合在一起呢?
基本上有两种方法可以在一个项目中同时使用Python和R.
在Python中使用R
(http://bioinfo.ihb.ac.cn/softwares/PypeR/)
PypeR提供了一种简单的方法,通过管道从Python访问R。PypeR也包含在Python的Package Index中,它提供了一种更方便的安装方式。当Python和R之间不需要频繁的交互式数据传输时,PypeR特别有用。通过管道运行R,Python程序在流程操作系统平台(包括Windows 、GNU Linux和Mac OS)的子流程控制下,可以获得内存控制和可移植性方面的灵活性。
pyRserve
(https://pypi.org/project/pyRserve/)
pyRserve使用Rserve作为RPC连接网关。通过这种连接,可以在Python中用R设置变量,也可以远程调用R函数。R对象作为Python实现的类的实例公开,在许多情况下R函数作为这些对象的绑定方法。
(https://rpy2.bitbucket.io/)
rpy2在Python进程中运行嵌入式R。它创建了一个框架,可以将Python对象转换为R对象,将它们传递给R函数,并将R输出转换回Python对象。rpy2更常用,并且在积极开发中。
在Python中使用R的一个优点是可以在Python中轻易使用R的强大软件包,如ggplot2,tidyr,dplyr等。举一个例子,让我们看看如何在Python中使用ggplot2进行映射。
https://rpy2.github.io/doc/latest/html/graphics.html#plot
https://rpy2.github.io/doc/latest/html/graphics.html#geometry
在R中使用Python
我们可以使用下面其中一种替代方法在Python中运行R脚本:
(https://r-forge.r-project.org/projects/rjython/)
该包通过Jython实现了Python的接口。它旨在让其他包能够与R一起嵌入python代码。
(https://cran.r-project.org/web/packages/rPython/index.html)
rPython又是一个允许R调用Python的包。它使得在R中运行Python代码,进行函数调用,分配和检索变量等成为可能。
(https://github.com/asieira/SnakeCharmR)
SnakeCharmR是rPython的现代版本。它是'rPython'的一个分支,它用了'jsonlite'并且比rPython有很多进步之处。
(https://bitbucket.org/Floooo/pythoninr/)
PythonInR通过提供从内部与Python交互的函数,使得从R内部访问Python变得非常容易。
(https://github.com/rstudio/reticulate)
网状软件包为Python和R之间的互操作性提供了一套全面的工具。在上述所有选择中,这个是最广泛使用的,更是因为它正在被Rstudio积极开发。Reticulate在R会话中嵌入Python会话,实现无缝、高性能的互操作性。该软件包使你能够将Python代码网格化为R,从而创建一个将两种语言编织在一起的新项目。
网状包提供以下设施:
结论
R和Python都是非常强大的语言,其中任何一种语言都足以执行数据分析任务。但是,对于这两者来说肯定存在一些优缺点,如果我们能够利用两者的优势,一定可以做得更好。无论如何,对二者进行充分的了解能够让我们在更多的环境中进行工作。
文章题目:从对抗到融合,教你充分利用R+Python!
网站URL:http://www.36103.cn/qtweb/news18/8918.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联