如何在python中调用R?这包括如何调用 R 对象(函数和包),如何将 R 和 python 对象相互转换,以及如何调用 R 脚本(输入外部参数)。 Python 提供了一个模块 rpy2 可以很好地完成这项工作。
一、安装rpy2
rpy2的网址:http://rpy.sourceforge.net/index.html
可以使用easy_install安装,# easy_install rpy2
注意事项:
(1)如果是源代码编译安装R,需要在configure步骤加入后缀 --enable-R-shlib。
(2)需要安装python-devel包。
二、python调用R对象
1、使用rpy2.robjects包的r对象
调用方法如下。 robject.r的以下调用方法实际上启动了一个R交互过程。只需要将R代码写成字符串(注1),然后调用R:
import rpy2.robjects as robjects
此时,有三种方法调用R对象:
第一种:robjects.r['pi']
第二种:robjects.r('pi') (这个方法在某种程度上是通用的,因为任何大小和长度的R代码都可以写成python字符串,然后通过robjects.r('Rcode')调用执行。 )
第三种:robjects.r.pi(这种方法会出现名称中带有“点”的变量的问题,比如data.frame/read.csv等,所以推荐第一种方法)
以下是创建和使用 R 函数(自创或 R 内置函数)的示例。注意:最后一种方法适用于某些特殊格式:
# creat an R function
>>> robjects.r(
'''
f <- function(r){pi * r}
. '''
)
>>> robjects.r['f'](3)
[9.424778]
# internal function in R
>>> robjects.r['ls']()
# another internal function
>>> l = robjects.r['letters']
>>> len(l)
>>> robjects.r['paste'](l, collapse = '-')
# an alternative way of getting 'paste' function in R
# eval the R code
>>> coder = 'paste(%s, collapse = "-")' % (l.r_repr())
>>> robjects.r(coder)
对于一些特殊的R对象比如list和matrix,如果python想要传递一部分数据,可以通过它的rx()和rx2()方法进行操作。对于列表,你可以查看其名称属性以获取列表中每个元素的名称。 rx()等价于“[”操作(注意取出R的list对象),rx2()等价于“[[”操作。一个例子:
>>> tmp = r("list(a = matrix(1:10, nrow = 2), b = 'Hello')")
>>> print tmp
$a
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10
$b
[1] "Hello"
>>> tmp.names
<StrVector - Python:0x8afdc8c / R:0x8ce0a70>
['a', 'b']
>>> tmp.rx('a')
<ListVector - Python:0x8afd86c / R:0x8cf71c0>
[Matrix]
a: <class 'rpy2.robjects.vectors.Matrix'>
<Matrix - Python:0x8b013cc / R:0x97de388>
[ 1, 2, 3, ..., 8, 9, 10]
>>> tmp.rx(1)
<ListVector - Python:0x8b010cc / R:0x8cf7100>
[Matrix]
a: <class 'rpy2.robjects.vectors.Matrix'>
<Matrix - Python:0x8b017cc / R:0x97de388>
[ 1, 2, 3, ..., 8, 9, 10]
>>> tmp.rx2(1)
<Matrix - Python:0x8b01b4c / R:0x97de388>
[ 1, 2, 3, ..., 8, 9, 10]
>>> tmp.rx2('a').rx(1, 1) # first element of 'a'
<IntVector - Python:0x8b01acc / R:0x8cf6fa0>
[ 1]
>>> tmp.rx2('a').rx(1, True) # first row of 'a'
<IntVector - Python:0x8b01f2c / R:0x965ffd8>
[ 1, 3, 5, 7, 9]
注意事项:
如果函数有警告,可以在 ipython 等 IDE 上执行,但如果是脚本或与 web 服务器交互,则会产生错误。
解决办法:
(1)鲁莽的解决方法很简单,强行忽略R的warning,options(warn = -1)或者把R代码放到函数suppressWarnings()中。
(2)第二种方法,如果你自己的代码中使用了warning()函数,将警告信息替换成字符串,然后单独输出。
如果R的函数参数用到向量,有两种解决办法:
(1)使用robject.**Vector()函数(见下)先将python对象转化为R对象,然后带入函数;
(2)直接使用python对象,一个例子:
>>> from rpy2.robjects import r
>>> a = r['matrix'](range(10), nrow = 2)
>>> print a
[,1] [,2] [,3] [,4] [,5]
[1,] 0 2 4 6 8
[2,] 1 3 5 7 9
2、python对象转换成R对象
通常可以将python列表对象转换为R向量对象,然后直接使用R函数调用。对应的函数是robjects.StrVector()/robjects.IntVector()/robjects.FloatVector()/robjects.complexVector()/robjects.FactorVector()/robjects.BoolVector()/,这些函数将python列表转换为R字符/整数/浮点数/复数/因子/布尔向量。 robjects.ListVector() 将 python 字典转换为 R 列表。
具体转换可见http://rpy.sourceforge.net/rpy2/doc-2.2/html/vector.html#creating-vectors
比如:
>>> testmatrix = robjects.IntVector([1, 2, 3, 4])
>>> robjects.r['matrix'](testmatrix, nrow = 2)
# another dynamic arguments example
>>> x = robjects.IntVector(range(10))
>>> y = robjects.r.rnorm(10)
>>> kwargs = {'ylab': 'foo/bar', 'type': 'b', 'col': 'blue', 'log': 'x'}
>>> robjects.r.plot(*args, **kwargs)
>>>
注意事项:
使用向量序列函数时,输入只能是python列表,不能是数字或字符串。
3、载入和使用R包
使用rpy2.robjects.packages.importr对象,调用方法是
>>> from rpy2.robjects.packages import importr
>>> base = importr('base')
>>> stats = importr('stats')
>>> affy = importr('affy')
>>> stats.rnorm(10)
如果想引用一个包中的隐变量,也很简单,只要载入包,然后所有r命令化成成字符串,之后引用即可(这种方法是万能的),比如
>>> from rpy2.robjects.packages import importr
>>> importr('hwriter')
>>> a = r('hwriter:::hwrite.table(matrix(1:10, 2))')
>>> print(a)
[1] "<table border="1">n<tr>n<td>1</td><td>3</td><td>5</td><td>7</td><td>9</td></tr>n<tr>n<td>2</td><td>4</td>
<td>6</td><td>8</td><td>10</td></tr>n</table>n"
4、导入R脚本
使用R的source函数:
from rpy2.robjects import r
r.source('testrscript.r')
5、转换R对象为全局变量
三、R对象转换成python对象
推荐使用tuple( )或者list( )函数,将R对象转换成tuple或者list。
>>> a = r('c(1, 2, 3)')
>>> a
<FloatVector - Python:0x904746c / R:0x9114978>
[1.000000, 2.000000, 3.000000]
>>> str(a)
'[1] 1 2 3n'
>>> tuple(a)
(1.0, 2.0, 3.0)
>>> list(a)
[1.0, 2.0, 3.0]
>>> b = r('matrix(1:6, 2, 3)')
>>> b
<Matrix - Python:0x9039c6c / R:0x9114710>
[1,2,3,4,5,6]
>>> print b
[,1] [,2] [,3]
[1,] 1 3 5
[2,] 2 4 6
>>> tuple(b)
(1, 2, 3, 4, 5, 6)
>>> list(b)
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 你了解python单例模式吗?12/22
- ♥ 确定一个数字在python中是否为int09/01
- ♥ python对象和方法有什么区别01/07
- ♥ python中有哪些邮件模块12/15
- ♥ 如何在 python 中定义非闭包01/12
- ♥ Python如何读取excel中的图片10/13
内容反馈