首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在CPython中嵌入Pig

在CPython中嵌入Pig
EN

Stack Overflow用户
提问于 2012-08-23 00:32:28
回答 3查看 359关注 0票数 1

有没有人知道在cpython脚本中嵌入pig的方法,类似于RDBMS的方法?我找过了,但没找到。

我不想使用jython,因为我正在尝试使用Jython中不提供的各种cpython库来处理数据。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2013-09-27 01:58:30

最近在Pig 0.12中添加了对CPython的支持:http://blog.mortardata.com/post/62334142398/hadoop-python-pig-trunk

票数 1
EN

Stack Overflow用户

发布于 2012-08-23 07:47:19

Jython似乎是最流行的选择,就像hereherehere一样,但你可能会发现this线程很有帮助,尽管它也专注于Jython。通过Python对UDF的关注看起来肯定是在Jython上,所以除非你绝对需要CPython库,否则你可以考虑咬紧牙关,转而使用它。另一件需要考虑的事情是,Jython2.7版(source)即将成熟,尽管这可能不能满足您的需求。

票数 1
EN

Stack Overflow用户

发布于 2013-09-29 11:02:44

如果您所说的“类似于RDBMS可用的API”指的是API,那么您可以使用子进程构建一个对象模型。我在过去使用过类似下面的东西。

代码语言:javascript
复制
import subprocess
from subprocess import Popen, PIPE

def execute(command):
    print command + "\n"
    p = subprocess.Popen(command, stdout=subprocess.PIPE, shell=True)
    stdout, stderr = p.communicate()
    print stdout
    return p.returncode

command = "pig.9 -p input=" + input + "/* -p output=" + output + " -f my.pig"
execute(command)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12077566

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档