从python脚本读取大型hdfs文件

niknxzdl 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(460)

我有一个python脚本，需要处理一个大文件。如果我减少原始文件并运行脚本，那么代码可以正常工作，但是当我在原始数据上运行脚本时，我的脚本将永远无法执行。我正在考虑使用hdfs来存储文件并从python脚本读取它。但是为了使用hdfs，我必须将python脚本转换成map reduce程序，或者我可以使用相同的代码。

hadoop hdfs python

来源：https://stackoverflow.com/questions/31524443/reading-large-hdfs-file-from-a-python-script

1条答案

按热度按时间

您需要调整python代码，然后使用hadoop流处理它。这正是流媒体的目的所在。

赞(0）回复(0）举报 2021-05-30

相关问题

微信公众号

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

Python pillow/PIL无法识别对象“imagedraw”的属性“textsize”
回答(3) 发布于 5个月前
python-3.x ImportError：无法从“typing_extensions”导入名称“deprecated”
回答(2) 发布于 5个月前
python-3.x 我正尝试使用密码学对字典进行加密
回答(1) 发布于 5个月前
在Python的IDLE中导入audiolazy的问题
回答(1) 发布于 5个月前
如何将Python程序中的数据添加到Markdown？
回答(2) 发布于 5个月前