java—将mapreduce作业输出到标准输出，而不是本地文件

x3naxklr 于 2021-05-29 发布在 Hadoop

关注(0)|答案(0)|浏览(196)

我希望通过不指定outputdir（即本地输出文件）来运行hbase导出，而是将导出作业输出直接流式传输到远程主机，以避免本地临时存储。

String tableName = args[0];

**Path outputDir = new Path(args[1]);**

Job job = new Job(conf, "export" + "_" + tableName);
job.setJobName(NAME + "_" + tableName);
job.setJarByClass(Exporter.class);
// Set optional scan parameters
Scan s = getConfiguredScanForJob(conf, args);
TableMapReduceUtil.initTableMapperJob(tableName, s, Exporter.class, null,
  null, job);
// No reducers.  Just write straight to output files.
job.setNumReduceTasks(0);
job.setOutputFormatClass(SequenceFileOutputFormat.class);
job.setOutputKeyClass(ImmutableBytesWritable.class);
job.setOutputValueClass(Result.class);
FileOutputFormat.setOutputPath(job, outputDir);
job.waitForCompletion(true);

有些帖子提到我们可以覆盖formatclass的getrecordwriter（）方法，但我不明白。

Java hadoop hbase mapreduce hadoop-streaming

来源：https://stackoverflow.com/questions/32988952/output-mapreduce-jobs-to-the-standard-out-instead-of-a-local-file