欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

MultipleOutputFormat和MultipleOutputs

系統 2528 0

?

文章出處:http://www.cnblogs.com/liangzh/archive/2012/05/22/2512264.html

?

?

MultipleOutputFormat和MultipleOutputs

?

一,介紹

?

1, 舊API 中有 org.apache.hadoop.mapred.lib. MultipleOutputFormat 和org.apache.hadoop.mapred.lib. MultipleOutputs

?

MultipleOutputFormat allowing to write the output data to different output files.

?

MultipleOutputs creates multiple OutputCollectors. Each OutputCollector can have its own OutputFormat and types for the key/value pair. Your MapReduce program will decide what to output to each OutputCollector.

?

2, 新API中? org.apache.hadoop.mapreduce.lib.output. MultipleOutputs

?

整合了上面舊API兩個的功能,沒有了MultipleOutputFormat。

?

  The MultipleOutputs class simplifies writing output data to multiple outputs

?

  Case one: writing to additional outputs other than the job default output. Each additional output, or named output, may be configured with its own             OutputFormat, with its own key class and with its own value class.

?

  Case two: to write data to different files provided by user

?

下面這段話來自Hadoop:The.Definitive.Guide(3rd,Early.Release) P 251

?

  “In the old MapReduce API there are two classes for producing multiple outputs: MultipleOutputFormat and MultipleOutputs. In a nutshell, MultipleOutputs is more fully featured, but MultipleOutputFormat has more control over the output directory structure and file naming. MultipleOutputs in the new API combines the best features of the two multiple output classes in the old API.”

?

二,應用

?

?1, 輸出到多個文件或多個文件夾:

?

  驅動中不需要額外改變,只需要在MapClass或Reduce類中加入如下代碼

?

  private MultipleOutputs<Text,IntWritable> mos;
  public void?setup(Context context)?throws IOException,InterruptedException {
    mos = new MultipleOutputs(context);
  }
  public void?cleanup(Context context) throws IOException,InterruptedException {
    mos.close();
  }
  然后就可以用 mos.write(Key key,Value value,String baseOutputPath) 代替context.write(key, value);
  在MapClass或Reduce中使用,輸出時也會有默認的文件part-m-00*或part-r-00*,不過這些文件是無內容的,大小為0. 而且只有part-m-00*會傳給Reduce

?

? 2, 以多種格式輸出:

?

public class TestwithMultipleOutputs extends Configured implements Tool {

?

  public static class MapClass extends Mapper<LongWritable,Text,Text,IntWritable> {

?

    private MultipleOutputs<Text,IntWritable> mos;

?

    protected void setup(Context context) throws IOException,InterruptedException {
      mos = new MultipleOutputs<Text,IntWritable>(context);
    }

?

public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException{
      String line = value.toString();
      String[] tokens = line.split("-");

?

      mos.write("MOSInt",new Text(tokens[0]), new IntWritable(Integer.parseInt(tokens[1])));? //(第一處)
      mos.write("MOSText", new Text(tokens[0]),tokens[2]);    ? //(第二處)
      mos.write("MOSText", new Text(tokens[0]),line,tokens[0]+"/");   //(第三處)同時也可寫到指定的文件或文件夾中
    }

?

    protected void cleanup(Context context) throws IOException,InterruptedException {
      mos.close();
    }

?

  }
  public int run(String[] args) throws Exception {

?

    Configuration conf = getConf();

?

    Job job = new Job(conf,"word count with MultipleOutputs");

?

    job.setJarByClass(TestwithMultipleOutputs.class);

?

    Path in = new Path(args[0]);
    Path out = new Path(args[1]);

?

    FileInputFormat.setInputPaths(job, in);
    FileOutputFormat.setOutputPath(job, out);

?

    job.setMapperClass(MapClass.class);
    job.setNumReduceTasks(0);  

?

    MultipleOutputs.addNamedOutput(job,"MOSInt",TextOutputFormat.class,Text.class,IntWritable.class);
    MultipleOutputs.addNamedOutput(job,"MOSText",TextOutputFormat.class,Text.class,Text.class);

?

    System.exit(job.waitForCompletion(true)?0:1);
    return 0;
  }

  public static void main(String[] args) throws Exception {

?

    int res = ToolRunner.run(new Configuration(), new TestwithMultipleOutputs(), args);
    System.exit(res);
  }

?

}

?

測試的數據:

?

abc-1232-hdf
abc-123-rtd
ioj-234-grjth
ntg-653-sdgfvd
kju-876-btyun
bhm-530-bhyt
hfter-45642-bhgf
bgrfg-8956-fmgh
jnhdf-8734-adfbgf
ntg-68763-nfhsdf
ntg-98634-dehuy
hfter-84567-drhuk

?

結果截圖:(結果輸出到/test/testMOSout)

?

MultipleOutputFormat和MultipleOutputs

?

遇到的一個問題:

?

  如果沒有mos.close(), 程序運行中會出現異常:

?

  12/05/21 20:12:47 WARN hdfs.DFSClient: DataStreamer Exception:

  org.apache.hadoop.ipc.RemoteException:org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on
   /test/mosreduce/_temporary/_attempt_local_0001_r_000000_0/h-r-00000 File does not exist. [Lease. Holder: DFSClient_-352105532, pendingcreates: 5]

MultipleOutputFormat和MultipleOutputs


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 欧美一级一毛片 | 成人黄色一级视频 | 国产精品成人不卡在线观看 | 免费看成年人网站 | 成人综合网站 | 亚洲午夜一区 | 天天久久综合网站 | 日本中文字幕在线视频 | 国产超级乱淫视频播放 | 一级午夜a毛片免费视频 | 99伊人| 国产欧美精品一区二区三区 | 国产成人精品视频免费 | 亚洲精品国产自在久久出水 | 国产欧美性综合视频性刺激 | 91精品国产综合久久久久久丝袜 | 狠狠色婷婷丁香六月 | 欧美日韩无线码免费播放 | 91福利免费视频 | 国产亚洲精品久久精品录音 | 久久精品国产99久久6动漫亮点 | 欧美成人激情视频 | 日本午夜精品一区二区三区电影 | 成人免费淫片aa视频免费 | 成人激情视频网站 | 理论片午午伦夜理片在线播放 | 97av在线 | 日韩欧美专区 | 成人网在线| 成人国产精品免费 | 五月久久亚洲七七综合中文网 | 香蕉草草久在视频在线播放 | 性xxxxx视频 日韩在线观看视频一区 | 国产99久久精品一区二区永久免费 | 猛h辣h高h文湿快穿np | 国产无遮挡一级毛片 | 国产欧美日韩 | 久久97久久 | 一级aaaaaa片毛片在线播放 | 免费在线观看视频a | 丁香久久|