Índice:

Quais são os principais parâmetros de configuração que o usuário precisa especificar para executar o trabalho MapReduce?
Quais são os principais parâmetros de configuração que o usuário precisa especificar para executar o trabalho MapReduce?

Vídeo: Quais são os principais parâmetros de configuração que o usuário precisa especificar para executar o trabalho MapReduce?

Vídeo: Quais são os principais parâmetros de configuração que o usuário precisa especificar para executar o trabalho MapReduce?
Vídeo: Modelagem de Programação MapReduce 2024, Novembro
Anonim

Os principais parâmetros de configuração que os usuários precisam especificar na estrutura “MapReduce” são:

  • Empregos locais de entrada no sistema de arquivos distribuído.
  • Empregos local de saída no sistema de arquivos distribuído.
  • Formato de entrada de dados.
  • Formato de saída de dados.
  • Classe contendo a função de mapa.
  • Classe contendo a função de redução.

Aqui, quais são os principais parâmetros de configuração em um programa MapReduce?

Os principais parâmetros de configuração na estrutura “MapReduce” são:

  • Insira a localização dos trabalhos no sistema de arquivos distribuído.
  • Local de saída dos jobs no sistema de arquivos distribuído.
  • O formato de entrada dos dados.
  • O formato de saída dos dados.
  • A classe que contém a função de mapa.
  • A classe que contém a função de redução.

Também se pode perguntar: quais são os parâmetros dos mapeadores e redutores? Os quatro parâmetros para mapeadores são:

  • LongWritable (entrada)
  • texto (entrada)
  • texto (saída intermediária)
  • IntWritable (saída intermediária)

Também a questão é: quais são os principais componentes do trabalho MapReduce?

  • Classe principal do driver que fornece parâmetros de configuração do trabalho.
  • Classe de mapeador que deve estender org. apache. hadoop. mapreduce. A classe Mapper e fornece implementação para o método map ().
  • Classe de redutor que deve estender org. apache. hadoop. mapreduce. Classe redutor.

O que é particionador e como ele ajuda no processo de trabalho do MapReduce?

Particionador no Trabalho de MapReduce a execução controla o particionamento das chaves das saídas de mapa intermediárias. Com o ajuda da função hash, chave (ou um subconjunto da chave) deriva o partição . Registros como tendo o mesmo valor-chave vão para o mesmo partição (dentro de cada mapeador).

Recomendado: