MapReduce服务 MRS-准备初始数据:规划MapReduce统计样例程序数据

时间:2023-11-01 16:19:45

规划MapReduce统计样例程序数据

将待处理的日志文件放置在HDFS系统中。

  1. 在Linux系统中新建文本文件,将待处理的数据复制到文件中。例如将典型场景说明中log1.txt中的内容复制保存到input_data1.txt,将log2.txt中的内容复制保存到input_data2.txt。
  2. 在HDFS上建立一个文件夹“/tmp/input”,并上传input_data1.txt,input_data2.txt到此目录,操作如下:

    1. 执行以下命令进入HDFS客户端目录并认证用户。

      cd HDFS客户端安装目录

      source bigdata_env

      kinit 组件业务用户 (该用户需要具有操作HDFS的权限,首次认证需要修改密码)

    2. 执行以下命令创建“/tmp/input”目录。

      hdfs dfs -mkdir /tmp/input

    3. 执行以下命令将已准备好的文件上传至HDFS客户端的“/tmp/input”目录下。

      hdfs dfs -put local_filepath/input_data1.txt /tmp/input

      hdfs dfs -put local_filepath/input_data2.txt /tmp/input

support.huaweicloud.com/devg3-mrs/mrs_07_150035.html