MAPREDUCE服务 MRS-Spark常用配置参数:Spark Streaming
Spark Streaming
Spark Streaming是在Spark批处理平台提供的流式数据的处理能力,以“mini-batch”的方式处理从外部输入的数据。
在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”文件中配置如下参数。
参数 |
描述 |
取值示例 |
---|---|---|
spark.streaming.receiver.writeAheadLog.enable |
启用预写日志(WAL)功能。所有通过Receiver接收的输入数据将被保存至预写日志,预写日志可以保证Driver程序出错后数据可以恢复。 |
false |
spark.streaming.unpersist |
由Spark Streaming产生和保存的RDDs自动从Spark的内存中强制移除。Spark Streaming接收的原始输入数据也将自动清除。设置为false时原始输入数据和存留的RDDs不会自动清除,因此在streaming应用外部依然可以访问,但是这会占用更多的Spark内存。 |
true |