apache-spark - 运行名为 KafkaWordCount 的 Kafka 和 Spark Streaming 示例失败

Question

我研究了http://rishiverma.com/software/blog/2014/07/31/spark-streaming-and-kafka-quickstart/上的名为 KafkaWordCount 的示例

顺便说一句，我修改了一些无关紧要的细节。而当我到最后一步构建Kafka消费者时，它失败了，并说：

Exception in thread "main" org.apache.spark.SparkException: Could not parse Master URL: 'localhost:2181'
at org.apache.spark.SparkContext$.org$apache$spark$SparkContext$$createTaskScheduler(SparkContext.scala:1493)
at org.apache.spark.SparkContext.<init>(SparkContext.scala:279)
at org.apache.spark.streaming.StreamingContext$.createNewSparkContext(StreamingContext.scala:542)
at org.apache.spark.streaming.StreamingContext$.createNewSparkContext(StreamingContext.scala:555)
at org.apache.spark.streaming.StreamingContext.<init>(StreamingContext.scala:92)
at org.apache.spark.streaming.examples.KafkaWordCount$.main(KafkaWordCount.scala:54)
at org.apache.spark.streaming.examples.KafkaWordCount.main(KafkaWordCount.scala)

有人遇到过这种失败吗？

score 2 · Accepted Answer

您使用的是哪个版本的 Spark？在 Spark 1.0+ 中，KafkaWordCount 位于org.apache.spark 下。examples.streaming包。从您的堆栈跟踪来看，您的版本似乎在org.apache.spark 下。streaming.examples，这表明您使用的是 1.0 之前的 Spark 版本。

在 Spark 0.9.x（在引入 SparkConf 和 spark-submit 之前发布）中，此示例的第一个参数是 Spark 主 URL（source），导致您看到的问题，因为“无法解析主URL”错误表明这local:2181不是有效的 Spark 主 URL。

如果可以，我建议使用更新版本的 Spark（您链接的教程建议使用 Spark 1.0.1 或更高版本）。否则，请按照特定版本的 KafkaWordCount（示例）顶部的说明进行操作。

apache-spark - 运行名为 KafkaWordCount 的 Kafka 和 Spark Streaming 示例失败

1 回答 1

Related

Reference