org.apache.spark:spark-avro_2.11:2.4.4 \ --conf 'spark.serializer=org.apache.spark.serializer.KryoSerializer' spark-avro 模块需要在--packages显示指定 spark-avro和spark的版本必须匹配 本示例中,由于依赖spark-avro2.11,因此使用的是scala2.11构建hudi-spark-bundle
/bin/spark-shell --packages databricks/spark-avro:0.2 Spark Packages 还为开发者建立了一个SBT插件来简化包的发布,并为发布包提供了自动地兼容性检查
后续的0.6.x版本将应用到其他的写操作以使得schema管理更为轻松,彻底避免spark-avro的转化。
Spark 或 Utilities 包在运行时不再需要额外spark-avro的包;可以删除--package org.apache.spark:spark-avro_2.1*:*选项。
Spark 或 Utilities 包在运行时不再需要额外spark-avro的包;可以删除--package org.apache.spark:spark-avro_2.1*:*选项。