我在spark中使用以下代码将hbase/phoenix表的指定列加载到sparkDataframe中。我可以指定要加载的列,但可以指定要加载的行吗?还是必须加载所有行?
import org.apache.hadoop.conf.Configuration
import org.apache.spark.SparkContext
import org.apache.spark.sql.SQLContext
import org.apache.phoenix.spark._
sc.stop()
val sc = new SparkContext("local", "phoenix-test")
val df = sqlContext.phoenixTableAsDataFrame(
"TABLENAME", Array("ROWKEY", "CF.COL1","CF.COL2","CF.COL3"), conf = configuration
)
暂无答案!
目前还没有任何答案,快来回答吧!