如何从pyspark连接到teradata?

guicsvcw  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(406)

我正在尝试从pyspark连接teradata和db2。
我正在使用以下jar:
tdgssconfig-15.10.00.14.jar文件
teradata-connector-1.4.1.jar
terajdbc4-15.10.00.14.jar和db2jcc4.jar
连接字符串:

df1 = sqlContext.load(source="jdbc", driver="com.teradata.jdbc.TeraDriver", url=db_url,user="db_user",TMODE="TERA",password="db_pwd",dbtable="U114473.EMPLOYEE")

df = sqlContext.read.format('jdbc').options(url='jdbc:db2://10.123.321.9:50000/DB599641',user='******',password='*****',driver='com.ibm.db2.jcc.DB2Driver', dbtable='DSN1.EMPLOYEE')

两者都给了我驱动程序找不到的错误。
我们可以为pyspark使用jdbc驱动程序吗?

gz5pxeao

gz5pxeao1#

正如jamestobin所说,在开始pyspark会话或将py提交给spark时,使用pyspark2--jars/jarpath选项

相关问题