我正在尝试使用 pyspark 连接到数据库,并且使用以下代码:
sqlctx = SQLContext(sc)
df = sqlctx.load(
url = "jdbc:postgresql://[hostname]/[database]",
dbtable = "(SELECT * FROM talent LIMIT 1000) as blah",
password = "MichaelJordan",
user = "ScottyPippen",
source = "jdbc",
driver = "org.postgresql.Driver"
)
我收到以下错误:
知道为什么会发生这种情况吗?
Edit:我正在尝试在我的计算机本地运行代码。
从以下位置下载 PostgreSQL JDBC 驱动程序https://jdbc.postgresql.org/download/ https://jdbc.postgresql.org/download/
然后将数据库配置值替换为您的数据库配置值。
from pyspark.sql import SparkSession
spark = SparkSession \
.builder \
.appName("Python Spark SQL basic example") \
.config("spark.jars", "/path_to_postgresDriver/postgresql-42.2.5.jar") \
.getOrCreate()
df = spark.read \
.format("jdbc") \
.option("url", "jdbc:postgresql://localhost:5432/databasename") \
.option("dbtable", "tablename") \
.option("user", "username") \
.option("password", "password") \
.option("driver", "org.postgresql.Driver") \
.load()
df.printSchema()
更多信息:https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html https://spark.apache.org/docs/latest/sql-data-sources-jdbc.html
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)