
Spark SQL
与
DataFrame
:
读写外部数据源
|
131
right
、
right_outer
、
left_semi
和
left_anti
。若想了解更多信息,可以查阅文档(该文
档同时适用于
Scala
和
Python
)。
以下代码示例展示了如何对
airports_na
和
foo
这两个
DataFrame
进行默认的
inner
连接
操作。
// Scala代码
foo.join(
airports.as('air),
$"air.IATA" === $"origin"
).select("City", "State", "date", "delay", "distance", "destination").show()
# Python代码
# 连接航班延误数据(foo)与机场信息
foo.join(
airports,
airports.IATA == foo.origin
).select("City", "State", "date", "delay", "distance", "destination").show()
-- SQL查询
spark.
sql
("""
SELECT a.City, a.State, f.date, f.delay, f.distance, f.destination
FROM foo f
JOIN airports_na a
ON a.IATA = f.origin
""").
show
()
前面的代码允许你查看
DataFrame
foo