SparkSession(またはHiveContextまたはSQLContext)を使い始めるSpark SQLの依存関係Sparkの依存関係を管理するハイブJARを避けるスキーマの基本データフレームAPI変貌複数データフレームの変換古いSQLクエリとHiveデータとの対話データフレームとデータセットでのデータ表現タングステンデータの読み込みと保存関数DataFrameWriterとDataFrameReader形式セーブモードパーティション(ディスカバリーとライティング)データセットRDD、DataFrame、ローカル・コレクションとの相互運用性コンパイル時の強い型付けより簡単な関数(RDD「のような」)変換関係性の変革マルチデータセット・リレーショナル変換データセットに対するグループ化演算子ユーザ定義関数と集約関数(UDF、UDAF)による拡張クエリ・オプティマイザ論理的プランと物理的プランコード生成大規模クエリプランと反復アルゴリズムSpark SQLクエリのデバッグJDBC/ODBCサーバ結論