
Apache Spark
的结构化数据
API
|
43
类型与
Scala
数据类型的对应关系。
表3-4:Spark结构化数据类型与Scala数据类型
数据类型 Scala中对应的数据类型 用于实例化的API
BinaryType Array[Byte] DataTypes.BinaryType
TimestampType java.sql.Timestamp DataTypes.TimestampType
DateType java.sql.Date DataTypes.DateType
ArrayType scala.collection.Seq DataTypes.createArrayType(ElementType)
MapType scala.collection.Map DataTypes.createMapType(keyType, valueType)
StructType org.apache.spark.sql.Row StructType(ArrayType[fieldTypes])
StructField
表示字段类型定义的值
StructField(name, dataType, [nullable])
表
3-5
列出了
Spark
所支持的结构化数据类型及其对应的
Python
数据类型。
表3-5:Spark结构化数据类型与Python数据类型
数据类型 Python中对应的数据类型 用于实例化的API
BinaryType bytearray BinaryType()
TimestampType ...