testbook

存储格式和SerDe

在Inceptor中,行格式和文件格式决定了表的存储格式。表的行格式和文件格式在建表时分别用ROW FORMAT和STORED AS选项指定:

CREATE TABLE table_name (col_name1 data_type1, col_name2 data_type2, ...)
[ROW FORMAT row_format]
[STORED AS file_format]

行格式
行格式决定了行和行中字段的存储格式。在Inceptor中,行格式由SerDe定义。SerDe指Serializer-Deserializer,也就是序列器-反序列器。作为一个序列器,SerDe会将表中数据从用于Inceptor内部处理格式序列化为输出文件中的格式。作为一个反序列器,SerDe会将文件中数据的格式反序列化为Inceptor内部可以处理的格式。

文件格式
文件格式决定了表文件的存储格式。Inceptor支持纯文本, RC和ORC格式的文件。