一个典型的hive如下:
1 | CREATE EXTERNAL TABLE `model.unbounded_dmp_ad_tables_jd2_imei_test`( |
重点说明如下:
- 因为每个csv文件都带有header,所以使用
'skip.header.line.count'='1'
来跳过header行。 - 字段间分隔符使用’\u0001’,使用pyspark时分隔符为sep=”\x01”
Coding My Life
一个典型的hive如下:
1 | CREATE EXTERNAL TABLE `model.unbounded_dmp_ad_tables_jd2_imei_test`( |
重点说明如下:
'skip.header.line.count'='1'
来跳过header行。