extractTextSchema
语法
extractTextSchema(filename, [delimiter], [skipRows=0])
参数
filename 字符串,表示输入数据的绝对路径或相对路径。
delimiter 字符串标量,表示数据文件中列的分隔符。分隔符可以是一个或多个字符,默认为逗号(’,’)。
skipRows 是0到1024之间的整数,表示从文件头开始忽略的行数。它是一个可选参数。默认值为0。
详情
生成输入数据文件的表的结构。表的结构有两列:列名和数据类型。
- 数据文件中包含了表达时间、日期的数据时:
满足分隔符要求的这部分数据(日期数据分隔符包含”-”、”/”和”.”,时间数据分隔符为”:”)会转换为相应的类型。例如,”12:34:56”转换为SECOND类型;”23.04.10”转换为DATE类型。
对于不包含分隔符的数据,形如”yyMMdd”的数据同时满足0<=yy<=99,0<=MM<=12,1<=dd<=31,会被优先解析成DATE;形如”yyyyMMdd”的数据同时满足1900<=yyyy<=2100,0<=MM<=12,1<=dd<=31会被优先解析成DATE。
注意:从 1.30.22/2.00.10 版本开始,extractTextSchema
支持一条记录中包含多个换行符的数据文件。
例子
$ n=1000000
$ timestamp=09:30:00+rand(18000,n)
$ ID=rand(100,n)
$ qty=100*(1+rand(100,n))
$ price=5.0+rand(100.0,n)
$ t1 = table(timestamp,ID,qty,price)
$ saveText(t1, "/home/DolphinDB/Data/t1.txt")
$ schema=extractTextSchema("/home/DolphinDB/Data/t1.txt");
$ schema;
name |
type |
---|---|
timestamp |
SECOND |
ID |
INT |
qty |
INT |
price |
DOUBLE |