distinct
语法
distinct(X)
参数
X 是一个向量或数组向量类型。
详情
只返回向量 X 中不相同的元素,如果有两个或以上的相同元素,将只返回一个。结果中返回的顺序不保证和原来的向量相同。
例子
$ distinct 4 5 5 2 3;
[3,2,5,4]
$ a = array(INT[], 0, 10).append!([1 2 3, 4 5, 6 7 8, 9 10])
$ distinct(a)
[10,9,8,7,6,5,4,3,2,1]
$ t=table(3 1 2 2 3 as x);
$ select distinct x from t;
distinct_x |
---|
2 |
1 |
3 |
$ select sort(distinct(x)) as x from t;
x |
---|
1 |
2 |
3 |
函数 distinct 返回一个向量,而函数 set 返回一个集合。
$ x=set(4 5 5 2 3);
$ x;
set(3,2,5,4)
$ x.intersection(set(2 5));
set(2,5)
在内存表或分布式表中,distinct函数可以和group by配合使用,每个分组的结果为一个数组向量。
$ dbName = "dfs://testdb"
$ if(existsDatabase(dbName)){
$ dropDatabase(dbName)
$ }
$ db=database("dfs://testdb", VALUE, 2012.01.11..2012.01.29)
$ n=100
$ t=table(take(2012.01.11..2012.01.29, n) as date, symbol(take("A"+string(21..60), n)) as sym, take(100, n) as val)
$ pt=db.createPartitionedTable(t, `pt, `date).append!(t)
$ result=select distinct(date) from pt group by sym
$ select sym, distinct_date from result where sym=`A21
sym |
distinct_date |
---|---|
A21 |
[2012.01.15,2012.01.13,2012.01.11] |