oneHot
New in version 2.00.3.
语法
oneHot(obj, encodingColumns)
参数
obj 是一个内存表。
encodingColumns 是一个字符串或者字符串向量,指定用于编码的列名。
详情
对指定的列进行独热编码(one-hot),返回编码后的表,表内编码列的列名为编码列的字段特征(格式为:<原字段名>_<值>);非编码列保持不变。
例子
$ t = table( take(`Tom`Lily`Jim, 10) as name, take(true false, 10) as gender, take(21..23,10) as age);
$ oneHot(t, `name`gender);
name_Tom |
name_Lily |
name_Jim |
gender_1 |
gender_0 |
age |
---|---|---|---|---|---|
1 |
0 |
0 |
1 |
0 |
21 |
0 |
1 |
0 |
0 |
1 |
22 |
0 |
0 |
1 |
1 |
0 |
23 |
1 |
0 |
0 |
0 |
1 |
21 |
0 |
1 |
0 |
1 |
0 |
22 |
0 |
0 |
1 |
0 |
1 |
23 |
1 |
0 |
0 |
1 |
0 |
21 |
0 |
1 |
0 |
0 |
1 |
22 |
0 |
0 |
1 |
1 |
0 |
23 |
1 |
0 |
0 |
0 |
1 |
21 |