QUANTILE_STATE
description
QUANTILE_STATE
在 2.0 中我们支持了agg_state功能,推荐使用 agg_state quantile_union(quantile_state not null) 来代替本类型。
QUANTILE_STATE 不能作为 key 列使用,支持在 Aggregate 模型、Duplicate 模型和 Unique 模型的表中使用。在 Aggregate 模型表中使用时,建表时配合的聚合类型为 QUANTILE_UNION。 用户不需要指定长度和默认值。长度根据数据的聚合程度系统内控制。 并且 QUANTILE_STATE 列只能通过配套的 QUANTILE_PERCENT、QUANTILE_UNION、TO_QUANTILE_STATE 等函数进行查询或使用。
QUANTILE_STATE 是一种计算分位数近似值的类型,在导入时会对相同的 key,不同 value 进行预聚合,当 value 数量不超过 2048 时采用明细记录所有数据,当 value 数量大于 2048 时采用 TDigest (opens in a new tab) 算法,对数据进行聚合(聚类)保存聚类后的质心点。
相关函数:
QUANTILE_UNION(QUANTILE_STATE): 此函数为聚合函数,用于将不同的分位数计算中间结果进行聚合操作。此函数返回的结果仍是 QUANTILE_STATE
TO_QUANTILE_STATE(DOUBLE raw_data [,FLOAT compression]): 此函数将数值类型转化成 QUANTILE_STATE 类型 compression 参数是可选项,可设置范围是[2048, 10000],值越大,后续分位数近似计算的精度越高,内存消耗越大,计算耗时越长。 compression 参数未指定或设置的值在[2048, 10000]范围外,以 2048 的默认值运行
QUANTILE_PERCENT(QUANTILE_STATE, percent): 此函数将分位数计算的中间结果变量(QUANTILE_STATE)转化为具体的分位数数值
example
select QUANTILE_PERCENT(QUANTILE_UNION(v1), 0.5) from test_table group by k1, k2, k3;
notice
使用前可以通过如下命令打开 QUANTILE_STATE 开关:
$ mysql-client > admin set frontend config("enable_quantile_state_type"="true");
这种方式下 QUANTILE_STATE 开关会在 Fe 进程重启后重置,或者在 fe.conf 中添加enable_quantile_state_type=true
配置项可永久生效。
keywords
QUANTILE_STATE, QUANTILE_UNION, TO_QUANTILE_STATE, QUANTILE_PERCENT