数据仓库服务 GAUSSDB(DWS)-CREATE TEXT SEARCH CONFIGURATION:参数说明

时间:2023-11-10 17:34:10

参数说明

  • name

    要创建的文本搜索配置的名称。该名称可以有模式修饰。

  • parser_name

    用于该配置的文本搜索分析器的名称。

  • source_config

    要复制的现有文本搜索配置的名称。

  • configuration_option

    文本搜索配置的配置参数,主要是针对parser_name执行的解析器,或者source_config隐含的解析器而言的。

    取值范围:目前共支持default、ngram、zhparser三种类型的解析器,其中default类型的解析器没有对应的configuration_option,ngram、zhparser类型解析器对应的configuration_option如表1所示。
    表1 ngram、zhparser类型解析器对应的配置参数

    解析器

    配置参数

    参数描述

    取值范围

    ngram

    gram_size

    分词长度。

    正整数,1~4

    默认值:2

    punctuation_ignore

    是否忽略标点符号。

    • true(默认值):忽略标点符号。
    • false:不忽略标点符号。

    grapsymbol_ignore

    是否忽略图形化字符。

    • true:忽略图形化字符。
    • false(默认值):不忽略图形化字符。

    zhparser

    punctuation_ignore

    分词结果是否忽略所有的标点等特殊符号(不会忽略\r和\n)。

    • true(默认值):忽略所有的标点等特殊符号。
    • false:不忽略所有的标点等特殊符号。

    seg_with_duality

    是否将闲散文字自动以二字分词法聚合。

    • true:将闲散文字自动以二字分词法聚合。
    • false(默认值):不将闲散文字自动以二字分词法聚合。

    multi_short

    分词执行时是否执行针对长词复合切分。

    • true(默认值):执行针对长词复合切分。
    • false:不执行针对长词复合切分。

    multi_duality

    设定是否将长词内的文字自动以二字分词法聚合。

    • true:将长词内的文字自动以二字分词法聚合。
    • false(默认值):不将长词内的文字自动以二字分词法聚合。

    multi_zmain

    是否将重要单字单独显示。

    • true:将重要单字单独显示。
    • false(默认值):不将重要单字单独显示。

    multi_zall

    是否将全部单字单独显示。

    • true:将全部单字单独显示。
    • false(默认值):不将全部单字单独显示。
support.huaweicloud.com/sqlreference-dws/dws_06_0182.html