负责模块相关配置参数

hdfs句柄缓存模块

参数名 说明 参数类型 默认值 参数值范围
file_handle_cache_bucket_num 文件句柄缓存使用的分桶数量,用于减少并发时的冲突. int32 64 [4, 256]
file_handle_cache_enable 文件句柄缓存开关,设置是否使用文件句柄缓存. bool true true/false
file_handle_cache_num 文件句柄缓存最大可缓存的文件句柄的数量.file_handle_cache_enable为true时有效. int32 100000 [10000, 1000000]
file_handle_cache_swapout_timeout 文件句柄缓存中未被使用的句柄最长可保留的时间. int64 21600 [1h, 1d]
参数名 说明 参数类型 默认值 参数值范围
num_file_handle_cache_partitions 文件句柄缓存使用的分区数量(用于将句柄缓存拆成多个分区). uint64 16 [1, uint64_max]
cache_file_handle 文件句柄缓存开关,设置是否使用文件句柄缓存. bool true true/false
max_cached_file_handles 文文件句柄缓存最大可缓存的文件句柄的数量. uint64 20000 [0, uint64_max]
unused_file_handle_timeout_sec 文件句柄缓存中未被使用的句柄最长可保留的时间(秒). uint64 21600 [0, uint64_max]

LOB模块

参数名 说明 参数类型 默认值 参数值范围
compaction_lob_file_valid_threshold 每个lob数据文件中允许无效的lob个数占总lob个数的比例小于该比例. double 0.5 (0, 1]
compaction_lob_tiny_file_num_threshold compaction时,LOB微小文件必须进行compaction的数据阈值.微小文件的数量超过该值时,也必须进行compaction. int32 50 [1, 100]
compaction_lob_tiny_file_size_threshold lob compaction的时候,LOB文件大小小于该临界值的文件认为是小文件. int64 1073741824 [128MB, 4GB]
lob_index_cache_num LOB Writer中的索引Cache的数量.用于写入LOB数据. int32 1024 [128, 4096]
lob_insert_cache_size 内部表加载时,用于拷贝LOB数据的缓存大小. int32 1048576 [1MB, 2GB)
max_lob_size LOB类型支持最大数据长度. int64 4294967296 [16MB, 8GB]
lob_compression_type LOB数据文件中的压缩类型.uncompressed: 表示不压缩;lz4: 表示lz4. string uncompressed uncompresse,lz4
参数名 说明 参数类型 默认值 参数值范围
lob_delete_factor 每个lob数据文件中允许无效的lob个数占总lob个数的比例小于该比例. double 0.5 (0, 1]
lob_compaction_small_files_cnt LOB小文件的数量达到该临界值的时候,也需要进行compaction. int32 50 [1, 100]
lob_compaction_small_file_size lob compaction的时候,LOB文件大小小于该临界值的文件认为是小文件. int64 1073741824
[128MB, 4GB]
lob_writer_cache_index_cnt 每一个lob Writer缓存的lob索引的数量. int32 1024 [128, 4096]
lob_copy_data_length local insert时候,拷贝数据需要的缓存长度. int32 1048576 [1MB, 2GB)
lob_max_data_size lob类型支持最大数据长度为4G. int64 4294967296 [16MB, 8GB]
lob_compressionType lob数据压缩方式,默认0:表示不压缩,1:表示lz4. int32 0 {0, 1}

动态参数模块

参数名 说明 参数类型 默认值 参数值范围
parameter_setting_sync_timeout 动态参数设定的同步超时时间.如果超时,则不再等待其他节点的同步状态,可能导致其他节点使用的参数不是最新值. int32 5
[1, 100]
参数名 说明 参数类型 默认值 参数值范围
param_update_timeout 参数修改指令单个节点超时时间,单位s. int32 5 [1, 100]

数据缓存模块

参数名 说明 参数类型 默认值 参数值范围
consistent_hashing_min_virtual_node_count 数据缓存节点选择时一致性哈希的最小虚拟节点数. int32 1000 (0,5000)
local_data_cache_dir 配置缓存数据的存储目录的绝对路径和每个目录的容量大小的字符串,不同路径使用英文逗号隔开,使用英文冒号分割路径和容量大小,例如: data/0,/data/1:1TB.代表缓存最大2TB,/data/0 和 /data/1分别最大1TB. 请注意,主机上每个CirroData进程必须有唯一的数据缓存目录.默认为空,代表禁用. string [4KB,4TB]
local_data_cache_enable 是否为远程读开启数据缓存.若需要启用数据缓存,则同时需要配置local_data_cache_dir参数. bool false true/false
local_data_cache_file_max_size 缓存文件在停止追加数据前可以增加到的最大值,建议与配置的缓存存储目录空间大小保持一致. string 1099511627776 [4KB,4TB]
local_data_cache_max_file_num 允许打开的最大文件数,不能小于指定数据缓存目录的数量.若有两个存储目录,则每个存储目录下最大可打开文件数为n/2. int32 1000
[数据缓存存储目录个数,int32_max]
local_data_cache_write_thread_num 每个数据缓存目录允许插入数据的并发线程数. int32 1 (0,int32_max]
local_data_cache_policy 本地数据缓存策略.NO_CACHE: 不进行本地缓存 AUTO_CACHE: 自动选择节点进行缓存(最多选择两个) GLOBAL_CACHE: 所有节点都可以缓存 string auto_cache no_cache,auto_cache,global_cache

对象存储

参数名 说明 参数类型 默认值 参数值范围
s3_block_size S3存储使用的虚拟块大小, CSV并发扫描时使用. int32 268435456(256MB) (0, 231-1]
s3_multipart_chunk_size S3分批上传的批次大小, S3上传较大数据文件支持分批上传, 小于单批次大小的文件直接上传. int32 157286400(150MB)
[5242880, 231-1]

hadoop s3a core-site.xml配置

参数名 说明 参数类型 默认值 参数值范围
hadoop.tmp.dir
fs.s3a.access.key
fs.s3a.secret.key
fs.s3a.endpoint
fs.s3a.block.size
fs.s3a.multipart.size
fs.s3a.impl
fs.s3a.connection.ssl.enabled
fs.s3a.buffer.dir
fs.s3a.fast.upload
fs.s3a.multipart.threshold
fs.s3a.fast.upload.buffer