管理数据积累动态

卡巴斯基容器安全组件运行会导致大量数据积累,需要相当大的磁盘空间资源进行存储。您可以通过限制存储期限和清理数据库来管理数据积累的动态。

解决方案的以下组件对磁盘空间的负载最大:

PostgreSQL DBMS

我们建议您联系解决方案部署工程师或技术支持,使用端口转发选项和vacuum命令连接到 PostgreSQL DBMS。

您可以通过调整资源最密集的数据(扫描结果和事件日志)的存储期限来降低数据库满载的风险。为此,在中间件(kcs-middleware)部署期间必须指定以下变量的值:

变量值以小时为单位表示,最小允许值为1 小时。默认值为 2160 小时(90 天)。

在使用经过调整的指定变量的值部署中间件之前,必须停止中间件(kcs-middleware)和代理经纪(kcs-ab)的运行。否则,这些组件在清理时会继续处理数据,并可能阻碍这一过程。

在不需要数据完整性和一致性、甚至可能丢失数据的测试(试点)基础设施中,您可以使用更快的清理方法。为此,您必须删除 PostgreSQL PV 并在没有数据的情况下再次创建 PostgreSQL PV。创建的持久卷可以是相同大小,也可以更大。

S3 兼容文件存储

解决方案仅使用与 s3 兼容的文件存储来存储报告文件。

为了在存储已满时清理存储,集群管理员必须执行以下操作:

  1. 使用端口转发选项连接到 Minio 文件存储组件(kcs-s3)。
  2. 下载所有报告,如有必要,将其保存在另一个地方以供进一步存储。
  3. 删除数据。

如有必要,您可以使用标准集群工具增加持久卷。

ClickHouse DBMS

解决方案的 Clickhouse 数据库中表的设置需要不断清除。如果基础设施中的负载非常高,资源可能没有时间被清理。在此情况下,您可以使用标准集群工具增加持久卷。

数据存储和检索时间在事件代理组件的环境变量中设置,该组件可处理 ClickHouse 中的数据。下表列出了事件代理组件的环境变量及其最小值、最大值和默认值。

事件代理组件的环境变量

变量

描述

最小值

最大值

默认值

MAIN_STORAGE_TIME

主要数据卷的存储时长。

以分钟为单位。

60

720

60

INCIDENT_STORAGE_TIME

事件和相关数据的存储时长。

以天为单位。

2

90

2

COLLECTION_INTERVAL

事件发生后事件相关数据的存储时长。

以分钟为单位。

使用以下公式进行计算:

MAIN_STORAGE_TIME + 60

840

120

您必须使用解决方案基础设施框架内批准的第三方工具独立组织对可用磁盘空间及其使用动态的监控。

页首