Kaspersky Security позволяет выявлять документы, которые были созданы на основе шаблонов и макетов и могут содержать конфиденциальные данные. Категория Шаблоны документов позволяет задавать список шаблонов документов, совпадения с которыми программа будет отслеживать в проверяемых документах.
Для обнаружения совпадений с шаблонами Kaspersky Security задействует технологию Цифровых отпечатков (англ. Digital Fingerprints), при которой программа преобразует текстовые данные в цифровые фрагменты.
При отслеживании утечек программа сравнивает фрагменты в проверяемых сообщениях электронной почты с фрагментами, хранящимися в категории. Вы можете настроить Порог совпадения документов для решения следующих задач:
Программа не хранит в категории исходные документы или части этих документов. На основании фрагментов невозможно восстановить или прочитать исходные документы, добавленные в категорию, или части этих документов.
Настройка категории
Порог совпадения документов определяет уровень совпадения проверяемого документа с шаблоном, загруженным в категорию, при котором программа фиксирует утечку данных по этой категории. Этот уровень задается двумя параметрами: минимальным и максимальным процентом совпадения фрагментов.
Минимальный процент совпадения фрагментов задает минимальную допустимую схожесть проверяемого текста и шаблона. Если проверяемый текст соответствует шаблону в меньшей степени, чем значение этого параметра, программа не фиксирует утечку данных по категории.
Максимальный процент совпадения фрагментов задает максимальную схожесть шаблона и проверяемого текста. Если проверяемый текст соответствует шаблону в большей степени, чем значение этого параметра, программа не фиксирует утечку данных по категории.
Значение этих параметров, установленное по умолчанию (30% и 99% схожести), обеспечивает оптимальную работу категории с большинством документов. В некоторых случаях может потребоваться настройка этих параметров.
Минимальный процент совпадения фрагментов рекомендуется изменять в следующих случаях:
Максимальный размер совпадающей последовательности фрагментов рекомендуется изменять в следующих случаях:
Рекомендуется загружать в одну категорию документы примерно одинакового размера. Для документов, различающиеся более чем в 2-3 раза, рекомендуется создавать отдельные категории. В противном случае выявление совпадений с шаблонами, загруженными в категорию, может работать не оптимально.
Если вам не удается подобрать для категории оптимальные значения минимального и максимального процента совпадения фрагментов, рекомендуется распределить шаблоны из этой категории по нескольким категориям таким образом, чтобы в каждой категории содержались шаблоны с примерно одинаковой структурой и размером файла.
Сценарий проверки совпадений с документами
Программа будет проверять документы, пересылаемые по электронной почте, на наличие совпадений с образцами документов в категории.