Цитаты из документов

31 января 2019

ID 112683

Kaspersky Security позволяет проверять текст в файлах, передаваемых и хранящихся на SharePoint на наличие в нем цитат из конфиденциальных документов. Категория Цитаты из документов позволяет задавать список документов, цитаты из которых программе требуется обнаружить.

Для обнаружения цитат Kaspersky Security задействует технологию Цифровых отпечатков (англ. Digital Fingerprints), при которой программа преобразует текстовые данные в цифровые фрагменты.

При отслеживании утечек программа сравнивает фрагменты в проверяемых файлах с фрагментами, хранящимися в категории. Для обнаружения цитат программе требуется распознать Минимальное количество совпадающих фрагментов.

Программа не хранит в категории исходные документы или части этих документов. На основании фрагментов невозможно восстановить или прочитать исходные документы, добавленные в категорию, или части этих документов.

Настройка категории

Параметр Минимальное количество совпадающих фрагментов определяет количество фрагментов из добавленных в категорию документов, достаточное для того, чтобы по категории была зафиксирована утечка данных.

Значение этого параметра, установленное по умолчанию (4 фрагмента), обеспечивает оптимальную работу категории с большинством документов.

Значение параметра, настроенное по умолчанию, рекомендуется изменять в следующих случаях:

  • Если проверяемые документы вызывают ложно-положительные срабатывания (программа создает инциденты при проверке документов, которые по вашему мнению, не содержат цитат из документов, добавленных в категорию). Для настройки категории рекомендуется увеличить значение параметра.

    Ложно-положительные срабатывания могут возникать, если в исходном и проверяемом документах содержатся большие участки неизменяемого текста, который повторяется в разных документах (например, общий текст в колонтитулах). В таком случае заданное количество совпадающих фрагментов может приходиться на такой повторяющийся текст, что приведет к ложно-положительному срабатыванию.

  • Если цитаты в проверяемых документах не выявляются (программа не создает инциденты при проверке документов, которые, по вашему мнению, содержат цитаты из документов, добавленных в категорию). Для настройки категории рекомендуется уменьшить значение параметра.

Рекомендуется загружать в одну категорию документы примерно одинакового размера. Для документов, различающиеся более чем в 2-3 раза, рекомендуется создавать отдельные категории. В противном случае поиск цитат по документам в категории может работать не оптимально.

Если вам не удается подобрать для категории оптимальное значение параметра Минимальное количество совпадающих фрагментов, рекомендуется распределить документы из этой категории по нескольким категориям таким образом, чтобы в каждой категории содержались документы с примерно одинаковым количеством фрагментов в них.

Сценарий проверки цитирования документов

  1. Добавьте категорию с цитатами из документов и настройте ее параметры.
  2. Используйте категорию для проверки цитат одним из следующих способов:

Вам помогла эта статья?
Что нам нужно улучшить?
Спасибо за ваш отзыв, вы помогаете нам становиться лучше!
Спасибо за ваш отзыв, вы помогаете нам становиться лучше!