Классификатор обращений, документов или сообщений может работать хорошо, но при этом получать лишние персональные данные: телефоны, email, адреса, ФИО и номера документов.

AI-автоматизация должна помогать, а не создавать лишний риск. Если для классификации не нужны персональные поля, их лучше скрывать до обработки.

Коротко: нужно отделить полезный смысл текста от чувствительных данных и добавить слой маскирования.

Почему возникает проблема

Разработчики часто отправляют в модель весь текст, потому что так проще. Но для определения темы обращения обычно не нужен полный телефон, адрес или номер договора.

Что проверить сначала

  • какие данные уходят в классификатор
  • какие поля реально нужны для результата
  • есть ли логирование сырых запросов
  • где хранится ответ модели
  • можно ли маскировать данные до отправки

Как я решаю такую задачу

Я проектирую AI-процесс так, чтобы модель получала минимум необходимой информации.

  • анализирую входные данные
  • определяю чувствительные поля
  • добавляю маскирование до классификации
  • проверяю качество результата после маскирования
  • ограничиваю хранение сырых текстов

Что подготовить для оценки

  • ссылку на страницу, панель или систему
  • что именно должно происходить в норме
  • пример ошибки или скриншот
  • когда проблема появилась
  • тестовый доступ без лишних прав, если он нужен

Каким должен быть результат

Классификатор должен сохранять качество, но не получать персональные данные там, где они не нужны.

Чего лучше не делать

Не отправляйте в AI весь дамп CRM или чата без фильтрации. Сначала нужно понять, какие поля действительно нужны.

FAQ

Можно ли исправить без полной переделки?

Чаще всего да. Я сначала ищу точную причину сбоя и предлагаю минимальную правку, которая не ломает рабочую часть проекта.

Что нужно прислать для оценки?

Нужны ссылка или описание системы, пример ошибки, время появления проблемы и доступ к той части, где можно безопасно проверить причину.

Как понять, что задача решена?

Должен быть повторяемый тест: до правки ошибка воспроизводится, после правки сценарий проходит стабильно и результат можно проверить без догадок.

Нужна похожая задача?

Напишите в Telegram @rabotator_support или оставьте заявку на сайте. Пришлите ссылку, пример ошибки и коротко опишите, как должно работать. Я посмотрю задачу, предложу план и скажу, какие доступы понадобятся.

Итог

AI-классификация становится безопаснее, когда чувствительные данные маскируются до обработки.