Нейросети отменили приватность
Искусственный интеллект учится на личных данных пользователей: запоминает привычки, предпочтения, даже стиль речи, анализирует почту и файлы на устройстве. Но это не страшно

То, что личные данные — наши письма и в целом все, что мы делаем на своих компьютерах и смартфонах, — станут «кормом» для языковых моделей, было вопросом времени. Тем не менее пользователи вздрагивают от каждой новости по этой теме и готовы даже судиться с разработчиками нейросетей.
Совсем недавно, в июне 2026 года, министр цифровых технологий Японии выступил с предложением об изменении закона о защите персональных данных. Суть предлагаемых поправок — разрешить разработчикам обучать ИИ на чувствительной информации (например, на медицинских или криминальных протоколах) без согласия граждан. Власти объясняют это необходимостью не отставать в технологической гонке. Инициатива вызвала споры в японском парламенте: противники нововведения опасаются утечек и злоупотреблений.
В конце 2025 года в Калифорнии американцы подали коллективный иск против Google: компания включила ИИ-помощника Gemini в сервисах Gmail, Google Chat и Google Meet по умолчанию. Для людей это стало тревожным звоночком: теперь все их личные переписки и вложения — включая сканы паспортов, банковскую, медицинскую и служебную информацию — могут оказаться доступными третьим лицам. И хотя Google заявляет, что не обучает Gemini на таких данных, а лишь использует их для умных функций, истцов возмутило, что опцию отключения спрятали глубоко в настройках конфиденциальности, из-за чего многие не смогли ее найти.
Куда уходят данные
«Крупные корпорации десятилетиями собирают информацию о поведении пользователей: для антиспама, рекомендаций, поиска, безопасности, рекламы, автодополнения, персонализации интерфейсов. ИИ делает эту тему эмоционально более острой, но технически она является продолжением давно существующей практики обработки данных, а не принципиально новым апокалиптическим сценарием», — говорит Дмитрий Зубрецкий, технический директор разработчика решений на основе ИИ targetai.
В сознании граждан и СМИ нередко смешиваются два процесса, продолжает Николай Долгов, эксперт в области информационной безопасности. Первый — умные функции, которые обрабатывают получаемые сведения, чтобы сервис мог нормально работать: сортировать письма, подсказывать ответы и т. д. Второй — обучение базовой ИИ-модели. То, что ИИ анализирует содержимое писем или документов для создания краткого пересказа или ответа, не означает автоматически, что вся личная переписка попадает в датасет для нейросети.
«Главный риск для пользователя не мифическое “обучение на ваших письмах”, а резкое расширение поверхности возможной атаки: чем больше чувствительной информации скапливается в одном месте, тем дороже обходится утечка или взлом аккаунта», — подчеркивает Николай Долгов.
ИТ-компании хотят с помощью личных данных получить три конкретных результата: сделать нейросеть точнее, полезнее и коммерчески ценнее, объясняет Михаил Шрайбман, член правления «Руссофт», эксперт по ИИ-платформам, корпоративным ИИ-агентам и внедрению ИИ в бизнес-процессы. Во-первых, письма, чаты, документы и действия на устройстве дают модели контекст, которого нет в открытых источниках: здесь можно наблюдать, что и как человек пишет, с кем общается, какие задачи решает, какие документы использует, что для него важно. Во-вторых, это помогает удерживать пользователей внутри экосистемы: людям становится сложнее отказаться от умного помощника, так как тот уже встроен в почту, календарь, документы и рабочие процессы. В-третьих, более точный ИИ можно продавать дороже, использовать как преимущество в подписках, корпоративных тарифах и рекламных продуктах.
«Технологическим компаниям выгоден доступ к большим массивам личных сведений, — рассуждает Михаил Шрайбман. — Утверждать, что российские разработчики массово обучают ИИ именно на персональных данных пользователей, пока нельзя. Однако тревожные сигналы есть. В СМИ уже обсуждаются инициативы по обмену обезличенной информацией между компаниями для обучения ИИ, возможный доступ нейросетей к государственным реестрам и масштабная ИИ-обработка электронных медкарт. Это показывает общий тренд: рынку нужны большие данные, в том числе чувствительные».
