Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Нечеловеческим животным отказали в чувстве справедливости Нечеловеческим животным отказали в чувстве справедливости

Ученые не обнаружили у животных непринятия несправедливости

N+1
Любимые хиты из СССР, популярные и сегодня: проверь, знаешь ли ты их все Любимые хиты из СССР, популярные и сегодня: проверь, знаешь ли ты их все

Что-то временно, а что-то вечно. К последнему относятся эти советские хиты!

VOICE
Ученые разгадали научную загадку, которая будоражила человеческие умы практически 140 лет! Ученые разгадали научную загадку, которая будоражила человеческие умы практически 140 лет!

Математики доказали, что четырехчастное разбиение Генри Дьюдени оптимально

Inc.
Татьяна Кочнова Татьяна Кочнова

Дизайнер Татьяна Кочнова совершила переворот в свадебной моде

Собака.ru
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Церкви в самом невероятном месте на свете — Антарктиде Церкви в самом невероятном месте на свете — Антарктиде

На ледяном континенте умудрились построить часовни и русские, и американцы

Maxim
Как нелепо сложилась судьба красавчика-фермера из культового клипа Aerosmith - такого никто не ожидал! Как нелепо сложилась судьба красавчика-фермера из культового клипа Aerosmith - такого никто не ожидал!

Дин Келли легкомысленно распорядился свалившейся на него быстрой известностью...

VOICE
«Чучело» в 2022 году: 3 причины посмотреть «Невидимый мир» «Чучело» в 2022 году: 3 причины посмотреть «Невидимый мир»

Чем примечателен «Невидимый мир» Лауры Вандель?

Psychologies
Щедрость юга Щедрость юга

В Крыму и в Краснодарском крае в июне уже можно купаться и есть клубнику

Лиза
Тонкости альпинизма: как подготовиться к восхождению на Эльбрус Тонкости альпинизма: как подготовиться к восхождению на Эльбрус

Как покорить Эльбрус?

ТехИнсайдер
Бегунок Бегунок

Кирилл сбегал из детского дома в жару и лютый мороз

СНОБ
Почему вообще не хочется отношений с противоположным полом: 5 причин Почему вообще не хочется отношений с противоположным полом: 5 причин

Если вам не хочется отношений, это нормально

Psychologies
Место для всех Место для всех

Как в «Севкабеле» появился уникальный социальный проект

СНОБ
Найден источник Черной Смерти — одной из самых смертоносных пандемий за всю историю Найден источник Черной Смерти — одной из самых смертоносных пандемий за всю историю

Черная смерть была первой волной 500-летней пандемии

ТехИнсайдер
Проститутки, кровь и миллионы: каково работать председателем ТСЖ Проститутки, кровь и миллионы: каково работать председателем ТСЖ

Работа с людьми — как уравнение с множеством неизвестных

Правила жизни
Обезболить нельзя терпеть Обезболить нельзя терпеть

Всегда ли, стремясь поскорее заглушить боль, мы помним о безопасности?

Здоровье
Датчик коленвала: что это и как его проверить Датчик коленвала: что это и как его проверить

Как понять, что датчик коленвала захандрил и что делать в такой ситуации?

РБК
Почему я умная, а живу как дура: вся правда о женских тренингах Почему я умная, а живу как дура: вся правда о женских тренингах

В чем прелесть и опасность массового увлечения женскими тренингами?

Psychologies
Удобство и минимум действий: как используется UX&UI дизайн для создания интерфейсов онлайн-кинотеатров Удобство и минимум действий: как используется UX&UI дизайн для создания интерфейсов онлайн-кинотеатров

Почему именно в онлайн-кинотеатрах особенно важно проектирование интерфейсов

ТехИнсайдер
Кому подходит рыжий цвет и как его сохранить: комментарии эксперта Кому подходит рыжий цвет и как его сохранить: комментарии эксперта

Рыжий — цвет волос, который всегда выделяется среди других

РБК
«Менять надо не людей, а систему»: почему кризис может привести к росту бездомности «Менять надо не людей, а систему»: почему кризис может привести к росту бездомности

О помощи беженцам и безработным, об уходе крупных доноров с российского рынка

Forbes
Микротоки для лица: что это, эффект от процедуры и противопоказания Микротоки для лица: что это, эффект от процедуры и противопоказания

Вместе с дерматологом и косметологом рассказываем, что нужно знать о микротоках

РБК
Для чего древние цивилизации использовали календари? 5 невероятных фактов о времени Для чего древние цивилизации использовали календари? 5 невероятных фактов о времени

Факты, связанные со временем, которые вы точно не знали

ТехИнсайдер
«Все ненавидят Эмбер Херд»: что не так с победой Джонни Деппа в суде? «Все ненавидят Эмбер Херд»: что не так с победой Джонни Деппа в суде?

Как блогеры, активисты за права мужчин заставили всех поверить в теорию заговора

Psychologies
Без макияжа и спеси: первые и трогательные снепы Хадид, Клосс, Шейк и других моделей Без макияжа и спеси: первые и трогательные снепы Хадид, Клосс, Шейк и других моделей

Как выглядели кумиры мира моды на самом старте их карьеры?

VOICE
Летающие мотоциклы, робот-хирург и механические птицы. За кем сейчас стоит наблюдать в области новых технологий? Летающие мотоциклы, робот-хирург и механические птицы. За кем сейчас стоит наблюдать в области новых технологий?

Инженер Илья Чех – об изобретениях, которые изменят нашу жизнь уже завтра

СНОБ
«Роль самого благородного человека на свете». Отрывок из книги о Киану Ривзе «Роль самого благородного человека на свете». Отрывок из книги о Киану Ривзе

Отрывок из книги-исследования о феномене актера Киану Ривза

СНОБ
Как китайские госкомпании создают успешные автомобильные премиум-бренды и трансформируются в IT-сервисы Как китайские госкомпании создают успешные автомобильные премиум-бренды и трансформируются в IT-сервисы

В Поднебесной научились выпускать качественные и технически совершенные авто

Правила жизни
Эксперт рассказал, как правильно экономить на электроэнергии Эксперт рассказал, как правильно экономить на электроэнергии

Самые простые и универсальные способы экономии от эксперта

ТехИнсайдер
Что читать летом: 10 новых книг о том, как мы живем сегодня Что читать летом: 10 новых книг о том, как мы живем сегодня

Книги, которые помогут объяснить сегодняшний день или найти в нем свое место

Правила жизни
Открыть в приложении