Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Анафилаксию при пищевой аллергии у мышей объяснили наследственностью Анафилаксию при пищевой аллергии у мышей объяснили наследственностью

Ученые разобрались в природе анафилактического шока при пищевой аллергии

N+1
«Fashionopolis: Цена быстрой моды и будущее одежды». Какой урон наносит планете бездумное потребление «Fashionopolis: Цена быстрой моды и будущее одежды». Какой урон наносит планете бездумное потребление

Фрагмент книги «Fashionopolis: Цена быстрой моды и будущее одежды»

N+1
Ученые выяснили, что большинство травоядных животных ест не только траву Ученые выяснили, что большинство травоядных животных ест не только траву

Традиционная классификация травоядных не отражает реальную картину их рационов

ТехИнсайдер
Найден способ стать хорошим человеком Найден способ стать хорошим человеком

Можно ли заметно улучшить свои человеческие качества?

Psychologies
Как справиться с текучестью кадров Как справиться с текучестью кадров

Как эффективно работать с персоналом и уменьшить риск ухода сотрудников

Inc.
Физики смоделировали лавину из фруктов на прилавке Физики смоделировали лавину из фруктов на прилавке

Физики исследовали образование лавин в монослое сфер в наклоненном лотке

N+1
Труба, валторна и фрак Труба, валторна и фрак

Как важными свидетелями событий военного времени становятся личные вещи

Дилетант
Что делать в случае укуса клеща Что делать в случае укуса клеща

Как избежать опасной встречи с клещом и что делать, если он все-таки укусил

РБК
«Щас спою»: почему перерисовывали волка в мультфильме «Жил-был пес» «Щас спою»: почему перерисовывали волка в мультфильме «Жил-был пес»

Волк из знаменитого мультфильма «Жил-был пес» должен был выглядеть иначе

VOICE
Как правильно спать в жару: 7 советов, чтобы не перегреться Как правильно спать в жару: 7 советов, чтобы не перегреться

Эти простые советы помогут вам комфортно спать даже в жару

ТехИнсайдер
Астрономы уличили скопление Гиады в сближении с Солнечной системой в прошлом Астрономы уличили скопление Гиады в сближении с Солнечной системой в прошлом

Звездное скопление Гиады миллион лет назад было в два раза ближе к Солнцу

N+1
7 признаков хорошего доктора 7 признаков хорошего доктора

Как понять, что врач нам подходит

Psychologies
Обезболить нельзя терпеть Обезболить нельзя терпеть

Всегда ли, стремясь поскорее заглушить боль, мы помним о безопасности?

Здоровье
Ошибки советских чиновников, от которых мы страдаем до сих пор Ошибки советских чиновников, от которых мы страдаем до сих пор

Нехорошие вещи, которые пережили СССР и имеют все шансы пережить и нас

Maxim
«Разведчики внешних планет»: история «Пионеров» и «Вояджеров» «Разведчики внешних планет»: история «Пионеров» и «Вояджеров»

Фрагмент из книги «Разведчики внешних планет», посвященным загадке «Пионеров»

N+1
«Женихи хотела»: почему советские девушки заводили романы с военнопленными «Женихи хотела»: почему советские девушки заводили романы с военнопленными

Женщины времен войны обращали внимание на иностранцев, попавших в лагеря

VOICE
Захватывающая история изобретения и эволюции женских стрингов (с картинками) Захватывающая история изобретения и эволюции женских стрингов (с картинками)

Этот предмет женского гардероба вызывал столько мужских эмоций!

Maxim
Без макияжа и спеси: первые и трогательные снепы Хадид, Клосс, Шейк и других моделей Без макияжа и спеси: первые и трогательные снепы Хадид, Клосс, Шейк и других моделей

Как выглядели кумиры мира моды на самом старте их карьеры?

VOICE
К вам санитары, мистер Андерсон К вам санитары, мистер Андерсон

Писатель Александр Цыпкин о наших цифровых аватарах

СНОБ
Как убедить близкого человека с зависимостью обратиться к специалистам Как убедить близкого человека с зависимостью обратиться к специалистам

Что делать, если вашему родственнику или другу требуется помощь профессионала?

Psychologies
Грузовые корабли, ракеты и танки: 10 неожиданных вещей, созданных автомобильными брендами Грузовые корабли, ракеты и танки: 10 неожиданных вещей, созданных автомобильными брендами

Десять примеров неожиданной продукции от мастеров автопрома

ТехИнсайдер
Manicure Vampire Manicure Vampire

Ксения Черемнова и Дима Вишнеев придумали кастом-бренд Manicure Vampire

Собака.ru
5 собак с самыми мощными челюстями в мире: грозные рекордсмены 5 собак с самыми мощными челюстями в мире: грозные рекордсмены

Представляем вам рейтинг пород собак с самым сильным укусом

ТехИнсайдер
Тихие убийцы: 5 самых ядовитых грибов на свете Тихие убийцы: 5 самых ядовитых грибов на свете

Самые токсичные представители загадочного царства грибов

Вокруг света
Сицилийский галстук, испанский стыд и другие интересные выражения-иностранцы Сицилийский галстук, испанский стыд и другие интересные выражения-иностранцы

Идиомы с иностранными отсылками, которые прописались в нашем словаре

Maxim
Когнитивный диссонанс: как Филлис Шлэфли строила карьеру, отрицая идеи феминизма Когнитивный диссонанс: как Филлис Шлэфли строила карьеру, отрицая идеи феминизма

Американка Филлис Шлэфли была одной из самых успешных противниц феминизма

Forbes
В некрополе у столицы империи Юань нашли людей европейского происхождения В некрополе у столицы империи Юань нашли людей европейского происхождения

Палеогенетики исследовали останки, раскопанные в Шанду

N+1
Жизнь вне тела: как искусственный «дом для органов» спас первого пациента Жизнь вне тела: как искусственный «дом для органов» спас первого пациента

Технология может спасти людей, рискующих не дождаться своей очереди на пересадку

Forbes
Почему мужчины и женщины не могут быть просто друзьями? Почему мужчины и женщины не могут быть просто друзьями?

Возможны ли близкие, но платонические отношения между мужчиной и женщиной?

Psychologies
Эти вещи ни в коем случае нельзя хранить дома: рассказывает эксперт Васту Эти вещи ни в коем случае нельзя хранить дома: рассказывает эксперт Васту

Есть вещи, которые ни в коем случае не стоит хранить в доме. Рассказываем, какие

VOICE
Открыть в приложении