Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Джеймс Уэбб» отыскал самую древнюю спокойную галактику «Джеймс Уэбб» отыскал самую древнюю спокойную галактику

Эта спокойная галактика существовала спустя 700 млн лет после Большого Взрыва

N+1
Зона свежести в холодильнике: что это и зачем она нужна Зона свежести в холодильнике: что это и зачем она нужна

Стоит ли переплачивать за зону свежести в холодильнике?

CHIP
Глубокое обучение привлекли к проблеме аномального магнитного момента мюона Глубокое обучение привлекли к проблеме аномального магнитного момента мюона

Нейросеть пригодится в будущих экспериментах повышенной светимости

N+1
«Не будут больше надо мной смеяться у твоего подъезда пацаны»: краткая история Юры Шатунова и «Ласкового мая» «Не будут больше надо мной смеяться у твоего подъезда пацаны»: краткая история Юры Шатунова и «Ласкового мая»

Вспоминаем историю Юры Шатунова и делимся архивными фотографиями

Правила жизни
Стесняюсь спросить: почему женщины прибегают к интимной пластике Стесняюсь спросить: почему женщины прибегают к интимной пластике

Узнали у эксперта все, о чем вы боялись спросить об интимной пластике

Правила жизни
Компьютер не видит SSD: что делать? Компьютер не видит SSD: что делать?

Рассказываем, почему компьютер не видит SSD и как решить эту проблему

CHIP
Почему одни люди склонны слышать Почему одни люди склонны слышать

Что делает людей предрасположенными к "паранормальному" опыту слуховых явлений

ТехИнсайдер
К сезону мини к сезону готова К сезону мини к сезону готова

Как сделать ноги стройными с помощью питания, упражнений и полезных привычек

Лиза
Обратная эволюция: почему некоторые животные уходят с суши обратно в океан Обратная эволюция: почему некоторые животные уходят с суши обратно в океан

Как выглядели сухопутные предки китов и тюленей? Зачем они вернулись в воду?

ТехИнсайдер
В Польше обнаружили возможное место захоронения датского конунга Харальда Синезубого В Польше обнаружили возможное место захоронения датского конунга Харальда Синезубого

Обнаружено место вероятного захоронения датского конунга Харальда I Синезубого

N+1
Как изменится мир, которым будут управлять разумные машины? Как изменится мир, которым будут управлять разумные машины?

Каким будет новое человеческое будущее?

Вокруг света
Как перерабатывают нефть в XXI веке Как перерабатывают нефть в XXI веке

Представить себе сегодняшний мир без нефти невозможно

ТехИнсайдер
Ученые-волонтеры создали бесплатную языковую модель ИИ. Она не слабее, чем модели Google Ученые-волонтеры создали бесплатную языковую модель ИИ. Она не слабее, чем модели Google

Монополия в разработке и обучении языковых моделей нарушена

ТехИнсайдер
Жизнь без звёзд? Жизнь без звёзд?

Для астрономов важно темное и спокойное небо, но что делать, если его нет?

Наука и жизнь
Свой чужой: почему муж не встает на мою сторону в конфликтах с другими Свой чужой: почему муж не встает на мою сторону в конфликтах с другими

Что делать, если партнер не принимает вашу сторону?

Psychologies
5 городов, которые на самом деле сводят с ума: все об опасных для психики «синдромах путешественника» 5 городов, которые на самом деле сводят с ума: все об опасных для психики «синдромах путешественника»

Какие опасности поджидают туристов в Иерусалиме, Париже и Венеции?

Вокруг света
Место для созерцания: как создать японский сад на своем дачном участке Место для созерцания: как создать японский сад на своем дачном участке

Сажать сакуру для японского сада вовсе не обязательно

Вокруг света
Геннадий Устюгов Геннадий Устюгов

Классик ленинградского искусства Геннадий Устюгов живет в ПНД и пишет стихи

Собака.ru
Игорь Горьков Игорь Горьков

Генеральный директор Nexign Игорь Горьков — можно ли предсказать будущее?

Собака.ru
Парктроник: что это, как работает и какой выбрать Парктроник: что это, как работает и какой выбрать

Что скрывает в себе термин «парктроник»

РБК
Необычные и милые домашние животные всемирных знаменитостей Необычные и милые домашние животные всемирных знаменитостей

Посмотри, кто из писателей и других знаменитостей каких заводил питомцев

Maxim
Светлана Устинова — Forbes: «Важно чувствовать в себе силу, право на слова и свободу» Светлана Устинова — Forbes: «Важно чувствовать в себе силу, право на слова и свободу»

Российский сериал «Домашнее поле» — о женщине-тренере мужской футбольной команды

Forbes
+10: страшные сны писателей +10: страшные сны писателей

Страшные сны занимают важное место в русской литературе

Полка
Как сделать бомбочку для ванны своими руками: пошаговая инструкция Как сделать бомбочку для ванны своими руками: пошаговая инструкция

Почему бы не попробовать сделать бомбочку для ванны в домашних условиях?

VOICE
Физики достоверно увидели тетранейтрон Физики достоверно увидели тетранейтрон

Увиденный физиками тетранейтрон оказался резонансом

N+1
Молотов в Берлине Молотов в Берлине

О чем наркоминдел беседовал в Берлине с Гитлером

Дилетант
«Булочка», «плюшечка» и прочие сладости: как влияют на детей их семейные прозвища «Булочка», «плюшечка» и прочие сладости: как влияют на детей их семейные прозвища

Что скрывается за милыми эпитетами и как это может повлиять на жизнь ребенка?

Psychologies
Спаржа, свекла и другие овощи, которые плохо усваиваются в сыром виде Спаржа, свекла и другие овощи, которые плохо усваиваются в сыром виде

Эти продукты лучше пожарить или потушить, чтобы не навредить здоровью

Лиза
Джулиан Барнс: «Элизабет Финч». Отрывок из философского романа классика английской литературы Джулиан Барнс: «Элизабет Финч». Отрывок из философского романа классика английской литературы

Фрагмент из философского трактата обо всем на свете Джулиана Барнса

СНОБ
5 самых ядовитых грибов в мире: не смейте даже прикасаться к ним 5 самых ядовитых грибов в мире: не смейте даже прикасаться к ним

Собирая грибы в лесу, важно быть начеку

ТехИнсайдер
Открыть в приложении