Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Самец магота научился отпугивать сородичей хлопком в ладоши Самец магота научился отпугивать сородичей хлопком в ладоши

Магот из Леса обезьян в Рокамадуре изобрел новый для своего вида жест

N+1
Твердая жидкость: чем способен удивить обычный кетчуп Твердая жидкость: чем способен удивить обычный кетчуп

Что не так с кетчупом?

Вокруг света
Яркий сжатый вакуум сгенерировал высокие гармоники Яркий сжатый вакуум сгенерировал высокие гармоники

Физики сгенерировали высокие гармоники в магний-легированном ниобате лития

N+1
Поздравление на свадьбе: что и как говорить молодоженам Поздравление на свадьбе: что и как говорить молодоженам

Есть ли универсальный рецепт хорошего тоста на свадьбе?

Psychologies
Унюхал – беги: как трупный запах влияет на поведение человека Унюхал – беги: как трупный запах влияет на поведение человека

Как «запах смерти» мобилизует защитные механизмы в нашем организме

ТехИнсайдер
За что фантастам вручают престижную премию За что фантастам вручают престижную премию

Подборка произведений, заслуживших престижную литературную премию "Локус"

ТехИнсайдер
Загадка природы: почему ученые до сих пор не могут разгадать тайну шаровой молнии Загадка природы: почему ученые до сих пор не могут разгадать тайну шаровой молнии

Что такое шаровая молния и откуда она берется?

ТехИнсайдер
Автомобили ретро: 7 самых дорогих машин в истории, продававшихся на аукционе. Сложно представить, сколько они стоили! Автомобили ретро: 7 самых дорогих машин в истории, продававшихся на аукционе. Сложно представить, сколько они стоили!

Взгляните на самые дорогие автомобили, когда-либо продававшиеся на аукционе

ТехИнсайдер
Самые дешевые электромобили в России. Список моделей и цены Самые дешевые электромобили в России. Список моделей и цены

Какие электромобили можно купить по цене новой Lada Vesta

РБК
Как сформировать новые полезные привычки? Как сформировать новые полезные привычки?

Как формируются привычки и почему с возрастом нам все сложнее переучиваться?

СНОБ
Почему одни люди склонны слышать Почему одни люди склонны слышать

Что делает людей предрасположенными к "паранормальному" опыту слуховых явлений

ТехИнсайдер
Мемуары творческих людей как источник вдохновения Мемуары творческих людей как источник вдохновения

Подборка книг, написанных известными людьми творческих профессий

СНОБ
Изобретение советских физиков может обеспечить энергией весь мир на миллионы лет Изобретение советских физиков может обеспечить энергией весь мир на миллионы лет

Неисчерпаемая энергия у нас прямо под ногами, только непонятно, как ее достать

ТехИнсайдер
Взаимовыручка или корыстный расчет? Ученые поняли, зачем животные помогают друг другу Взаимовыручка или корыстный расчет? Ученые поняли, зачем животные помогают друг другу

Ихтиологи описали альтруистичное поведение африканских рыб

Вокруг света
Как энергетики влияют на нас и почему после их употребления наступает упадок сил? Как энергетики влияют на нас и почему после их употребления наступает упадок сил?

Опасны ли энергетики? И что происходит в организме при их употреблении?

ТехИнсайдер
Как правильно спать в жару: 7 советов, чтобы не перегреться Как правильно спать в жару: 7 советов, чтобы не перегреться

Эти простые советы помогут вам комфортно спать даже в жару

ТехИнсайдер
Вопрос дня: всем ли нужно быть лидером? Вопрос дня: всем ли нужно быть лидером?

«Сноб» спросил участников клуба: всем ли нужно быть лидером?

СНОБ
История советского контрснайпера: как школьный завхоз уложил 422 фашиста История советского контрснайпера: как школьный завхоз уложил 422 фашиста

Василий Теркин действительно существовал и был одним из лучших контрснайперов

ТехИнсайдер
Курьеров пересадят на «батарейки» Курьеров пересадят на «батарейки»

Новые развозные электромобили преобразуют авторынок России

Эксперт
Виктор Франкл: в чем смысл нашей жизни и зачем в ней страдания Виктор Франкл: в чем смысл нашей жизни и зачем в ней страдания

В чем же смысл жизни?

Вокруг света
Вся правда о «марафонах желаний»: почему люди до сих пор в это верят? Вся правда о «марафонах желаний»: почему люди до сих пор в это верят?

Куда ни кинь взгляд в Сети - обязательно наткнешься на очередного гуру

VOICE
Технопарад Технопарад

Линзы с AR, новая ракета Nasa Space Launch System и запись звуков на Марсе

ТехИнсайдер
Трюковые самокаты: как выбрать подходящую модель Трюковые самокаты: как выбрать подходящую модель

Трюковой самокат — это особый вид, сделанный специально для выполнения трюков

ТехИнсайдер
Да здравствует абсурд: 10 запоминающихся заявлений на суде Джонни Деппа и Эмбер Херд Да здравствует абсурд: 10 запоминающихся заявлений на суде Джонни Деппа и Эмбер Херд

Шестилетняя схватка Джонни Деппа и Эмбер Херд завершилась

Правила жизни
5 способов прокачать знание иностранных языков с помощью музыки 5 способов прокачать знание иностранных языков с помощью музыки

Можно ли использовать музыку для изучения иностранных языков?

ТехИнсайдер
5 самых популярных способов лечения похмелья, которые сделают только хуже 5 самых популярных способов лечения похмелья, которые сделают только хуже

Методы лечения похмелья, которые на самом деле не работают

Maxim
Гид под модным джинсам Кендалл Дженнер - принцессы стритстайла Гид под модным джинсам Кендалл Дженнер - принцессы стритстайла

В джинсах мисс Кендалл Дженнер точно знает толк

VOICE
Из-за изменения климата гиеновидные собаки отложили размножение на 22 дня за 30 лет Из-за изменения климата гиеновидные собаки отложили размножение на 22 дня за 30 лет

Из-за изменения климата гиеновидные собаки оказались в фенологической ловушке

N+1
«И будет рыдать земля: Как у индейцев отняли Америку» «И будет рыдать земля: Как у индейцев отняли Америку»

Отрывок из истории покорения Американского Запада

N+1
Физики смоделировали лавину из фруктов на прилавке Физики смоделировали лавину из фруктов на прилавке

Физики исследовали образование лавин в монослое сфер в наклоненном лотке

N+1
Открыть в приложении