Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Меланжевые войны Меланжевые войны

Выгодно ли превращать ресурсы в оружие

N+1
История советского контрснайпера: как школьный завхоз уложил 422 фашиста История советского контрснайпера: как школьный завхоз уложил 422 фашиста

Василий Теркин действительно существовал и был одним из лучших контрснайперов

ТехИнсайдер
Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир Палеогенетики прочитали ДНК четырех людей эпохи неолита из памятника Лепенски-Вир

Палеогенетики прочитали ДНК четырех человек на памятнике Лепенски-Вир

N+1
Как нелепо сложилась судьба красавчика-фермера из культового клипа Aerosmith - такого никто не ожидал! Как нелепо сложилась судьба красавчика-фермера из культового клипа Aerosmith - такого никто не ожидал!

Дин Келли легкомысленно распорядился свалившейся на него быстрой известностью...

VOICE
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Почему я умная, а живу как дура: вся правда о женских тренингах Почему я умная, а живу как дура: вся правда о женских тренингах

В чем прелесть и опасность массового увлечения женскими тренингами?

Psychologies
«Зависимость как от наркотиков»: сериалы представляют угрозу для психики? «Зависимость как от наркотиков»: сериалы представляют угрозу для психики?

Почему нас так затягивают сериалы?

Psychologies
Найти фриланс в IT за три месяца Найти фриланс в IT за три месяца

Как зарабатывать больше денег в кризис

СНОБ
Место для всех Место для всех

Как в «Севкабеле» появился уникальный социальный проект

СНОБ
Ученые открыли новый тип соединений в атмосфере — гидротриоксиды. Рассказываем, чем они опасны Ученые открыли новый тип соединений в атмосфере — гидротриоксиды. Рассказываем, чем они опасны

Гидротриоксиды — чрезвычайно реактивные и опасные вещества

Вокруг света
«Теорема зонтика, или Искусство правильно смотреть на мир через призму математики». Как поменять взгляд на повседневность с помощью математики «Теорема зонтика, или Искусство правильно смотреть на мир через призму математики». Как поменять взгляд на повседневность с помощью математики

Отрывок из книги «Теорема зонтика» — о том, как иначе смотреть на мир

N+1
Ещё раз о пользе интуитивного питания Ещё раз о пользе интуитивного питания

Наш организм сам способен разобраться, что ему нужно в данный момент?

Здоровье
Внутренний критик: как он рождается в нас и как направить его в конструктивное русло Внутренний критик: как он рождается в нас и как направить его в конструктивное русло

Вряд ли есть человек, который не сталкивался со своим внутренним критиком

Psychologies
Война дала и отобрала все: каким был «несравненный партизан» Нестор Махно Война дала и отобрала все: каким был «несравненный партизан» Нестор Махно

Смыслом жизни Нестора Махно была война

Вокруг света
В Норвегии вытаяла из-подо льда 3100-летняя кожаная туфля В Норвегии вытаяла из-подо льда 3100-летняя кожаная туфля

По данным ученых, это древнейшая обувь, найденная в Норвегии

N+1
Чувствуют агрессию: выявлена способность животных распознавать эмоции людей Чувствуют агрессию: выявлена способность животных распознавать эмоции людей

Лошади и свиньи оказались куда более проницательны, чем считалось раньше

Вокруг света
Термометр сломался? Джоли, Трамп и другие звезды, которые не умеют одеваться по погоде Термометр сломался? Джоли, Трамп и другие звезды, которые не умеют одеваться по погоде

Героини нашей подборки кажется, принципиально игнорируют прогноз погоды

VOICE
Пенис в сумочке: история Сада Абэ — самой странной эскортницы-убийцы в истории Пенис в сумочке: история Сада Абэ — самой странной эскортницы-убийцы в истории

Сада Абэ считается самой странной куртизанкой в Японии

VOICE
Археологи разобрались в хронологии испанского памятника с палеолитическим искусством Археологи разобрались в хронологии испанского памятника с палеолитическим искусством

Ученые получили 62 радиоизотопные датировки материалов из пещеры Ардалес

N+1
Оксана Акиньшина Оксана Акиньшина

Актриса Оксана Акиньшина — о ролях и актерско-режиссерском союзе с Козловским

Собака.ru
«Я больше никогда не женюсь»: разведенные мужчины против брака? «Я больше никогда не женюсь»: разведенные мужчины против брака?

Почему одни женятся снова, а другие остаются холостяками?

Psychologies
Наталья Андреева. Кровные друзья Наталья Андреева. Кровные друзья

Наталья Андреева — о своем друге Валерии Гаркалине

Коллекция. Караван историй
Появление керамики у древних жителей Латвии не сказалось на продолжительности грудного вскармливания Появление керамики у древних жителей Латвии не сказалось на продолжительности грудного вскармливания

Биоархеологи провели исследование зубов людей из могильника эпохи мезолита

N+1
Взаимовыручка или корыстный расчет? Ученые поняли, зачем животные помогают друг другу Взаимовыручка или корыстный расчет? Ученые поняли, зачем животные помогают друг другу

Ихтиологи описали альтруистичное поведение африканских рыб

Вокруг света
Алкомаркеты пустые, проезд в метро — 6 рублей: впечатления россиянина от жизни в Ташкенте Алкомаркеты пустые, проезд в метро — 6 рублей: впечатления россиянина от жизни в Ташкенте

Переехавший из Новосибирска рассказал, чем живет среднеазиатский мегаполис

Вокруг света
Очаровательные королевские малышки! Как выглядели в детстве Кейт Миддлтон, Меган Маркл, Елизавета II и другие Очаровательные королевские малышки! Как выглядели в детстве Кейт Миддлтон, Меган Маркл, Елизавета II и другие

Детские фотографии представительниц Британской монархии

VOICE
Этот шар пора сдувать Этот шар пора сдувать

Можно ли избежать увеличения веса и вздутия живота во время месячных

Лиза
Султан Лагучев: «Слава — это психологически трудно» Султан Лагучев: «Слава — это психологически трудно»

Певец рассказал о том, какой стала его жизнь после выхода хита «Горький вкус»

ЖАРА Magazine
От длинных ногтей до «кислой мины»: 10 вещей, которые больше всего бесят в нас мужчин От длинных ногтей до «кислой мины»: 10 вещей, которые больше всего бесят в нас мужчин

10 женских манер, которые больше всего выводят мужчин из себя

VOICE
Гендер нашего времени Гендер нашего времени

«Род мужской»: хоррор Алекса Гарленда о коллизии полов

Weekend
Открыть в приложении