Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Гремучие змеи попили воды с тел сородичей Гремучие змеи попили воды с тел сородичей

Герпетологи изучили, как зеленые гремучники собирают дождевую воду

N+1
«Живая» еда из банки: от чайного гриба до морского риса «Живая» еда из банки: от чайного гриба до морского риса

Cубстанции, которые обеспечивают человека продуктами и требуют регулярного ухода

Вокруг света
Найдены жировые клетки, которые являются «пузырьковой защитой» организма Найдены жировые клетки, которые являются «пузырьковой защитой» организма

Группа исследователей обнаружила новый тип клеток в организме млекопитающих

ТехИнсайдер
Яйцо, черепашка и мальчик: о чем рассказывают смерти в помпейских банях Яйцо, черепашка и мальчик: о чем рассказывают смерти в помпейских банях

В Археологическом парке Помпей новая замечательная находка

N+1
Простые вещи, которые делают нас человечнее Простые вещи, которые делают нас человечнее

Психолог Катерина Мурашова — про отсутствие эмпатии у современных детей

СНОБ
Недалеко от Рима нашли останки древнейшей курицы Италии Недалеко от Рима нашли останки древнейшей курицы Италии

Палеозоологи нашли фрагменты птичьих костей X– IX века до нашей эры

N+1
Экспериментатор, мелодист и романтик. Полу Маккартни — 80 Экспериментатор, мелодист и романтик. Полу Маккартни — 80

Разбираемся в музыкальной биографии Пола Маккартни

Правила жизни
Миссия — впечатлить: 5 самых важных правил поведения на первом свидании Миссия — впечатлить: 5 самых важных правил поведения на первом свидании

Первое свидание — дело ответственное. Ведь от него зависит, будет ли второе

VOICE
В янтаре из Мьянмы возрастом 99 миллионов лет нашли четыре вида клопов-землекопов В янтаре из Мьянмы возрастом 99 миллионов лет нашли четыре вида клопов-землекопов

В бирманском янтаре нашли четыре новых вида земляных щитников

N+1
Полвека с Дали: кем была Гала Градива, муза великого художника Полвека с Дали: кем была Гала Градива, муза великого художника

Вечная спутница «безумца» Дали — Елена Дьяконова

Вокруг света
Лава прошлогоднего извержения на Ла-Пальме оказалась крайне текучей Лава прошлогоднего извержения на Ла-Пальме оказалась крайне текучей

На канарском острове Ла-Пальма в 2021 году извергалась очень текучая лава

N+1
Еще 6 бередящих душу фотографий за несколько минут до смерти Еще 6 бередящих душу фотографий за несколько минут до смерти

Подборка фотографий с удивительными и жуткими историями

Maxim
Дочкино кино Дочкино кино

Зинаида Пронченко о Джейн Биркин в фильме Шарлотты Генсбур

Weekend
5 биографий музыкантов, которые стоит прочесть 5 биографий музыкантов, которые стоит прочесть

Самая полная биография Цоя и еще четыре интересные книги о великих музыкантах

СНОБ
Как стать сотрудником, которого не уволят даже в кризис Как стать сотрудником, которого не уволят даже в кризис

В меняющемся мире очень важно уметь быстро адаптироваться под новые реалии

Лиза
Забытая точка на карте: 9 городов-призраков и заброшенных поселков России Забытая точка на карте: 9 городов-призраков и заброшенных поселков России

Заброшенные города и покинутые села России

Forbes
Не ласковый май: самые громкие скандалы Юрия Шатунова и легендарной группы Не ласковый май: самые громкие скандалы Юрия Шатунова и легендарной группы

Двойники, племянник генсека и другие скандалы Юрия Шатунова

VOICE
Ничего лишнего Ничего лишнего

Как стать бьюти-минималистом и не вестись на маркетинговые уловки

Новый очаг
NASA выбрало место высадки для венерианского атмосферного зонда DAVINCI NASA выбрало место высадки для венерианского атмосферного зонда DAVINCI

Как будет проведено исследование атмосферы и поверхности Венеры

N+1
Породы-вундеркинды Породы-вундеркинды

Кто в списке самых умных собак

Лиза
Этикетка для виртуальной реальности: кому в метавселенной жить хорошо Этикетка для виртуальной реальности: кому в метавселенной жить хорошо

В метавселенной хорошо живется тем, кто этот факт осознает и делает выводы

Forbes
Самые опасные виды туризма в России Самые опасные виды туризма в России

От чего надо держаться подальше в процессе активного отдыха?

Maxim
Физики напрямую измерили магнитный момент иона гелия-3 Физики напрямую измерили магнитный момент иона гелия-3

Новые данные могут превратить гелий-3 в абсолютный магнитометрический стандарт

N+1
«Человеческое страдание не поддается измерению»: неизданные лекции Виктора Франкла «Человеческое страдание не поддается измерению»: неизданные лекции Виктора Франкла

Лекции психиатра Виктора Франкла о смысле страдания

Forbes
«Женихи хотела»: почему советские девушки заводили романы с военнопленными «Женихи хотела»: почему советские девушки заводили романы с военнопленными

Женщины времен войны обращали внимание на иностранцев, попавших в лагеря

VOICE
Куда нас приведут нейросети? Куда нас приведут нейросети?

Куда нас приведут игры с искусственным интеллектом

СНОБ
Это все неправда! 5 главных стереотипов о женщинах, не имеющих отношения к реальности (ну, почти) Это все неправда! 5 главных стереотипов о женщинах, не имеющих отношения к реальности (ну, почти)

Пришло время развенчать главные стереотипы о женщинах

VOICE
Для охоты, общения и навигации: как рыбы научились использовать электричество Для охоты, общения и навигации: как рыбы научились использовать электричество

Человек не может обходиться без электричества. А рыбы освоили его гораздо раньше

Вокруг света
К вам санитары, мистер Андерсон К вам санитары, мистер Андерсон

Писатель Александр Цыпкин о наших цифровых аватарах

СНОБ
Накопители HDD и SSD: в чем разница? Накопители HDD и SSD: в чем разница?

Что лучше купить - жесткий диск или твердотельный накопитель?

CHIP
Открыть в приложении