Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

N+1Наука

«Полный бред! Скептицизм в мире больших данных». Как относиться к получаемой информации критически

Манн, Иванов и Фербер, научно-популярные книгоиздатели

Если кто-то подкрепляет утверждения затейливыми терминами, цифрами и красивыми графиками, это еще не значит, что ему можно доверять. Статистика и язык точных наук могут быть всего лишь инструментами, призванными скрыть обман. Тот, кто умеет анализировать и перепроверять информацию, скорее всего, заметит подвох — остальные рискуют попасться в ловушку. В книге «Полный бред! Скептицизм в мире больших данных» (издательство «Манн, Иванов и Фербер»), переведенной на русский Елизаветой Пономаревой, ученые Карл Бергстром и Джевин Уэст рассказывают, как распознать чушь (в оригинале — bullshit) и почему для этого совсем не обязательно быть специалистом, а достаточно воспользоваться обыкновенной логикой. Предлагаем вам ознакомиться с фрагментом, посвященным «ошибке прокурора» и уровню значимости (p-value).

Ошибка прокурора

Как мы видели, в большинстве научных исследований ищут закономерности в данных, позволяющие делать выводы о мире. Но как отличить закономерность от случайного шума? И как определить, насколько она значима? Существует несколько способов это сделать, и самый распространенный — это использование р-значения. Грубо говоря, р-значение указывает, насколько вероятно, что наблюдаемая закономерность возникла по чистой случайности. Если это маловероятно, то мы можем сказать, что результат статистически значим. Но что это на самом деле означает и как нам трактовать р-значение? Мы ответим на эти вопросы с помощью короткой истории.

Представьте, что вы известный адвокат, который защищает скромного биолога, обвиняемого в самом поразительном похищении предмета искусства в современной истории.

Это сенсационное преступление. Богатая собирательница отправила частную коллекцию из тридцати шедевров европейского искусства на охраняемом поезде из своего особняка в Санта-Кларе в аукционный дом в Нью-Йорке. Когда поезд достиг пункта назначения, коробки отнесли в аукционный дом для распаковки. Путешествие прошло без происшествий, и к коробкам, на первый взгляд, никто не прикасался. Но, к всеобщему ужасу, четыре самые ценные картины были вырезаны из рам и исчезли! Ни полиция, ни страховая компания не нашли ни единой улики, не считая единственного отпечатка пальца на раме одной из пропавших работ. Украденные шедевры так никогда и не отыскали.

При отсутствии каких-либо иных наметок полиция прогнала от печаток пальца через огромную базу данных ФБР и нашла совпадение — отпечаток вашего клиента. (Он сдал свои отпечатки Администрации транспортной безопасности в обмен на возможность проходить досмотр в аэропорту, не снимая ботинок.) На допросе выяснилось, что у вашего клиента нет алиби. Он утверждает, что ни с кем не контактировал две недели, пока выслеживал окольцованную куропатку в горах Высокая Сьерра в рамках научного проекта.

Несмотря на отсутствие алиби, вы уверены, что ваш клиент не может быть виновен. Он всего лишь застенчивый ученый, а не хладнокровный похититель шедевров. У него уже есть два гранта NSF на исследование размножения куропаток, и, похоже, он не нуждается в дополнительных источниках дохода. К тому же, насколько вы заметили, он ни черта не понимает в искусстве; да что там, он считает, что Донателло — это черепашка-ниндзя.

Тем не менее начинается судебный процесс, и вы сталкиваетесь с блестящей молодой звездой прокуратуры. После описания всех остальных доказательств вины вашего клиента — слабых и косвенных — прокурор переходит к своему козырю, отпечатку пальца. Прокурор рассказывает присяжным, как именно компьютер сопоставляет отпечатки пальцев, и завершает свое выступление словами: «Нет абсолютно никаких шансов случайного совпадения настолько идентичных отпечатков».

Вы опровергаете его заявление: «По вашим словам, нет абсолютно никаких шансов настолько точного совпадения. Но так не бывает. В каждом тесте есть по крайней мере небольшой шанс ошибки». — «Конечно, — уступает он, — в принципе, тесты могут ошибаться. Но на практике шанс, что это случится, нулевой. Исследования ФБР показывают, что существует один шанс на десять миллионов, что два отпечатка совпадут настолько же точно. Один на десять миллионов — тут нет места сомнениям!»

Именно этого вы и ждали. Вы обращаетесь к присяжным и рисуете таблицу на три строки и два столбца на большом листе бумаги. Выглядит она примерно вот так.

«Я думаю, все мы согласны, что это преступление было кем-то совершено. И давайте также предположим, что отпечатки виновного есть в базе данных. Может быть, и нет, — обращаетесь вы к прокурору, — но это ослабит ваши доказательства. Так что давайте предположим, что они есть в базе». Прокурор кивает. «Тогда таблица должна выглядеть примерно вот так». Вы заполняете верхний ряд большим красным маркером.

Повернувшись к прокурору, вы интересуетесь: «Сколько человек включены в эту вашу базу ФБР?» Он перебивает вас: «Возражение, Ваша честь! Какое отношение это имеет к делу?» — «В этом и есть вся суть дела, — объясняете вы. — Я убежден, что объясню это все в течение следующих нескольких минут». — «Возражение отклонено». Сторона обвинения признается, что, если учесть все отпечатки пальцев преступников в США, все отпечатки гражданских лиц, полученные при проверке их биографий, и все отпечатки из базы Администрации транспортной безопасности, в базе представлено приблизительно пятьдесят миллионов американцев. И конечно, большинство отпечатков в базе не совпадают с тем, что найден на раме.

«Итак, теперь мы можем заполнять таблицу дальше», — говорите вы и вписываете число 50 000 000 в нижний правый угол.

Теперь вы указываете на нижний левый угол (это невиновные люди, чьи отпечатки тем не менее совпадут с найденным) и спрашиваете: «Как вы думаете, что нужно вписать сюда?»

Вы смотрите прямо на прокурора. «Вы сказали, что существует один шанс на десять миллионов, что алгоритм нашел неправильное совпадение. Это значит, что среди пятидесяти миллионов человек в этой базе должно быть примерно пять, чьи отпечатки совпадают с найденным и на месте преступления. Так что давайте заполним таблицу следующим образом»

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Слон во Вселенной. 100 лет в поисках темной материи» «Слон во Вселенной. 100 лет в поисках темной материи»

Как дисковые галактики сохраняют устойчивость

N+1
Почему мы забываем о сексе и как его вернуть в семейную жизнь Почему мы забываем о сексе и как его вернуть в семейную жизнь

Почему в семейной жизни всегда нужно искать время для секса?

Maxim
В космосе обнаружили разрушительное явление, которому нет равных по масштабу В космосе обнаружили разрушительное явление, которому нет равных по масштабу

В просторах Вселенной разворачиваются драмы поистине космического масштаба

Inc.
От Морятника до Мортуария: 10 небанальных достопримечательностей Волгограда, которые стоит посетить каждому От Морятника до Мортуария: 10 небанальных достопримечательностей Волгограда, которые стоит посетить каждому

Город, сменивший три названия и растянувшийся вдоль Волги на сто километров

Вокруг света
«Джинсовая лихорадка»: как джинсы в СССР были культом, символом и объектом желания «Джинсовая лихорадка»: как джинсы в СССР были культом, символом и объектом желания

Что положило начало так называемой джинсовой лихорадке в СССР?

Правила жизни
Современный горожанин потерял около половины видов кишечных микробов по сравнению с шимпанзе Современный горожанин потерял около половины видов кишечных микробов по сравнению с шимпанзе

Микробиом человека теряет видовое разнообразие

ТехИнсайдер
Свой чужой: почему муж не встает на мою сторону в конфликтах с другими Свой чужой: почему муж не встает на мою сторону в конфликтах с другими

Что делать, если партнер не принимает вашу сторону?

Psychologies
Как Леброн Джеймс стал самым успешным и богатым баскетболистом в XXI веке Как Леброн Джеймс стал самым успешным и богатым баскетболистом в XXI веке

Леброн Джеймс стал единственным из игроков НБА, кому удалось заработать $1 млрд

Forbes
Для охоты, общения и навигации: как рыбы научились использовать электричество Для охоты, общения и навигации: как рыбы научились использовать электричество

Человек не может обходиться без электричества. А рыбы освоили его гораздо раньше

Вокруг света
Эффективность дисперсантов для устранения разливов нефти снизилась за четыре дня Эффективность дисперсантов для устранения разливов нефти снизилась за четыре дня

Главной причиной увеличения вязкости нефти оказалось фотоокисление пленки

N+1
10 крайне выносливых автомобилей, способных пересечь пустыню 10 крайне выносливых автомобилей, способных пересечь пустыню

Внедорожники и пикапы всех мастей, которые смогут пересечь пустыню

ТехИнсайдер
Ритуальный каннибализм, лекарство от чумы и вечеринки со вскрытиями: что люди делали с мумиями на протяжении истории Ритуальный каннибализм, лекарство от чумы и вечеринки со вскрытиями: что люди делали с мумиями на протяжении истории

Почему люди считали каннибализм полезным для здоровья?

ТехИнсайдер
Оригинальная история. В поисках утраченной семьи и гармонии в отношениях Оригинальная история. В поисках утраченной семьи и гармонии в отношениях

Насколько отношения с семьей формируют взрослого человека?

СНОБ
Облико морале: 6 громких судебных процессов с участием знаменитостей за последние 30 лет Облико морале: 6 громких судебных процессов с участием знаменитостей за последние 30 лет

Самые громкие дела с участием знаменитостей за последние 30 лет

Правила жизни
Надвигается жара: 5 вещей, которые нужно знать водителям Надвигается жара: 5 вещей, которые нужно знать водителям

Как палящее солнце влияет на водителей и чего стоит опасаться в жару

РБК
Один большой HDD или два маленьких: что лучше? Один большой HDD или два маленьких: что лучше?

Что лучше – использовать один большой накопитель или два маленьких?

CHIP
Искусственный цитоскелет смог собраться в объемах клетки Искусственный цитоскелет смог собраться в объемах клетки

Ученые создали синтетический цитоскелет в объеме реальных клеток

N+1
Такой ошибки не простит история: 10 древних артефактов, уничтоженных по глупости людей Такой ошибки не простит история: 10 древних артефактов, уничтоженных по глупости людей

Многие ценнейшие артефакты были разрушены случайно, из-за банального невежества

ТехИнсайдер
Далеко в горах Карачаево-Черкесии: 3 маршрута к живописным Софийским озерам Далеко в горах Карачаево-Черкесии: 3 маршрута к живописным Софийским озерам

Ни один объектив не передаст всех красок этих мест — там лучше побывать самому

Вокруг света
Жалость: есть ли в ней хоть что-то хорошее? Жалость: есть ли в ней хоть что-то хорошее?

Жалость — очень плохое и вредное чувство?

Psychologies
10 знаковых грузовиков из США 10 знаковых грузовиков из США

Компаний, делающих или делавших ранее те самые легендарные траки

ТехИнсайдер
Ботаники описали первое хищное растение с подземными ловчими кувшинчиками Ботаники описали первое хищное растение с подземными ловчими кувшинчиками

Непентес стыдливый — первое известное хищное растение с подземными кувшинчиками

N+1
10 причин, почему тебя так любят комары. От группы крови до алкоголя 10 причин, почему тебя так любят комары. От группы крови до алкоголя

Почему некоторые люди особенно «неотразимы» для комаров?

Лиза
Настасья Кербенген. Голубая кровь Настасья Кербенген. Голубая кровь

Настасья Кербенген никогда не думала о том, чтобы стать актрисой

Коллекция. Караван историй
«Заходишь в вагон, а там 200 омоновцев стоит» «Заходишь в вагон, а там 200 омоновцев стоит»

Руслан Федотов о жизни московской подземки в своем фильме «Куда мы едем?»

Weekend
Люди Веры Люди Веры

Каждый день наши герои помогают людям жить

Seasons of life
10 красивых античных имен для девочки 10 красивых античных имен для девочки

Подборка оригинальных имен с историей родом из древнего мира

Вокруг света
Бари Алибасов: «Моя жизнь — сплошная провокация» Бари Алибасов: «Моя жизнь — сплошная провокация»

Выступая перед публикой, я играю роль, а с моей сутью знакомы лишь близкие люди

Караван историй
Правила жизни Тупака Шакура Правила жизни Тупака Шакура

Рэпер, умер 13 сентября 1996 года в возрасте 25 лет

Правила жизни
Как найти себя в новой реальности: навыки 2022+ Как найти себя в новой реальности: навыки 2022+

Что поможет чувствовать себя увереннее сегодня и занять свое место в профессии

Psychologies
Открыть в приложении