Отрывок из книги «Полный бред! Скептицизм в мире больших данных»

ForbesКультура

Бывает ли безвредный алкоголь, что такое зомби-статистика и когда можно верить числам

Фото Getty Images

«Числа идеально подходят для изложения чуши. Они кажутся объективными, но ими легко манипулировать, чтобы рассказывать нужную историю», — говорят главные в мире эксперты по чуши, которые придумали университетский курс о том, как противостоять фейкам и дезинформации. Кто и как использует числа, чтобы морочить нам голову и когда не надо верить процентам и статистике.

Доктор биологических наук Карл Бергстром борется с фейками и враньем на протяжение многих лет. Как ученый он специализируется на механизмах распространения информации в рамках биологических и социальных систем — от внутриклеточного контроля экспрессии генов до дезинформации в социальных сетях. В период пандемии он боролся с антиваксерами, а недавно осудил подход Илона Маска к подсчету фейковых аккаунтов в Twitter как ненаучный. По его словам, выборка из 100 подписчиков, на основе которой Маск намерен оценить пропорцию настоящих аккаунтов в соцсети, не может считаться репрезентативной — это влечет за собой систематическую ошибку отбора. Но по экспертной оценке Бергстрома, скорее всего, Маск всех троллит.

В Вашингтонском университете Бергстром вместе с другим биологом Джевином Уэстом ведет курс под названием Calling Bullshit («Как распознать вранье»), задача которого — научить студентов скептически относиться к информации и уметь оценивать ее правдивость или убедительно доказывать ее фейковость. Об этом актуальном и полезном навыке они написали одноименную с курсом книгу, которая мае выходит на русском языке под названием «Полный бред! Скептицизм в мире больших данных» в издательстве «Манн, Иванов и Фербер». Forbes публикует отрывок.

«Вера людей в числа невероятно сильна. Скептики заявляют, что они «просто хотят увидеть данные», или требуют, чтобы им показали «исходные данные», или настаивают на том, что «показатели должны говорить сами за себя». Нас убеждают, что «данные никогда не врут». Но эта точка зрения может быть опасной. Даже если величины или числа верны, их всё равно можно использовать, чтобы морочить голову. Чтобы числа были понятными, они должны находиться в уместном контексте. Их нужно демонстрировать так, чтобы нам было доступно честное сравнение.

Мы полагаемся на приблизительные оценки, когда рассматриваем такие показатели, как, например, рост взрослого человека в определенной стране. Мужчины из Нидерландов считаются самыми высокими в мире — в среднем 183 сантиметра. Но чтобы получить эти данные, не измеряли всех жителей страны и не вычисляли среднее всех полученных величин. Вместо этого исследователи использовали случайную выборку местных мужчин, измерили тех, кто в нее попал, и экстраполировали выводы на все население. Если бы кто-то измерил полдюжины мужчин и вычислил их средний рост, только по случайности результат мог бы получиться неверным. Предположим, среди них некоторые были необычайно высокими. Это называют ошибкой выборки. К счастью, обширная выборка, как правило, позволяет выровнять отклонения, так что такая ошибка минимально влияет на результат.

Проблемы могут возникнуть и с процедурой измерения. Допустим, исследователи попросили участников сообщить о своем росте, но мужчины склонны завышать цифры, причем мужчины маленького роста делают это чаще, чем высокие.

Другой источник ошибки — предвзятость самой выборки — еще опаснее. Предположим, вы решили определить рост людей, отправились на местную баскетбольную площадку и стали измерять игроков. Баскетболисты, как правило, выше среднего роста, так что ваша выборка будет нерепрезентативной для населения в целом и в итоге значение окажется слишком высоким.

Большинство ошибок такого рода не настолько очевидны. Есть много хитроумных подходов, из-за которых выборка перестает характеризовать популяцию. Сводная статистика может быть удобным способом обобщать информацию, но, если она некорректна, вы легко введете свою аудиторию в заблуждение.

В расчеты и факты, которые кажутся совершенно очевидными, ошибки закрадываются по разным причинам. Можно запутаться в числах. Можно использовать слишком маленькую выборку, которая некорректно отражает особенности всей группы. Некорректными могут оказаться методики, с помощью которых мы выводим числа из иной информации. И наконец, числа могут просто быть полной чушью, выдуманной с нуля в попытке придать убедительность жалким аргументам. Мы должны помнить об этом, когда нам что-то доказывают с помощью численных показателей. Говорят, что цифры никогда не лгут, но следует помнить, что они часто вводят в заблуждение.

Зловредные проценты

Двенадцатая глава книги Карла Сагана 1996 года «Мир, полный демонов» называется «Тонкое искусство снимать лапшу с ушей». В ней автор разносит мир рекламы, атакующий нас ошеломительными, но бессмысленными фактами и цифрами. Саган подчеркивает ту же проблему, которой мы касаемся в этой главе: числа легко сбивают людей с толку, и рекламодатели многие десятилетия пользуются этим, чтобы убеждать. «От вас не ждут вопросов, — пишет Саган. — Не думайте. Покупайте».

Печально известный заголовок Breitbart сходным образом лишил читателей возможности провести осмысленное сопоставление. В этом впечатляющем образце нагнетания паники сообщалось, что 2139 потенциальных бенефициаров законопроекта DREAM (The Development, Relief and Education for Alien Minors Act — законопроект, согласно которому дети нелегальных мигрантов, получившие высшее образование или отслужившие в армии США, могут получить вид на жительство в США) — взрослые, нелегально прибывшие в США в детском возрасте — были осуждены или обвинены в преступлениях, совершенных против американцев. Число кажется пугающим. Но, конечно, закон DREAM относился к большому числу людей: соответствующий статус имели одновременно около 700 000 человек и еще около 800 000 получили его в какой-то момент до отмены программы. Это означает, что только 0,3% получателей такого статуса — то есть менее одного из 300 — обвинялись в преступлениях против американцев.

Уже лучше, но как это число соотносится с аналогичными показателями, касающимися граждан Америки? Если 0,75% американцев сидят за решеткой, получается, что граждане США в два раза чаще оказываются заключенными или обвиненными в совершении преступления, чем дети нелегальных мигрантов, претендующие на гражданство? Около 8,6% американских граждан были обвинены в преступлении в какой-то момент свой жизни, так и тут потенциальные бенефициары программы DREAM выглядят неплохо.

Конечно, они моложе и в целом могли просто не успеть совершить преступление до получения статуса, потому что у них было на это меньше времени, чем у среднего американца. Но оказывается, что 30% граждан США за какие-нибудь правонарушения (не считая дорожно-транспортных) арестовывались уже к 23 годам. Даже если мы предположим, что числа Breitbart корректны, издание представило их без необходимой информации, которая нужна читателю, чтобы поместить их в контекст.

Таким образом, демонстрируя исходные числа, можно заставить сравнительно небольшое количество выглядеть большим. Мы помещаем число в контекст с помощью выражения его в процентах. Конечно, проценты являются ценным инструментом сравнения. Но существуют различные способы затруднять необходимые сравнения и в процентах. Например, проценты могут заставить крупные показатели выглядеть менее значительными.

В своем блоге вице-президент по поиску Google признал, что его компания сталкивается с проблемами фейковых новостей, дезинформации и другого неуместного контента: «Наши алгоритмы помогают выявлять надежные источники среди сотен миллиардов страниц в нашем поисковом индексе. Однако стало очевидным, что небольшая часть запросов в нашем повседневном трафике (около 0,25%) выдает непристойные или откровенно вводящие в заблуждение результаты, а это не то, что нужно людям». Тут можно отметить две вещи. В первую очередь нам демонстрируют огромное, но практически не имеющее к нам отношения число как бы в роли контекста. «Сотни миллиардов страниц в нашем поисковом индексе». Этому огромному числу противопоставлено крошечное 0,25%. Но сотни миллиардов не имеют к этому особого отношения: это количество проиндексированных страниц, а не число поисковых запросов. Неважно, проиндексированы десять тысяч или сотни миллиардов страниц. Если 0,25% запросов в Google ведут не туда, у вас один на четыре сотни шанс получить чушь в результате поиска.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Парк вместо поля: как семья воронежского предпринимателя привлекла 200 000 туристов Парк вместо поля: как семья воронежского предпринимателя привлекла 200 000 туристов

Как Маньковы превратили окрестности старинного имения в парк развлечений

Forbes
Как избавиться от постоянного чувства вины: план на 3 недели Как избавиться от постоянного чувства вины: план на 3 недели

Рассказываем, как избавиться от чувства вины и стать счастливее

Psychologies
«Турецкие войны России: Царская армия и балканские народы в XIX столетии» «Турецкие войны России: Царская армия и балканские народы в XIX столетии»

Каким было отношение населения Румелии к российской армии

N+1
На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры На распространение растительноядных динозавров на Аляске осадки повлияли сильнее температуры

Гадрозавриды предпочитали влажные условия, а цератописды — засушливые

N+1
7 фильмов о великих художниках 7 фильмов о великих художниках

Выдающиеся фильмы о живописцах, от эпохи Возрождения до XX века

СНОБ
Кинотерапия для снятия тревожности: инструкция психолога Кинотерапия для снятия тревожности: инструкция психолога

Кино лечит?

Psychologies
Химики смоделировали образование аэрозолей в тропосфере Химики смоделировали образование аэрозолей в тропосфере

Комбинация трех веществ привела к быстрому росту размера и количества частиц

N+1
В чем сила? В чем сила?

Куда отправиться прямо сейчас, чтобы вернуться домой по-настоящему отдохнувшими?

Psychologies
Всемирный фарватер Всемирный фарватер

Как люди путешествовали, когда не было авиасообщения

Вокруг света
За «Крестного отца»: 4 странные причины, по которым в СССР сажали в тюрьму За «Крестного отца»: 4 странные причины, по которым в СССР сажали в тюрьму

Законодательство в СССР временами оставляло желать лучшего

VOICE
Внутри египетской мумии ястреба оказались останки священного ибиса Внутри египетской мумии ястреба оказались останки священного ибиса

Исследователи изучили мумию птицы, которая считалась останками ястреба

N+1
Пропущенный рейд может стоить жизни редкому животному: 8 причин «не ставить на паузу» охрану природы Пропущенный рейд может стоить жизни редкому животному: 8 причин «не ставить на паузу» охрану природы

Здоровая экосистема планеты — залог нашего существования

Вокруг света
Аномальные «кнуты» и воронки на Солнце, которые обнаружил космический зонд Аномальные «кнуты» и воронки на Солнце, которые обнаружил космический зонд

Какие загадки Солнца помог разгадать космический зонд «Паркер»

ТехИнсайдер
Спал на голом матрасе и мог не делать уроки: каким было детство Илона Маска Спал на голом матрасе и мог не делать уроки: каким было детство Илона Маска

Как Мэй Маск воспитывала своих детей?

VOICE
Эпоха гиперинфляции: как в Германии времен Ремарка расцвела молодость Эпоха гиперинфляции: как в Германии времен Ремарка расцвела молодость

О молодости, любви и вдохновении в период тяжелейшего экономического кризиса

Psychologies
История одной вещи: кипятильник, незаменимый в командировке и путешествии История одной вещи: кипятильник, незаменимый в командировке и путешествии

Рассказываем его историю советского кипятильника

Правила жизни
О сложных чувствах, повторном браке и потере ребенка: 7 психологических книг О сложных чувствах, повторном браке и потере ребенка: 7 психологических книг

Подборка книг, которая поможет справиться с трудностями бережнее и эффективнее

Psychologies
6 заболеваний, которые могут скрываться за обычным насморком 6 заболеваний, которые могут скрываться за обычным насморком

Часто при насморке все сразу тянутся за каплями. Но так ли все просто?

Лиза
Суперфуд из болота: 4 удивительных свойства клюквы Суперфуд из болота: 4 удивительных свойства клюквы

Маленькие красные плоды — настоящий кладезь полезных веществ

Вокруг света
Полстакана черники в день снизило риск когнитивного снижения у людей среднего возраста Полстакана черники в день снизило риск когнитивного снижения у людей среднего возраста

Черника улучшает память, контроль и речь у людей людей в возрасте 50-65 лет

N+1
Питание и женское здоровье: основные правила хорошего самочувствия Питание и женское здоровье: основные правила хорошего самочувствия

Как питание поможет скорректировать общее самочувствие женщинам

Psychologies
5 вещей, которыми нельзя пренебрегать после пластики груди 5 вещей, которыми нельзя пренебрегать после пластики груди

5 правил, о которых ты ни в коем случае не должна забывать после пластики груди

Cosmopolitan
Тайные знаки: как угадать чей угодно знак зодиака — даже если он это скрывает Тайные знаки: как угадать чей угодно знак зодиака — даже если он это скрывает

Как в одно мгновение понять, какой знак зодиака перед тобой?

VOICE
Как сэкономить на бензине и заправляться реже: простые, но неочевидные хитрости Как сэкономить на бензине и заправляться реже: простые, но неочевидные хитрости

Простые и проверенные способы, которые помогут "растянуть" бак бензина

VOICE
Что такое «думскроллинг» и чем он опасен каждому россиянину Что такое «думскроллинг» и чем он опасен каждому россиянину

Хорошая новость для тех, кто любит плохие новости: думскроллинг лечится

Maxim
Осторожно, злой хомяк: ученые случайно вывели агрессивных грызунов Осторожно, злой хомяк: ученые случайно вывели агрессивных грызунов

Эксперимент, который поможет людям с психическими проблемами

Вокруг света
Прокусить не так-то просто: кто пил кровь динозавров? Прокусить не так-то просто: кто пил кровь динозавров?

Доисторические кровососы стали одной из причин вымирания динозавров

Вокруг света
Архитектура неспешного отдыха Архитектура неспешного отдыха

Пространство гостевого дома стало продолжением концепта архитектурного решения

SALON-Interior
Голод и ожирение: две стороны одной трагедии XXI века Голод и ожирение: две стороны одной трагедии XXI века

В чем же состоит современная проблема питания?

ТехИнсайдер
Чтение выходного дня: фрагмент книги «Так можно: выстроить границы в отношениях с трудными родителями» Чтение выходного дня: фрагмент книги «Так можно: выстроить границы в отношениях с трудными родителями»

Как понять поведение наших родителей — отрывок из книги Дэвида М. Аллена

Правила жизни
Открыть в приложении