В Израиле все хорошо, не дождетесь: Как антивакцинаторы манипулируют статистикой

В Израиле все хорошо, не дождетесь: Как антивакцинаторы манипулируют статистикой

Антивакцинаторы — лжецы. Этот нехитрый тезис уже давным-давно доказан и не нуждается в дополнительных подтверждениях. Тем не менее, вполне разумные и грамотные люди все еще удивляются, когда сталкиваются с беспардонным враньем и грубыми манипуляциями, которым антивакцинаторы пытаются подкрепить свою псевдорелигиозную веру.

В последнее время одним из основных тезисом этих упоротых граждан стала мантра “в Израиле привитые болеют так же часто, как не привитые”. Корни этого бреда лежат, традиционно, в методичках кремлевских троллей, но речь сейчас не об этом. Это, естественно, ложь, но ложь по-своему интересная.

В отличии от других утверждений антиваксов, которые являются просто очень тупым и очень наглым враньем, фейк про Израиль базируется на интересном статистическом казусе— парадоксе Симпсона.

Суть его очень проста:

Если у вас есть две сильно различающиеся группы, в которых наблюдается одинаково направленная зависимость, то при объединении этих групп в одну, направление этой зависимости может изменится на противоположное.


Парадокс Симпсона: в синей и красной группе зависимость Y(X) возрастающая, но если их объединить, то в целом по обеим группам она становится убывающей.

Для того, чтобы наблюдалось такой поведение, группы должны быть достаточно разными. Это, по сути, тот же эффект, который возникает в пресловутом анекдоте про среднюю температуру по больнице: если вы усредните температуру пациентов в инфекционке (40) и в морге (20), то получите 36.6. Объединенная выборка в таком случае имеет бимодальное (“двугорбое”) распределение, для которого привычные формулы статистических моментов (среднего, дисперсии и т.д.) теряют смысл и начинают давать ерунду.

Вернемся к Израилю. В прекрасной англоязычной статье Джефри Морриса данные по заболеваемости привитых и непривитых из Израиля дотошно разбираются в контексте парадокса Симпсона. Дальше я не буду изобретать велосипед, а просто процитирую эту статью.

Для начала, давайте посмотрим на общую больничную статистику по Израилю по состоянию на 15 августа:


Упс! Различий в частоте тяжелых случаев заболевания среди вакцинированных и не вакцинированных практически нет. Шок, сенсация, вакцины бесполезны, максимальный репост!!!111 Шутка, конечно же нет. Даже человеку, совершенно не знающему статистики, очевидно, что надо учитывать общее количество вакцинированных и невакцинированных, чтобы делать какие-то выводы. В Израиле вакцинировано 78.7% населения и в числах это выглядит так:


Сразу же видно, что невакцинированные тяжело болеют в 3 раза чаще, чем вакцинированные, т.е. вакцины таки да работают. Но остается другой непонятный момент. Если посчитать эффективность вакцины против тяжелого течения болезни по всей популяции, то получатся весьма скромные 67.5%. Какая-то фигня. В клинических испытаниях файзера заявлялась эффективность больше 95%, а тут только 67.5%.

Вот тут и начинает работать парадокс Симпсона. Дело в том, что для коронавируса вероятность тяжелого течения болезни очень сильно зависит от возраста. Для людей старше 50 лет вирус опаснее в десятки раз, а для людей 80+ — в сотни раз! В результате вся популяция распадается на две условные группы: условно молодые и условно пожилые. Эти группы кардинально разные в плане рисков, а именно это и является предпосылкой к появлению парадокса Симпсона.

Если учесть молодых и пожилых отдельно, то получается такая картина:


Сразу видно, что среди молодых число непривитых намного больше. 85.7% из числа всех непривитых — молодые.

Теперь посмотрим на риски тяжелого течения заболевания. Для непривитых фиксируется 91.9 случаев тяжелого течения на 100 000 для пожилых и всего 3.9 для молодых. Разница в 23.6 раз. Для привитых такой же анализ дает 13.6 случаев тяжелого течения на 100 000 для пожилых и 0.3 для молодых. В абсолютных цифрах меньше, но отношение уже в 42.5 раз!

Давайте выдохнем и сформулируем этот парадоксальный момент еще раз. Среди непривитых пожилые тяжело болеют в 23.6 раза чаще, чем молодые. Но среди привитых пожилые тяжело болеют в 42.5 раза чаще, чем молодые! Если смотреть на эти цифры в отрыве от контекста, то опять получается, что вакцинация усугубляет риски для стариков! Естественно, это неправильно. Засада в том, что мы сравниваем две несравнимые группы с совершенно разными характеристиками т.е. считаем ту самую “среднюю температуру по больнице”, сравнивая морг с реанимацией. Ожидаемо, мы получаем полную ерунду, которую можно превратно интерпретировать в рамках антивакцинаторского дискурса “вакцины бесполезны”.

На самом деле, корректный анализ тут можно проводить только внутри возрастных групп, по строчкам таблицы, а не по столбикам. Если это сделать, то получится следующее:


Эффективность вакцины в предотвращении тяжелого течения болезни для молодых — 91.8%, а для пожилых — 85.2%. Это уже намного ближе к значениям, полученным в клинических испытаниях. Пожилым вакцина помогает чуть меньше потому, что для них вирус в десятки и сотни раз более смертоносен и сам по себе риск тяжелого течения намного выше.

Вот мы и увидели парадокс Симпсона во всей красе. При реальной эффективности не менее 85%, кажущаяся эффективность по всей популяции получается всего 67.5%. Причина в некорректном суммировании двух несопоставимых групп с кардинально разными характеристиками.

Приведу еще одну таблицу из статьи Морриса, где показано намного более детальное сравнение разных возрастных групп:


Видно, что если сделать еще более дробное деление по возрастам, то эффективность вакцины внутри большинства возрастных групп еще больше повышается. Наименьшей она оказывается для группы 80–89 лет (81.1%), а для еще более старых людей 90+ опять повышается до 92.4%. Тут уже начинают работать более хитрые факторы, связанные с сопутствующими заболеваниями. Грубо говоря, современная израильская медицина может дотянуть многих хронических больных до 90 лет, но, увы, не до 100. Чтобы дожить до 100 нужна уже, грубо говоря, особо удачная наследственность, которая дана не всем. Поэтому среди группы 80–89 будет больше людей с серьезными сопутствующими патологиями, чем среди долгожителей 90+. В целом же, эффективность вакцины очень высока — 80-90% у пожилых и под 100% у молодых.

Мораль

Статистические закономерности часто бывают контринтуитивными и противоречащими бытовой логике. Если пытаться интерпретировать сложные и многофакторные статистические данные с позиций “кухонного эксперта”, который прогуливал математику начиная с 6-го класса, то ничего хорошего не получится. Так и в случае с вакцинальной статистикой — профаны-антиваксы считают “среднюю температуру по больнице”, получают, естественно, лютую фигню, но не видят никакой ошибки. На основе этих неправильных расчетов они делают в корне ошибочный вывод о том, что “вакцины не эффективны” и носятся с ним как дурень с писаной торбой.

Все приведенные тут расчеты, по хорошему, тривиальны и доступны неглупому школьнику. Просто их надо делать аккуратно и с пониманием того, что именно мы считаем. Другими словами, важно не просто манипулировать циферками, а еще и понимать, что за этими цифрами стоит — знать предметную область и владеть методикой статистического анализа данных. Иначе вы будете получать смешную херню.

Поскольку целью антивакцинаторов является не выяснить реальное положение дел, а любой ценой подтвердить догмат своей псевдорелигии, то они с радостью используют ошибочную интерпретацию статистических данных и в упор не хотят видеть парадокса Симпсона. Иными словами, они лгут и манипулируют — ни на что иное эти деятели просто не способны. Это и не удивительно, ведь им, бедняжкам, приходится “доказывать” заведомо ложный тезис, а сделать это без вранья и манипуляций невозможно.

Семен Есилевский