Рекомендации по описанию статистических данных,EHJ

Адаптированный перевод Рекомендаций по описанию статистических данных для Европейского кардиологического журнала (перевод – Вихиревой О.В.)

http://www.oxfordjournals.org/our_journals/eurheartj/for_authors/stat_guide.html

Использование адекватных статистических методов является обязательным условием публикации рукописей в Европейском Кардиологическом Журнале (European Heart Journal, EHJ) (общие требования к рукописям представлены в статье "Uniform Requirements for Manuscripts Submitted to Biomedical Journals", Ann Intern Med 1997 126: 36-47). По мнению EHJ, описание использованных статистических методов должно быть настолько простым, насколько возможно, но при этом настолько подробным, насколько необходимо. В частности, описание клинических испытаний должно соответствовать большему числу определенных статистических стандартов, по сравнению с описанием патофизиологических исследований. Ниже обобщены отдельные аспекты и возможные проблемы описания дизайна исследования, анализа данных и представления полученных результатов. Для описания исследований со сложным дизайном желательно привлечение специалиста-статистика.

Дизайн исследования и анализ данных должны быть достаточно кратко, но четко описаны в разделе «Методы». Следует указать, какой статистический пакет был использован, и каков был уровень статистической значимости для двусторонних сравнений (требование двусторонних сравнений является обязательным). По возможности, рекомендуется использование стандартных статистических методов. Для нетрадиционных или новых статистических методов следует приводить соответствующие ссылки. Для того, чтобы заинтересованные читатели могли ознакомиться с информацией об особо сложных или инновационных методах, рекомендуется приводить их подробное описание в разделе «Дополнительные материалы».

Дизайн исследования

Для большинства исследований вначале (a priori) формулируется рабочая гипотеза, в соответствии с которой разрабатывается дизайн исследования. Авторы должны указать, является ли их исследование рандомизированным или обсервационным (наблюдательным), проспективным или ретроспективным, многоцентровым или одноцентровым. Если целью исследования была формулировка гипотезы, это следует четко указать. Необходимо дать определение популяции исследования и описать порядок формирования представительной выборки. Также следует перечислить критерии включения и исключения и пояснить, как была разрешена проблема отсутствующих данных (missing data). Число задач исследования либо конечных точек должно быть минимальным, во избежание проблемы множественных сравнений (см. ниже). Исследования должны выполняться в соответствии с двойным слепым методом; по возможности, распределение по группам экспериментального или клинического вмешательства должно быть рандомизированным. Расчет статистической силы исследования, с целью определения минимального числа его участников, обязателен для клинических испытаний и желателен для исследований иного дизайна. Исключением могут быть исследования редких заболеваний, при условии адекватного обоснования количества включенных пациентов. Следует избегать апостериорной (post-hoc) оценки анализа статистической силы исследования. Для обсервационных исследований необходимо подробное описание процедуры отбора участников.

Описательная статистика

Для непрерывных переменных с распределением, близким к нормальному, следует указывать среднее значение и стандартное отклонение (не стандартную ошибку среднего). Для величин, распределение которых отличается от нормального (например, временные показатели, индекс массы тела и т.д.), следует указывать медианное значение и межквартильный диапазон. Достаточно указывать значения с точностью до второго знака после запятой. Категоризация непрерывных переменных на квартили, квинтили и т.д. не рекомендуется, поскольку при этом частично утрачивается статистическая информация, и требуются более сложные методы анализа. Кроме того, границы создаваемых категорий не будут валидными при сравнении полученных данных с результатами других исследований.

Количественные данные следует представлять в виде абсолютных значений и процентов, особенно для исследований с небольшим объемом выборки. Если число участников исследования не превышает 200, проценты следует указывать без знаков после запятой; в остальных случаях достаточно указывать один знак после запятой. Необходимо указывать лишь те корреляции, которые имеют отношение к гипотезе исследования, и приводить соответствующие доверительные интервалы.

С целью облегчения понимания представляемого материала, предпочтение следует отдавать графикам и диаграммам, а не чрезмерно большим таблицам. Дополнительная количественная информация должна быть представлена в разделе «Дополнительные материалы». При подготовке графиков и диаграмм необходимо учитывать следующие требования:

  • правильное соотношение осей абсцисс (x) и ординат (y)
  • достаточная толщина линий
  • достаточная, но не чрезмерная компактность изображения (например, кривых)
  • включение нулевой точки (0, 0) при необходимости
  • использование цвета, а не штриховки, с целью облегчить восприятие материала читателями (EHJ не взимает дополнительную плату за цветную печать)
  • не следует искажать масштаб осей координат с целью преувеличения выраженности несущественных различий.

При подготовке графиков и диаграмм следует помнить о психофизиологических особенностях восприятия иллюстративного материала.

При представлении кривых Каплана-Мейера рекомендуется указывать число лиц, у которых конечная точка еще не зарегистрирована (people at risk), для каждой из групп наблюдения и для различных временных интервалов.

Построение статистической модели

Зачастую для выполнения целей исследования требуется построение статистической модели. В классической регрессионной модели зависимая переменная является непрерывной величиной, с распределением, близким к нормальному, а независимые переменные представляют собой набор достаточно простых, со статистической точки зрения, предикторов. В логистической регрессионной модели и регрессионной модели Кокса зависимая величина является, соответственно, бинарной переменной либо временем до регистрации конечной точки. Независимо от типа регрессионного анализа, выбор предикторов может быть непростой задачей. Ввиду особой важности данного этапа статистического анализа, он требует более подробного описания в рукописи.

В частности, следует избегать автоматического, пошагового отбора предикторов, при котором могут быть отобраны случайные независимые переменные и отвергнуты более важные предикторы. Кроме того, результаты подобного автоматического отбора не могут быть экстраполированы на другие, сходные базы данных, поскольку группа выбранных предикторов будет иметь случайный характер. Также следует избегать попарного отбора независимых переменных (Sun et al. 1996, J Clin Epidemiol 49: 907-16). В идеале, выбор предикторов должен основываться на соответствующих клинических данных и результатах ранее выполненных исследований. В отдельных случаях допустимо использование методов усредненной модели и максимального правдоподобия с использованием штрафных функций (penalized maximum likelihood). Существует целый ряд статистических методов выбора и оценки статистических моделей. Одним из наиболее известных методов является бутстреппинг (bootstrapping). Более подробную информацию можно найти в статистических публикациях Harrell и других авторов (например, см. Stat Med 1996, 15:361-387). Авторам необходимо указать все переменные, которые рассматривались в отношении возможности включения в статистическую модель, и описать процесс создания основной статистической модели исследования. Описание выбора переменных-конфаундеров может быть менее подробным, чем разъяснение порядка отбора основных предикторов.

В зависимости от вида статистической модели, следует проверить допущения, на которых она основана. Так, для линейных моделей множественной регрессии допущение линейного характера и нормального, либо близкого к нормальному, распределения переменных проверяется с помощью оценки регрессионных остатков. Для регрессионных моделей Кокса  следует проверить допущение пропорциональности рисков.

Моделирование с использованием повторных измерений (например, при неоднократном измерении тех или иных показателей у одного и того же участника) представляет собой непростую задачу. В частности, данная ситуация возникает, если протокол исследования предусматривает повторные клинические визиты либо измерение определенного параметра в различных условиях. Значения того или иного показателя, полученные при повторных измерениях у одного и того же участника, коррелируют между собой. Моделирование подобных данных было бы достаточно простым при постоянной выраженности этой корреляции (допущение составной симметрии, compound symmetry assumption). К сожалению, в большинстве случаев корреляция ослабевает по мере нарастания временного либо дистанционного разрыва между повторными измерениями. При дисперсионном анализе (ANOVA) следует выполнять коррекцию значений p методом Гринхауза-Гейзера. При анализе проспективных данных необходимо использовать иные методы, которые не только являются более корректными со статистической точки зрения, но и предоставляют больше информации о динамике тех или иных переменных, по сравнению с методами анализа данных, полученных в одномоментных исследованиях. При одном повторном измерении следует применять парный t-тест либо критерий знаковых рангов Уилкоксона, вместо их аналогов для двух независимых выборок.

Особого внимания также заслуживает анализ данных, имеющих кластерный характер (например, количество атеросклеротических бляшек у того или иного пациента, число членов семьи и т.д.). Так же, как и в случае повторных измерений, кластерные данные коррелируют между собой, однако число наблюдений в кластере носит случайный характер. Кластерные данные могут анализироваться с помощью метода смешанных линейных моделей (кластер рассматривается в качестве случайного эффекта) либо метода обобщенных оценивающих уравнений (generalized estimating equations). Для анализа повторных измерений и кластерных данных рекомендуется привлекать специалиста-статистика. В то же время, в случае, когда у 250 участвующих в исследовании пациентов имеется 270 коронарных стентов, анализ данных может основываться на допущении «один пациент – один стент».

Статистическая достоверность ассоциации, даже если она была продемонстрирована с использованием комплексной модели, не всегда свидетельствует о причинно-следственном характере данной ассоциации.

Утверждение о причинно-следственном характере той или иной ассоциации должно основываться на иных аргументах. Ошибки измерения при сборе данных приводят к систематическому искажению параметров мультивариационной модели, отражающих силу изучаемой ассоциации (коэффициент корреляции, коэффициент регрессии, отношение шансов и т.д.). В частности, поскольку ошибки измерения увеличивают дисперсию, это приводит к недооценке выраженности изучаемой ассоциации. Артериальное давление является типичным примером показателя, подверженного ошибке измерения.

Статистические тесты

Статистические тесты предоставляют возможность формального принятия решения в случае, когда полученные результаты не могут быть однозначно расценены как подтверждающие либо опровергающие гипотезу исследования. Если данные описательного анализа свидетельствуют в пользу изучаемой гипотезы, однако величина р не достигает статистической значимости, необходимо признать невозможность формального подтверждения гипотезы. При значениях р=0,05 (<0,01), следует не утверждать о наличии «тренда», а признать, что для подтверждения гипотезы требуются дополнительные исследования.

При выполнении статистических тестов необходимо учитывать ряд особенностей, указанных ниже.

Проверка допущений, на которых основываются тесты: Известно, что t-тест и большинство других тестов основаны на допущении нормального, или близкого к нормальному, распределения данных. Это допущение следует проверить с использованием собственных данных либо данных литературы. Проверка нормальности распределения данных может быть выполнена графически (с помощью диаграмм и гистограмм), путем расчета коэффициента асимметрии и куртозиса, с помощью теста Шапиро-Уилка, а также другими методами. Для данных, распределение которых отличается от нормального, могут быть использованы непараметрические тесты (например, тест Манна-Уитни, вместо t-теста для двух независимых выборок). При невозможности применения непараметрических тестов, рекомендуется трансформация данных (например, лог-трансформация) для достижения нормального распределения. Зачастую трансформация данных увеличивает их информативность и/или облегчает интерпретацию полученных результатов. При необходимости, следует обратиться к специалисту-статистику.

Выбор между критерием хи-квадрат и точным критерием Фишера (либо другими точными критериями для кросстабулированных переменных): При анализе категориальных данных, как правило, используется критерий хи-квадрат. В то же время, для исследований с небольшим объемом выборки предпочтительно применение точных критериев (например, точного критерия Фишера).

Значения р: Следует всегда указывать точные значения р, не ограничиваясь утверждением об отсутствии статистически значимых различий (что зачастую обозначается как ns - non-significant); например, р=0,14, а не p=ns. Значения р следует указывать с точностью до первого отличающегося от нуля знака после запятой; для близких к нулю значений указывается р<0,0001.

Доверительные интервалы: При описании основных результатов все значения должны сопровождаться доверительными интервалами.

Значения р не достигают уровня статистической значимости: Если значения р не достигают уровня статистической значимости, это не служит достаточным основанием для отвержения изучаемой гипотезы. Отсутствие статистической значимости может быть обусловлено иными причинами, такими как размер выборки, частота конечной точки и относительная величина наблюдаемого эффекта. О степени влияния этих факторов на отсутствие статистической значимости можно судить по результатам расчета статистической силы исследования.

Множественные сравнения: При оценке частоты двух и более основных конечных точек, либо при изучении риска, связанного с целым рядом генетических полиморфизмов, необходимо выполнять поправку для множественных сравнений. Наиболее простой процедурой является поправка Бонферрони.

Одно- и двусторонние сравнения: Как правило, следует выполнять двусторонние сравнения.

Сравнение значений р: При оценке межгрупповых различий следует воздерживаться от сравнения абсолютных значений р, полученных для каждой из этих групп по отдельности. Оценка межгрупповых различий требует применения дополнительных статистических тестов.

Статистическая и клиническая значимость: Статистически достоверный результат, даже при близких к нулю значениях р, не всегда обладает клинической или научной значимостью. Вопрос о клинической или научной значимости полученных данных следует решать с учетом особенностей изучаемой проблемы. Для подтверждения значимости результатов желательно указывать не только статистически достоверные значения р, но и величину изучаемого эффекта. Последнее особенно важно для крупных исследований, в которых даже относительно небольшие эффекты могут быть статистически достоверными. При оценке клинической или научной важности результатов следует также учитывать границы доверительных интервалов.

Сравнение сопоставимых групп: Если группы различаются по важным признакам (например, по возрасту), это различие следует учитывать при сравнении выраженности изучаемого эффекта (например, эффективности терапии), путем поправки на соответствующие независимые переменные либо с помощью балльной оценки (propensity score). При использовании балльной оценки, в разделе «Методы» следует указать, какой именно метод был применен (подбор, стратификация и т.д.), какие переменные были учтены, и была ли достигнута сопоставимость групп. В рандомизированных исследованиях с достаточно большим объемом выборки сопоставимость групп обеспечивается благодаря процедуре рандомизации.

Специализированные руководства

За последние годы экспертными комитетами был подготовлен целый ряд руководств по отдельным вопросам описания результатов исследований. Как правило, авторам следует придерживаться требований, изложенных в данных руководствах.

Клинические испытания: следует ознакомиться с требованиями CONSORT (CONsolidated Standards of Reporting Trials). Перед представлением рукописи необходимо убедиться, что к ней прилагается заполненная карта CONSORT. Также желательно приложить копию протокола клинического испытания.

Для систематического обзора результатов клинических испытаний следует придерживаться требований PRIISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses).

При планировании исследования диагностических методов необходимо ознакомиться с руководством STARD (STAndards for the Reporting of Diagnostic accuracy studies). Авторам следует заполнить карту STARD и уточнить верность указываемой в карте информации непосредственно перед представлением рукописи в журнал.

При описании результатов эпидемиологического исследования следует придерживаться требований STROBE (STrengthening the Reporting of OBservational studies in Epidemiology). С картой STROBE можно ознакомиться здесь

Новости

07 Май 2018
«Платиновая Унция XVIII» определила лидеров фармотрасли

12 апреля подведен итог работы фармацевтической отрасли за 2017 год…

29 Август 2016
Риски назначения антитромбоцитарной терапии

Вопрос назначения антитромбоцитарной терапии в случаях с высокими рисками остаётся…

26 Август 2016
Риски и исходы мерцательной аритмии

Сообщаются данные исследования пациентов с мерцательной аритмией старшего возраста в…

  • Архив новостей
    Яндекс.Метрика