ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ
Валидизация шкал MFTS и AQSA у больных с переломами костей стопы в составе множественной и сочетанной травмы
Кафедра травматологии, ортопедии и военно-полевой хирургии, педиатрический факультет,
Российский национальный исследовательский медицинский университет имени Н. И. Пирогова, Москва
Для корреспонденции: Королёв Максим Александрович
Ленинский пр-т, д. 10, корп. 7, г. Москва, 117049; ur.liam@ffelorokrotcod
Современные требования к оказанию медицинской помощи пациентам с тяжелыми травмами заставляют врача думать не просто о ранней диагностике, активном лечении и последующей реабилитации пациента, но и об экономической эффективности всех действий, о сокращении сроков лечения и реабилитации и снижении инвалидизации. Диагностика и лечение сочетанных и множественных травм, помимо объективных сложностей — кратковременности пребывания пациента в отделении, отсутствия анамнестических данных и общего тяжелого состояния, — характеризуются значительными финансовыми и материальными затратами клиник и фондов медицинского страхования. Это определяет важность объективной оценки эффективности лечения, для чего используют, как правило, шкалы оценки.
Существует большое количество шкал и оценочных опросников. Выделяют неспецифичные (общеоценочные: VAS, NRS, SF-36 и др.) и специфичные шкалы (для определенной патологии: AOFAS, FFI, DASH и др.), которые можно охарактеризовать по валидности (обоснованности), комплаентности (дружелюбности), надежности, воспроизводимости результатов в последующих исследованиях, чувствительности к объективным изменениям в показателях. По этим параметрам выбирают оценочный инструмент для определенной группы пациентов [1, 2, 3].
Однако существующие шкалы несовершенны, и требуется создание новых опросников для оценки исхода лечения и его правильной интерпретации, а также их валидизация [4, 5, 6, 7]. Нами на кафедре травматологии, ортопедии и военно-полевой хирургии Российского национального исследовательского медицинского университета имени Н. И. Пирогова были разработаны две новые шкалы.
Moscow Foot Trauma Scale, MFTS (московская шкала оценки функции стопы после травмы) — специфичная шкала для оценки результатов лечения после повреждения костей стопы. Состоит из субъективной и объективной части, каждая из которых включает 3 вопроса с вариантами ответов (рис. 1). В конце шкалы даны ключи, указывающие количество баллов за каждый ответ. Возможная сумма баллов — от 0 до 90. Возможные результаты оценки эффективности лечения: 90–61 б — отлично; 60–41 б — хорошо; 40–21 б — удовлетворительно; 20–11 б — плохо; 10–0 б — очень плохо.
Abbreviated Questionnaire of Subjective Assessment, AQSA (сокращенный опросник субъективной оценки) — неспецифичная шкала, по которой можно оценить наличие у пациента ограничения активности, потребность в ортопедической обуви повышенной сложности, использование средств дополнительной опоры, необходимость купирования болевого синдрома анальгетиками, изменение характера выполняемой работы. Включает 6 вопросов (рис. 2). В конце шкалы даны ключи, указывающие количество баллов за каждый ответ. Возможная сумма баллов — от 0 до 30. Чем выше значение, тем хуже результат: 0–10 б — хорошо; 11–20 б — удовлетворительно, выше 20 б — плохо.
Перед использованием вновь разработанной шкалы необходимо подтвердить ее теоретическую и прагматическую валидность в условиях применения. Подтверждение теоретической валидности позволяет определить, действительно ли данная шкала оценивает нужный нам показатель, а прагматической — насколько хорошо шкала выполняет свою функцию на практике, при работе с пациентами. Валидность толкуют по-разному — в зависимости от задачи. Обычно под ней подразумевают степень уверенности в том, что тест, измерение или эксперимент действительно выполняет ту функцию, для которой они предназначены [8].
Проверка валидности нового инструмента оценки является довольно сложной задачей. В травматологии для верификации теоретической валидности чаще всего используют шкалы SF-36 (Short Form 36) и AOFAS (American Orthopaedic Foot and Ankle Society Score), которые подтвердили свою устойчивость в популяционных исследованиях на больших и относительно однородных выборках [9, 10, 11, 12, 13].
В ходе анализа должна отмечаться связь признаков, оцениваемых проверяемой шкалой, с родственными признаками шкалы-эталона и отсутствие ее с признаками, имеющими другие теоретические основания. Тогда это будет означать, что сфера применения шкалы была выбрана правильно.
Прагматическую валидность оценивают по внешнему признаку, который должен быть релевантным (т. е. по смыслу соответствовать изучаемому признаку), свободным от помех (обычно это обеспечивается формированием достаточно однородной выборки) и надежным [14].
До проверки валидности требуется установить уровень надежности системы. Надежность — это относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном применении на одной группе пациентов. К. М. Гуревич рекомендует толковать надежность как: 1) надежность самого измерительного инструмента; 2) стабильность изучаемого признака; 3) константность, т. е. относительную независимость результатов от личности экспериментатора, — и предлагает рассчитывать три соответствующих коэффициента: надежности, стабильности и константности [15].
Коэффициент надежности рассчитывают методом расщепления (split-half reliability), при котором тест разделяют на равные части и вычисляют корреляционную связь между их значениями. При значении коэффициента корреляции выше 0,75 методика признается надежной.
Коэффициент стабильности изучаемого признака определяют приемом тест-ретест. Его смысл заключается в повторном тестировании группы испытуемых с применением исследуемой методики. Значение коэффициента корреляции между первичным и повторным исследованием характеризует стабильность признака.
Константность проверяют проведением тестирования одной группы испытуемых по одной методике, но разными исследователями. При соблюдении одинаковых условий значение коэффициента корреляции должно быть выше 0,80.
Помимо расчета указанных коэффициентов, можно оценить надежность системы методом эквивалентных бланков, который требует создания похожих форм одного теста и его тестирование на большой группе пациентов с вычислением корреляционной связи. Нами он не использовался в связи с большой трудоемкостью и относительно малой выборкой.
Совместно с вычислением вышеперечисленных показателей следует определять коэффициент внутренней согласованности (альфа Кронбаха, αK), коэффициент раздельного коррелирования (лямбда Гутмана, ʎG) и коэффициент Кадера–Ричардсона, (KR20) [16, 17, 18].
Целью исследования являлась проверка валидности шкал MFTS и AQSA для пациентов с переломами костей стопы в составе сочетанной и множественной травмы.
ПАЦИЕНТЫ И МЕТОДЫ
В исследование включили 79 пациентов (59 мужчин, 20 женщин; средний возраст — 42 года) травматологического отделения Городской клинической больницы № 1 им. Н. И. Пирогова, прошедших в 2007–2016 гг. лечение по поводу переломов костей стопы в составе сочетанной и множественной травмы. Оперативное лечение провели у 32 пациентов, консервативное — у 47. Исследование было одобрено Этическим комитетом РНИМУ им. Н. И. Пирогова (протокол № 139 от 10.11.2014). Все пациенты дали информированное согласие на участие в исследовании.
По локализации переломы на правой стопе встречались чаще (n = 39), чем на левой (n = 27), и были билатеральными у 13 больных. При первичных осмотрах было выявлено 69 переломов, что составило 54,3 % от их общего числа. При последующих осмотрах травматологами и другими специалистами были диагностированы еще 24 перелома (26,0 %). Еще 28 переломов были позднодиагностированными, и из них 12 нуждались в оперативном лечении. Чем тяжелее было состояние пациента, тем выше был процент позднодиагностированных переломов. При тяжести состояния, оцененной по шкале ISS (Injury Severity Score) менее чем в 16 б, недиагностированными были 11 переломов, а более чем в 16 б — 17. До травмы 55 человек были полностью трудоспособными, после лечения трудоспособность сохранили 37 пациентов.
После много- либо одноэтапного лечения пациентов выписывали из стационара и наблюдали в травмпункте по месту жительства. При необходимости больных направляли в консультативный кабинет при крупных больницах.
Пациентов разделили на две группы: группу пациентов с ретроспективным наблюдением (n = 36) и группу пациентов с проспективным наблюдением (n = 43). Результаты лечения оценивали через 1, 3, 6 и 12 мес после травмы или повторного лечения, используя разработанные шкалы MFTS и AQSA и шкалы SF-36 и AOFAS. Для всех шкал рассчитали коэффициенты надежности, стабильности, константности, αK, ʎG и коэффициент внутригрупповой корреляции. Коэффициент Кадера–Ричардсона не вычисляли в связи с недихотомическим характером всех шкал. При использовании приема тест–ретест повторное тестирование проводили через 11 ± 3,2 дня.
Полученные числовые значения результатов лечения пациентов с переломами костей стопы показывали важность внимательного отношения к проблемам диагностики и лечения костей стопы, а также своевременного и внимательного ознакомления пациента с тактикой дальнейшего лечения.
Для статистического анализа данных использовали программу Statistica 10.0 (StatSoft, США). При относительно небольшой выборке приняли уровень значимости p ≤ 0,05. Для анализа данных использовали методы непараметрической статистики в связи с наличием в большинстве случаев распределения данных, отличного от нормального.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
В табл. 1 в качестве примера использования шкал представлены результаты оценки эффективности лечения пациентов через 12 мес с использованием эталонных и изучаемых шкал. Суммы баллов по шкалам MFTS и AQSA наравне с оценкой по шкалам SF-36 и AOFAS подтвердили закономерность: чем позднее были диагностированы переломы, тем ниже была эффективность лечения.
Коэффициент Кронбаха, свидетельствующий о внутренней согласованности шкалы, был наибольшим у шкалы MFTS, а коэффициент Гутмана — у общефизической составляющей шкалы SF-36 (PCS) (табл. 2). Высоким было и значение ʎG у MFTS.
Для шкалы MFTS в разные периоды тестирования значения коэффициента константности находились в диапазоне от 0,81 до 0,93, для AQSA — от 0,57 до 0,69.
Коэффициент внутригрупповой корреляции, определенный с помощью приема тест–ретест, был равен для MFTS 0,85–0,96, а для AQSA — 0,76–0,93 (для обеих шкал р ≤ 0,05). Такой результат указывает на высокую зависимость показателей внутри шкал MFTS и AQSA.
В табл. 3 представлены значения конвергентной корреляции между эталонными и изучаемыми шкалами для обеих групп пациентов. Как видно, они имели низкий уровень значимости. Была выявлена связь шкалы MFTS с AOFAS и общефизическим компонентом SF-36, что логично, учитывая однонаправленную специализацию этих опросников. Однако все значения имели низкий уровень значимости, поэтому наличие реальной связи между шкалами можно только предполагать.
AQSA ввиду своей низкой специфичности коррелировала одновременно с физическим и психологическим компонентами SF-36, а корреляционная связь между ней и шкалой AOFAS имела отрицательное значение.
ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Высокий коэффициент Кронбаха у MFTS указывает на оптимальное построение вопросов в шкале. С помощью программы Statistica 10.0 оценили необходимость исключить похожие вопросы, и для MFTS было рекомендовано убрать 2 вопроса (чтобы снизить значение αK), в то время как для AOFAS и AQSA было рекомендовано добавить от 1 до 3 вопросов для повышения внутренней согласованности оценочного инструмента.
Коэффициент Гутмана подтвердил эффективность оценки с применением общефизической составляющей шкалы SF-36 (0,986). Высокие значения показателя тест–ретест — 0,85–0,96 для MFTS и до 0,93 у AQSA — отразили хорошую воспроизводимость этих шкал.
Полученные данные свидетельствуют о достаточно высоком уровне индивидуальной валидности шкал MFTS и AQSA. Но значения конвергентной валидности при сравнении с эталонными шкалами были невысокими. Нельзя сказать точно, какой будет корреляция между показателями в условиях другого эксперимента, но важно, что связь все же есть. Возможно, в дальнейших исследованиях с участием разных групп пациентов нам удастся подтвердить ее наличие.
ВЫВОДЫ
Результаты статистического анализа данных подтвердили высокую обоснованность, комплаентность для врача, чувствительность и надежность шкалы MFTS. К ее недостаткам относятся средняя воспроизводимость и низкая комплаентность для пациента. Шкала AQSA показала высокую надежность, воспроизводимость, комплаентность для врача и пациента, но низкую обоснованность и чувствительность. Значения конвергентной валидности указанных шкал с SF-36 и AOFAS продемонстрировала наличие связи между шкалами, но — относительно слабой связи.
Шкалы MFTS и AQSA можно применять для оценки эффективности лечения пациентов с переломами костей стопы в структуре сочетанной и множественной травмы, но при этом должны учитываться указанные для них особенности.