Сопоставление описания испытаний, включенных в метаанализ прямого сравнения антипсихотиков второго поколения, позволило получить следующие результаты
[1, 32-38, 56]. Возраст участников в разных исследованиях (в данном случае не учитывались наблюдения, касающиеся исключительно лечения больных старших возрастных групп и молодых пациентов с впервые возникшими психотическими состояниями) находился в интервале 32,4 ± 11,0 / 46,4 ± 9,1 года; соотношение по полу (мужчины/женщины) – 31,8/68,2% / 88,9/11,1%.
Во всех случаях изучались лица с шизофренией, а в ряде работ дополнительно с шизоаффективным расстройством или в целом с расстройствами шизофренического спектра. Диагностика в подавляющем большинстве наблюдений (вне зависимости от региона проведения исследования – Северная Америка, Европа, Австралия и Новая Зеландия) осуществлялась по DSM-IV (в более ранних публикациях по DSM-III-R) и лишь в единичных работах – по Международной классификации болезней Всемирной организации здравоохранения, в определенной степени отличающейся от Американской национальной классификации. В исследования включались все формы шизофрении с наибольшей частотой встречаемости параноидной формы, распространенность которой в разных работах варьировала от 50,0 до 90,0% (данные представлены преимущественно в публикациях европейских авторов). Диапазон диагностики дезорганизованной формы составлял от
0 до 32,6%, недифференцированной – от 0 до 40,0%, кататонической – от 0 до 3,4%, резидуальной шизофрении – от 0 до 7,3%. Количество предшествующих госпитализаций варьировало от 5,9 ± 4,8 до 14,0 ± 10,8 (то есть согласно правилу трех сигм в последнем случае у 99,7% больных число госпитализаций находилось в интервале от 0 до 46). Длительность текущего обострения симптоматики составляла от 7 дней до 2 и более лет (разница медиан достигала 10 месяцев). Тяжесть расстройств (суммарная оценка по шкале позитивных и негативных симптомов [PANSS]) при включении больных в исследования находилась в интервале 69,3 ± 18,5 / 112,4 ± 17,6 балла, по субшкале позитивной симптоматики – 15,9 ± 5,8 / 27,2 ± 6,2 балла, негативной симптоматики – 19,6 ± 7,2 / 29,4 ± 6,9 балла. Таким образом, не только по демографическим показателям, но и по представленным в публикациях
(к сожалению, далеко не в полном объеме) клиническим характеристикам, группы пациентов обнаруживали определенный спектр, по крайней мере, в своих крайних точках существенно различающихся между собой значений.
В целом можно сделать вывод, что выборки пациентов, включаемых в клинические испытания, по ряду клинико-социальных показателей не только отличаются от всей когорты больных шизофренией в этих же исследовательских центрах, но и обнаруживают существенные расхождения при сопоставлении контингента больных, принимавших участие в разных наблюдениях. Исходя из этого, полученные в анализируемых клинических исследованиях результаты не могут быть распространены на всю генеральную совокупность лиц с шизофренией и касаются лишь ограниченной группы, которая соответствует только изученной (причем учитывая заметную скудость имеющихся во многих публикациях клинических описаний, идентифицировать эту группу бывает достаточно сложно).
Следующий аспект проведенного анализа касался изучаемых в клинических исследованиях показателей. Как отмечалось выше, основными задачами изучения в этих случаях является определение эффективности и безопасности/переносимости исследуемого препарата. С этой целью используются психометрические шкалы и стандартизированные опросники, позволяющие унифицировать оценку и минимизировать влияние на нее субъективного фактора
4 . В то же время негативной стороной подобного подхода является ограниченность сведений, получаемых с помощью любой, пусть даже самой совершенной шкалы, которая, безусловно, не способна охватить весь масштаб психопатологической структуры расстройств, в значительной степени редуцируя их, а некоторые не учитывая. Все большую популярность приобретают краткие шкалы или версии шкал и опросников, экономящие время исследователей, но еще более сокращающие спектр изучаемых показателей. Так, краткая психиатрическая рейтинговая шкала (BPRS), разработанная в 1962 г. и до сих пор пользующаяся большой популярностью, содержит всего 18 пунктов (первоначальная версия имела 16 пунктов), и ее заполнение занимает только 20-30 минут [46].
В части случаев для характеристики клинического статуса больных используются лишь отдельные пункты шкал. Например, в ряде анализируемых работ тяжесть состояния больных определялась лишь по четырем пунктам шкалы PANSS («необычное содержание мыслей», «галлюцинаторное поведение», «концептуальная дезорганизация», «подозрительность»), причем для установления требуемой по протоколу глубины расстройств достаточно было иметь определенный минимальный балл лишь по двум из них
5 . При этом динамика указанных пунктов при окончательном анализе не учитывалась.
Подобный подход характерен для всех проанализированных работ: при оценке терапевтической динамики психопатологических расстройств основной акцент делался на изучении суммарных показателей («общая эффективность»), а также в значительном числе случаев показателей позитивных и негативных расстройств
6 . Ни в одной из изученных публикаций не осуществлялся детальный анализ отдельных пунктов используемых шкал (то есть отдельных проявлений заболевания), и лишь в некоторых из них проводилось изучение групп факторов (таких, например, как «нарушение мышления», «анергия», «тревога/депрессия», «враждебность/подозрительность» и др. при использовании BPRS). Однако и в этих случаях основное внимание уделялось глобальной оценке их динамики (более детальные данные, при их наличии, приводились преимущественно в виде табличного материала и практически не обсуждались в тексте).
Определенным исключением из этого являлись работы, специально посвященные изучению отдельных, наиболее привлекающих внимание авторов аспектов заболевания, в частности постпсихотической депрессии, суицидальной активности, агрессивного поведения и некоторых других. Однако полученные для оценки этих характеристик данные психометрических шкал также анализировались по суммарному показателю, без попыток определить динамику отдельных пунктов шкалы. При этом анализ ограничивался поведенческим уровнем, без определения стоящих за ним психопатологических феноменов (например, регистрировалось наличие суицидальных мыслей или тенденций, но не рассматривались психопатологические причины их возникновения).
В анализируемых публикациях ни в одном случае не определялось соотношение полученных результатов с социально-демографическими и клинико-организационными характеристиками, представленными при описании контингента больных; в этих условиях их наличие в тексте статей фактически было лишено смысловой нагрузки, превращаясь в пустую формальность
7 , усугубляющуюся еще и тем, что в части публикаций различия между сравниваемыми группами по этим показателям достигали статистически значимого уровня.
Более детально в тексте изученных статей были представлены характер и частота встречаемости побочных эффектов и нежелательных явлений терапии. Однако, как и в отношении клинических проявлений заболевания, анализ во всех случаях основывался на усредненных показателях. Ни в одной работе не обсуждалось, у каких больных развились те или иные побочные эффекты и что предрасполагало к их развитию или способствовало ему.
Отсутствие в статьях полной информации о полученных в исследованиях результатах, по-видимому, является одним из наиболее типичных их недостатков
8 . В частности, как следует из обсуждаемых метаанализов, только в 15,3% публикаций результаты были предоставлены в полном объеме, а в 83,5% случаев отмечалось выборочное изложение материала (в части случаев определить это, по мнению авторов, было затруднительно), причем данный недостаток касался в том числе и ряда аспектов, которые декларировались как дополнительные или даже основные задачи работы [1, 32-38, 56].
Переходя к анализу статистической обработки представленных в изученных публикациях данных, следует обратить внимание на один существенный аспект
9 : считается, что для повышения непредвзятости доказательных исследований необходимо заранее четко определить, какие показатели и какими статистическими методами будут обрабатываться. Однако при таком подходе при обнаружении некоторых данных для их осмысления может потребоваться дополнительная, в том числе статистическая обработка материала (например, выделение субгрупп, различающихся по вновь исследуемым признакам, специальные методы статистического анализа и пр.). Соответственно, при отсутствии такого подхода в тексте публикаций (как это и оказалось в целом ряде анализируемых статей) появляются статистические данные, которые трудно понять и объяснить, то есть представляющие исключительно статистический феномен, не обнаруживающий какой-либо смысловой нагрузки и, естественно, только регистрирующийся, но не обсуждающийся.
В целом, статистический анализ в изученных публикациях, несмотря на определенное разнообразие применяемых методик, касался довольно узкого аспекта: при обработке материала основное внимание исследователей уделялось выявлению статистически значимых различий между сравниваемыми показателями (причем, как уже отмечалось выше, в основном это касалось суммарных оценок, без сопоставления отдельных характеристик). Между тем доказательство статистических различий в обследованных выборках указывает лишь на то, что они сохранятся в том же объеме и в генеральной совокупности. Однако этот статистический показатель никоим образом не указывает на величину различий. Для оценки последнего обычно используются другие подходы. К ним, например, относится вычисление «величины эффекта», которая определяет силу изучаемого воздействия
10 . Еще одним используемым с этой целью показателем является относительный риск (или соотношение рисков), рассчитываемый как частное вероятности наступления изучаемого исхода в основной группе к аналогичному показателю в контрольной. И наконец, среднее количество больных, которых необходимо пролечить исследуемым методом (NNT), чтобы получить положительный результат (предотвратить неблагоприятный исход болезни) дополнительно у 1 пациента по сравнению с терапией сравнения
11.
Обращает на себя внимание тот факт, что, несмотря на очевидное практическое значение оценки величины
(а не только статистической значимости) различий сравниваемых показателей, эти данные приводятся только в отдельных работах, причем, как правило, не являясь центральной частью изложения (о чем, например, свидетельствует отсутствие этих данных в резюме статей и представление их в тексте преимущественно лишь в таблицах с короткими ссылками на них). Тем не менее, используя имеющиеся в статьях сведения, расчет указанных величин произвести можно: в частности, эти расчетные данные приводятся в анализируемых метаанализах, где выявлены определенные количественные различия в эффективности антипсихотиков второго поколения. Вместе с тем авторы признают полученные результаты лишь в небольшой степени полезными в повседневной клинической практике [41]. Дело в том, что в баллах PANSS различия составляли от 1,9 (для пары оланзапин/рисперидон) до 8,3 (при сопоставлении оланзапина и зипразидона). Колебания величины эффекта были, соответственно, от 0,11 до 0,29, что указывает на ее слабую/умеренную выраженность. Более того, средние различия в эффективности между атипичными антипсихотиками и плацебо составили только 10 баллов по PANSS (величина эффекта – 0,51) [40]. В результате одним из наиболее значимых факторов для выбора препарата в каждом конкретном случае авторы признают спектр его побочных эффектов, подчеркивая, что это может оказаться более важным, чем небольшие отличия в эффективности. Однако, хотя выводы об ограничении использования того или иного медикамента с определенным спектром побочных явлений в случае наличия у пациента соответствующей им патологии логически оправданны, они, как правило, не подкреплены клиническими данными
12. В результате постулируется, что назначение терапии в каждом конкретном случае происходит путем проб и ошибок, то есть фактически отрицается возможность целенаправленного подбора лечения [57].
Обсуждение и выводы
Описанные выше особенности получения и анализа клинического материала, безусловно, сказываются на возможности использования результатов исследований в повседневной клинической практике в отношении отдельных пациентов. Первое, что необходимо отметить, что, как известно из биомедицинской статистики, данные, полученные на репрезентативных выборках, применимы исключительно в отношении соответствующих групп больных, но их использование у отдельных пациентов не является корректным. То есть полученное в клинических исследованиях доказательство эффективности того или иного метода лечения является основанием говорить об его эффективности при применении, например, у больных шизофренией в целом, но не указывает на обоснованность его выбора при терапии конкретного пациента.
Во-вторых, как следует из анализа данных литературы, выборки пациентов, включаемых в клинические испытания, в значительной степени отличаются от контингента больных, наблюдаемых в тех же клинических центрах, и, кроме того, по ряду социально-демографических и клинико-организационных показателей обнаруживают существенные различия между отдельными исследованиями. Это обусловливает серьезные ограничения генерализации полученных в них результатов.
В-третьих, опубликованные данные, полученные в ходе клинических испытаний, касаются преимущественно суммарных оценок изучаемых характеристик и, как правило, не рассматривают детали влияния на отдельные психопатологические феномены и их совокупности (синдромы/дименсии). В тех же случаях, когда такая оценка осуществлялась, она также носила обобщенный характер, концентрируясь на суммарной тяжести расстройств (например, таких факторов, как «депрессия», «враждебность» и пр.) или степени уменьшения выраженности «нежелательного» поведения (агрессивного или аутоагрессивного) без анализа динамики стоящей за этим клинической симптоматики, что затрудняет возможность дифференцированного назначения терапии. Кроме того, негативную роль играет заметная выборочность представления полученных в исследованиях данных, часть из которых остается недоступной и, таким образом, не может использоваться в клинической практике.
Статистический анализ ограничивается преимущественно выявлением достоверности различий между сравниваемыми группами больных без определения выраженности этих различий. При этом изначальная предопределенность форм и методов обработки результатов значительно сужает возможности клинико-статистического анализа.
В результате полученные в клинических исследованиях данные и выводы лишь в небольшой степени оказываются полезными в повседневной клинической практике, поскольку касаются только ограниченного круга интересующих клиницистов вопросов, не содержат важных практических деталей, а порой являются не в полной мере достоверными; например, широко публикуются данные о влиянии ряда психотропных средств на негативную симптоматику, хотя большинство исследователей признают, что в подобных наблюдениях речь идет главным образом о вторичной негативной симптоматике, а терапевтическое влияние антипсихотиков на собственно негативную симптоматику ограниченно и противоречит концепции развития дефицитарных расстройств при шизофрении [8, 57].
В целом можно констатировать, что на сегодняшний день так называемые доказательные исследования в психиатрии являются таковыми лишь в ограниченной степени. В их основу положен достаточно узкий круг подходов (к ним в первую очередь относятся рандомизация и двойная слепая контролируемая методика), которые были объявлены «золотым стандартом» и, по существу, канонизировались с игнорированием или низведением на менее значимый уровень всех других возможностей сбора и анализа материала, некоторые из которых в конкретных, соответствующих определенным целям и задачам ситуациях могут являться, безусловно, более адекватными (анализ особенностей, сильных и слабых сторон этих методических подходов, вне всякого сомнения, чрезвычайно важен, однако его проведение выходит за рамки данной работы и требует специального рассмотрения).
Предположительно, причины сложившегося положения дел скорее всего лежат, как уже отмечалось в начале данной статьи, в значительной востребованности доказательных исследований со стороны разных регуляторных органов, для которых, однако, наиболее значимыми являются присутствующие в них формальные аспекты (с использованием дихотомии: метод эффективен или неэффективен, полученная польза перевешивает недостатки или нет и пр.), причем преимущественно на уровне групп больных (необходимо для принятия административных решений, в том числе на региональном и государственном уровне), а не отдельных пациентов (что оказывается более важным для практикующих врачей).
Значительная часть доказательных исследований в психиатрии проводится фирмами-производителями препаратов для получения разрешения на их использование и регистрации клинических показаний. Подобная работа подразумевает привлечение больших сил и средств: в них принимают участие значительное число клиницистов, нередко из многих стран мира, а количество изученных больных исчисляется сотнями, а иногда и тысячами, что, безусловно, требует тщательной координации деятельности всех участников и крупных финансовых вложений. Естественно, компании-производители стараются минимизировать объем работы и затраты, в том числе исключив из задач исследования «лишние», не требуемые регуляторными органами в обязательном порядке. Кроме того, здесь могут присутствовать и маркетинговые соображения, в частности касающиеся того, какие показания данного препарата регистрировать в первую очередь, а какие отложить
13, что, конечно же, сказывается на содержании клинических испытаний лекарственных средств.
Следует отметить, что в последние годы все больше стало появляться независимых от фармацевтических компаний исследований, что могло бы изменить ситуацию. Однако, к сожалению, этого не происходит, что объясняется рядом причин. Так, часть подобных испытаний спонсируется другими «заинтересованными» учреждениями (например, страховыми компаниями), для которых также важен формализованный, исключительно статистический подход.
Другой возможной причиной может быть сложность проведения крупных многоцентровых исследований, требующих огромной организационной работы, специального административного и координирующего аппарата (количество клинических центров, принимающих участие в таких наблюдениях, может достигать нескольких десятков в разных регионах мира) и чрезвычайно крупных финансовых вложений, значительно превышающих средства стандартных исследовательских грантов. Соответственно, в реальной практике такие независимые испытания оказываются весьма небольшими по объему изученного материала, что не всегда позволяет получить адекватную доказательную базу.
И наконец, за прошедшие десятилетия сложился определенный стереотип «правильного» («качественного») проведения клинических исследований, изменение которого потребует, по-видимому, значительных объективных и субъективных усилий. Так, необходимо будет признать, что привычный и одобряемый профессиональным сообществом подход является не всегда достаточно приемлемым. Однако, для того чтобы проводить в психиатрии действительно доказательные исследования, следует разработать обновленные требования к их осуществлению, которые заменят старые, не отвечающие современным реалиям. Разработка научных основ и организационной структуры проведения испытаний, основанных на доказательствах, является амбициозной, но чрезвычайно насущной задачей профессионального сообщества психиатров.
Литература
1. Asenjo Lobos C., Komossa K., Rummel-Kluge C. et al. Clozapine vs other atypical antipsychotics for schizophrenia // Cochrane Database Syst Rev. – 2010. – 11. – CD 006633.
2. Azorin J.-M., Spiegel R., Remington G. et al. A double-blind comparative study of clozapine and risperidone in the management of severe chronic schizophrenia // Am J Psychiat. – 2001. – 158. –
Р. 1305-1313.
3. Azorin J.-M., Strub N., Loft H. A double-blind, controlled study sertindole versus risperidone in the treatment of moderate to severe schizophrenia // Int J Psychopharmacol. – 2006. – 21. – Р. 49-56.
4. Barnett P.G., Scott J.Y., Rosenheck R.A. How do clinical trial compare to other patients with schizophrenia? // Schizophr Res. – 2011. – 130. – Р. 34-39.
Полный список литературы, включающий 63 пункта, находится в редакции.
Психиатрия и психофармакотерапия имени П.Б. Ганнушкина. – Т. 14, № 5. – С. 4-13.
1 Повидимому, этот аспект исследований клинических средств практически не разработан. При этом понятны клинические, организационные и этические сложности, возникающие при осуществлении подобных исследований, хотя в части случаев здесь возможны и простые решения: например, раздельный анализ пациентов из базы данных исследовательских центров, то есть «своих», с которыми уже сложился терапевтический альянс, и направленных «со стороны».
2 Значимость указанной проблемы наглядно иллюстрируется, например, данными, согласно которым в 36% исследований не удается «отделить» от плацебо «старые» антидепрессанты с давно и успешно доказанной эффективностью; для таковых нового поколения эта цифра еще выше и достигает 52% [28].
3 Следует отметить, что не все изученные публикации содержат полный перечень анализируемых показателей.
4 При обучении работе с психометрическими шкалами обычно подчеркивается необходимость скрупулезного следования представленных в них описаний, не прибегая к суждениям на основе собственного клинического опыта.
5 Недостаточность такой оценки подтверждается тем, что в конечном итоге тяжесть расстройств по PANSS в одном из подобных исследований варьировала в разных группах в пределах 108,9 ± 16,8 / 112,4 ± 17,6 балла, а в другом (с близкими критериями тяжести) – 69,3 ± 14,9 / 69,7 ± 18,5 балла, причем первый автор в обеих публикациях был один и тот же [2, 3].
6 При этом другие разделы шкалы зачастую не обсуждались: например, оценка по субшкале общепсихопатологической симптоматики PANSS приводилась и, самое главное, анализировалась далеко не во всех использующих данную шкалу публикациях, хотя в этом разделе имеются пункты, также относящиеся к продуктивной и негативной симптоматике.
7 Это становится особенно очевидным в условиях все более отчетливой тенденции рассматривать шизофрению an mass, без выделения различных форм и вариантов течения (www.dsm5.org).
8 В данном случае речь идет не об умышленном сокрытии «неудобной» информации. Включение в текст полного перечня полученных сведений может, например, ограничиваться лимитированным объемом журнальных статей. В этих условиях авторы вынуждены исключать «менее важные» данные. Однако проблема состоит в том, чтобы правильно оценить, что является наиболее существенным, а что можно исключить без большой потери для содержания. В анализируемых статьях предпочтение отдавалось более формальным аспектам (например, декларации приверженности принципам качественной клинической практики, иногда
с перечислением всех определяющих ее документов), а не детальному клиническому анализу.
9 В данном случае не рассматривались очевидные погрешности в методике статистической обработки результатов (например, как это было выявлено в ряде статей, использование tстатистики без доказательств корректности ее применения на этом материале и пр.).
10 В количественном отношении величина эффекта определяется значением показателя d’Cohen, который при оценке групповых различий рассчитывается как частное разницы между двумя средними сравниваемых групп и общего стандартного (среднего квадратичного) отклонения (принята следующая приблизительная градация: менее 0,2 – слабая величина эффекта, около 0,5 – средняя, более 0,8 – сильная).
11 Например, если при лечении новым методом А эффект обнаружился у 60% больных, а методом сравнения В – только у 40%, то NNT составляет 100/(60 – 40) = 5
(чем ниже NNT, тем новый метод эффективнее; в случае максимальной эффективности он равен 1, то есть все больные при лечении исследуемым методом выздоровели, а при методе сравнения не выздоровел никто).
12 Например, специальных исследований требует клиническое наблюдение о максимальной подверженности фармакогенному увеличению массы тела девочекподростков с изначально низкой массой тела (в то же время известны случаи, когда у больных с избыточным весом при назначении атипичных антипсихотиков,
в структуре нежелательных эффектов терапии которых существенное место занимает увеличение массы тела, отмечалось ее уменьшение).
13 Известны случаи, когда новая форма уже ранее применявшегося препарата регистрировалась не для всех показаний, по которым использовался последний;
другим примером могут служить показания для применения селективных ингибиторов обратного захвата серотонина у больных расстройствами тревожного спектра: для различных заболеваний нередко зарегистрированы разные препараты, хотя в клинической практике в этих случаях может назначаться любой из них.