Сравнительный анализ эффективности и приемлемости 12 новых антидепрессантов
За последние 20 лет для лечения депрессии в клиническую практику были введены несколько новых препаратов, многие из которых структурно схожи и, предположительно, обладают одинаковым механизмом действия. Традиционные метаанализы демонстрировали неубедительные результаты сравнительной эффективности антидепрессантов (АД) 2-го поколения. В связи с этим Cipriani et al. выполнили сетевой метаанализ, в котором предприняли попытку оценить эффект 12 новых АД при лечении рекуррентной депрессии. Результаты работы опубликованы в журнале Lancet (2009; 373: 746-758).
Подобно применению статинов для профилактики нарушений коронарного кровообращения, степень различий эффективности и переносимости между новыми АД остается неясной (Ward et al., 2007). Кроме того, о ряде новых препаратов заявлялось как о «двойниках», то есть обладающих сходной с уже существующими средствами химической структурой, которым пациенты отдают большее предпочтение по сравнению с изначальным препаратом (NICE, 2007). В систематических обзорах уже освещались некоторые различия в эффективности АД 2-го поколения (Puech et al., 1997; Smith et al., 2002; Hansen et al., 2005; Cipriani et al., 2006; Papakostas et al., 2007; Gartlehner et al., 2007; Nemeroff et al., 2008).
В данной статье представлен обзор всех рандомизированных контролируемых исследований (РКИ), в которых сравнивали эффективность и переносимость 12 АД 2-го поколения в острый период лечения рекуррентной депрессии. Был использован метод метаанализа множественных сравнений терапии (метаанализ смешанного лечения, или сетевой метаанализ), который позволяет интегрировать данные непосредственных (сопоставление двух видов лечения) и опосредованных (методы терапии сравниваются путем объединения результатов эффективности с таковыми наиболее распространенного вида лечения) сравнений (Salanti et al., 2008; Ades et al., 2006). Целью являлось обобщение результатов оценки клинической пользы путем метаанализа, что может быть использовано в качестве руководства при принятии терапевтических решений.
Методы исследования
В данный анализ включены только те РКИ, в которых сравнивались 12 АД нового поколения, а именно бупропион, циталопрам, дулоксетин, эсциталопрам, флуоксетин, флувоксамин, милнаципран, миртазапин, пароксетин, ребоксетин, сертралин и венлафаксин, в качестве монотерапии в острый период лечения монополярной рекуррентной депрессии. Были исключены исследования с применением плацебо и РКИ, посвященные лечению послеродовой депрессии у женщин (NICE, 2007).
Для выявления соответствующих исследований был рассмотрен регистр контролируемых испытаний Кокрановского сотрудничества включительно по 30 ноября 2007 г. Кроме того, были отправлены запросы в фармацевтические компании, регуляторные агентства и исследователям с просьбой предоставить всю имеющуюся информацию.
Испытаниям присваивался рейтинг качества (адекватное, неясное, неадекватное) в зависимости от адекватности скрытости распределения и маскирования данных (Higgins, Green, 2006). В окончательный перечень были включены исследования, оцененные как «адекватное» или «неясное».
Для анализа эффективности и переносимости продолжительность острого периода лечения составила 8 недель (Bauer et al., 2002). В случае, если отсутствовали данные к 8-й неделе, использовали результаты, полученные между 6-й и 12-й неделями терапии, отдавая предпочтение временному промежутку, который в оригинальном исследовании определялся как окончательный. Уровни терапевтического ответа и прекращения испытаний избирали в качестве основных методов оценки результатов, поскольку о них чаще всего сообщалось при определении эффективности и переносимости в острый период лечения. Терапевтический ответ определялся как процент пациентов, у которых отмечалось снижение, как минимум, на 50% исходных показателей по шкале депрессии Гамильтона (HDRS), шкале депрессии Монтгомери – Асберг (MADRS) или шкале общего клинического впечатления (CGI) к 8-й неделе. Если в исследовании были получены результаты по всем трем шкалам, использовались значения HDRS. Прекращение лечения (переносимость) определялось как количество пациентов, которые преждевременно завершили участие в исследовании по любой причине в первые 8 недель лечения.
Помимо внутренней и внешней валидности, оценивали также сравнимость доз. Поскольку в опубликованной литературе не было обнаружено каких-либо четких определений эквивалентных доз для АД нового поколения, применяли модифицированную версию классификации, описанную Gartlehner et al. (2007). Эта информация использовалась для выявления различий доз, которые могли влиять на эффективность, и только для тех исследований, в которых терапевтические дозы сравнивались в заранее установленном диапазоне.
Результаты исследования
Электронный поиск выявил 345 исследований, из которых 274 соответствовали критериям включения в анализ. Было исключено 172 испытания по причине несоответствия установленным критериям. В метаанализ также вошли 15 неопубликованных сообщений, которые были взяты с интернет-страниц фармацевтических компаний. Всего 117 исследований, проведенных с 1991 по 2007 гг., включили в метаанализ множественных сравнений лечения. Большинство испытаний (63%) были проведены в Северной Америке и Европе (таблица).
Всего 25 928 участников были случайным образом распределены для приема одного из 12 АД, которые были включены в метаанализ множественных сравнений лечения. Около двух третей участников (64%) составили женщины. В анализ эффективности вошло 24 595 пациентов (111 исследований), переносимости – 24 693 (112 исследований). Средняя продолжительность испытаний составила 8,1 недель, а средняя величина выборок – 109,8 участников в группе (диапазон – 9-357); в 62 исследованиях насчитывалось, как минимум, по 100 пациентов в группе. По две группы было в 85 исследованиях, по три, включая два активных препарата сравнения в различных дозах и группу плацебо, – в 23. В 7 испытаниях два активных препарата в разных фиксированных дозах сравнивались в нескольких группах участников, еще в 2 испытаниях с тремя группами изучали три активных препарата сравнения (Fava et al., 2000, 2002). Лишь в 14 сравнительных исследованиях АД (за исключением флувоксамина и милнаципрана) продолжительность периода катамнестического наблюдения составила более 12 недель. Была получена дополнительная информация от исследователей 42 включенных испытаний.
Относительно клинической характеристики исследований, 53 (9321 участник) включали лиц в возрасте < 65 лет (лишь в 8 испытаний вошли исключительно лица > 65 лет, n = 1583); 87 исследований проводились в условиях амбулаторных клиник (7 – первичной медицинской помощи). Исходное общее значение по шкале HDRS-17 составило 23,47 (стандартное отклонение [СО] 4,27) балла, по шкале HDRS-21 – 25,72 (СО 4,62) балла и по шкале MADRS – 30,09 (СО 4,64) балла. Качество большинства испытаний было оценено как неясное, и только 12 исследований – как адекватное.
На рисунке 1 показана сеть соответствующих сравнений при проведении сетевого метаанализа. Из 66 возможных попарных сравнений между 12 видами лечения непосредственным образом изучали эффективность 42 пар и переносимость 41 пары препаратов.
Были проведены прямые сравнения, показавшие предпочтительную эффективность эсциталопрама над циталопрамом, циталопрама над ребоксетином и пароксетином, миртазапина над флуоксетином и венлафаксином, сертралина над флуоксетином и венлафаксина над флуоксетином и флувоксамином. Эти данные являются результатом 42 независимых анализов без коррекций множественных проверок (то есть два ожидаемые доверительные интервалы [ДИ] исключали отношение шансов [ОШ], равное 1). Для прекращения испытаний флуоксетин должен был лучше переноситься, чем ребоксетин, а циталопрам – чем сертралин.
В целом, гетерогенность была умеренной, хотя для большинства сравнений 95% ДИ включали значения, которые указывали на очень высокую гетерогенность или ее отсутствие, что отражало небольшое количество исследований для каждой пары сравнений. При метаанализе прямых сравнений выявлено, что значение I2 было выше 75% для пар циталопрам и ребоксетин (I2 = 85,0%), эсциталопрам и флуоксетин (I2 = 82,7%). Для обоих случаев лишь по два исследования было включено в метаанализ.
На рисунке 2 обобщены результаты метаанализа множественных сравнений лечения. Эсциталопрам, мирта-запин, сертралин и венлафаксин были значимо эффективнее, чем дулоксетин, флуоксетин, флувоксамин, пароксетин и ребоксетин; еще меньшая польза отмечалась при сравнении дулоксетина и флувоксамина с сертралином, эсциталопрамом, венлафаксином и миртазапином, достоверность ОШ была немного больше 1.
Ребоксетин был значимо менее эффективен, чем все другие АД. Эти данные являются результатом 66 одновременных сравнений. Что касается переносимости, дулоксетин и пароксетин хуже переносились, чем эсциталопрам и сертралин; флувоксамин – хуже, чем циталопрам, эсциталопрам и сертралин; венлафаксин – хуже, чем эсциталопрам; ребоксетин – хуже, чем многие другие АД, например бупропион, циталопрам, флуоксетин и сертралин. Эсциталопрам и сертралин лучше переносились, чем дулоксетин, флувоксамин, пароксетин и ребоксетин (рис. 2, 3).
Миртазапин, эсциталопрам, венлафаксин и сертралин были более эффективны, чем флуоксетин, а флуоксетин являлся эффективнее ребоксетина. Что касается переносимости, флуоксетин был лучше, чем ребоксетин.
Анализ указал на отсутствие связности у трех из 70 сравнений между прямыми и косвенными доказательствами для уровня терапевтического ответа (пароксетин – циталопрам – эсциталопрам, флувоксамин – венлафаксин – миртазапин и сертралин – флуоксетин – бупропион) и у трех из 63 сравнений уровня прекращения испытаний (сертралин – циталопрам – эсциталопрам, флувоксамин – венлафаксин – миртазапин и сертралин – циталопрам – флуоксетин). Извлечение и ввод данных были корректными, и какой-либо важной переменной в этих цепочках сравнений выявить не удалось, хотя число исследований было небольшим.
Исключение исследований, в которых применялись любые дозы и вне пределов определенного терапевтического диапазона, привело к тому, что данные 109 и 90 исследований соответственно не вводились. Модель метаанализа множественных сравнений лечения была подвергнута коррекции, в итоге, в любом из значений ДИ не отмечалось каких-либо различий.
На рисунке 4 показаны вероятности рангов для каждого из 12 возможных видов лечения. Миртазапин, эсциталопрам, венлафаксин и сертралин были в числе наиболее эффективных препаратов, а эсциталопрам, сертралин, бупропион и циталопрам лучше переносились по сравнению с остальными АД.
Кумулятивная вероятность нахождения среди четырех наиболее эффективных видов лечения составила: миртазапин (24,4%), эсциталопрам (23,7%), венлафаксин (22,3%), сертралин (20,3%), циталопрам (3,4%), милнаципран (2,7%), бупропион (2,0%), дулоксетин (0,9%), флувоксамин (0,7%), пароксетин (0,1%), флуоксетин (0,0%) и ребоксетин (0,0%). Кумулятивная вероятность нахождения среди четырех наиболее переносимых видов терапии составила: эсциталопрам (27,6%), сертралин (21,3%), бупропион (19,3%), циталопрам (18,7%), милнаципран (7,1%), миртазапин (4,4%), флуоксетин (3,4%), венлафаксин (0,9%), дулоксетин (0,7%), флувоксамин (0,4%), пароксетин (0,2%) и ребоксетин (0,1%).
Обсуждение
Полученные данные могут быть полезными при выборе среди АД нового поколения препарат для лечения рекуррентной депрессии в острый период. Некоторые АД отличаются как статистически, так и клинически. Что касается терапевтического ответа, миртазапин, эсциталопрам, венлафаксин и сертралин более эффективны, чем дулоксетин, флуоксетин, флувоксамин, пароксетин и ребоксетин. Говоря о переносимости, эсциталопрам, сертралин, циталопрам и бупропион лучше переносятся, чем другие АД нового поколения. Эти результаты также указывают на то, что два наиболее эффективных препарата (миртазапин и венлафаксин) не обязательно более приемлемы.
Важно отметить, что не были изучены такие последствия лечения, как побочные реакции, токсические эффекты, симптомы отмены и социальное функционирование. Однако наиболее важное клиническое значение полученных результатов состоит в том, что эсциталопрам и сертралин могут быть препаратами выбора для начала терапии в случаях умеренной и тяжелой рекуррентной депрессии, поскольку эти препараты обладают наилучшим балансом между эффективностью и переносимостью.
Не был проведен анализ экономической эффективности, однако в связи с тем, что большинство АД нового поколения доступны для пациентов в виде генерических форм, их стоимость снизилась.
Ребоксетин, флувоксамин, пароксетин и дулоксетин были наименее эффективными и приемлемыми препаратами, что делает их наименее предпочтительными при назначении для лечения рекуррентной депрессии в острый период. Кроме того, ребоксетин хуже всего переносился среди всех изучаемых препаратов и был значимо менее эффективным, чем остальные 11 АД. Поэтому ребоксетин не должен рутинно использоваться в качестве средства первой линии терапии в острый период.
Авторы подчеркивают, что данные этого анализа могут быть применимы только для лечения (8 недель) рекуррентной депрессии в острый период. С клинической точки зрения оценка эффективности лечения после 6 или ? 16-24 недель может привести к значительным различиям в результатах терапии. Во многих систематических обзорах способность представить валидные оценки терапевтического эффекта ограничена по причине различной продолжительности периода катамнестического наблюдения в объединяемых испытаниях (Zimmerman et al., 2002).
В большинстве испытаний, включенных в анализ, не была доступна информация о рандомизации и распределении участников для получения лечения, что может снизить валидность результатов. Так или иначе, все включенные в метаанализ исследования имели схожие дизайн и процедуры проведения, и недостающие сведения могли быть следствием неполных сообщений в публикациях, а не недостатков дизайна исследований (Huwiler-Muntener et al., 2002).
Отмечено, что полученные данные указывают на потенциальные преимущества проведенного анализа, включающего косвенные и прямые сравнения, что снижает риск возможной спонсорской предвзятости. Однако недостатки первичных испытаний и вероятность наличия искажающих факторов (например, проблемы с дозами) могут влиять на валидность данных.
Для адекватной оценки эффективности новейших АД требуется проведение контролируемых плацебо испытаний (Kupfer, Frank, 2002). Для получения разрешения о выпуске препарата на этом настаивают и регуляторные агентства, как в США, так и в Европе. Отобранные публикации о контролируемых плацебо исследованиях эффективности АД легко распознаются (Turner et al., 2008), и в настоящее время эта тема активно дискутируется (Kirsch et al., 2008). Как правило, регуляторным агентствам должны предоставляться данные, полученные в ходе контролируемых плацебо испытаний, для получения их одобрения. Чтобы соответствовать этическим требованиям и требованиям безопасности, в такие исследования стараются включать пациентов с легкими формами заболевания (Kirsch, Moncrieff, 2007). Несмотря на то, что выполнения контролируемых плацебо испытаний может быть вполне достаточно, поскольку для них необходим меньший объем выборки, чем для таковых без группы плацебо, все же могут иметь место некоторые трудности при их проведении, особенно при наличии сведений об эффективных видах лечения, что может привести к появлению определенных артефактов (Geddes, Cipriani, 2004).
В испытаниях АД был показан терапевтический ответ на прием плацебо, который значительно варьирует и явно возрос за последние два десятилетия. Схожая тенденция отмечается также в группах пациентов, получающих активное лечение (Walsh et al., 2002). Эта проблема искажения со временем результатов испытаний до сих пор обсуждается (Sneed et al., 2008), однако изменение ответа на прием плацебо не может быть связано со сменой характеристик исследования (Walsh et al., 2002). Например, больший разброс в показателях исходной тяжести состояния, вероятно, может обусловить временное повышение ответа на прием плацебо, что увеличит количество неудачных испытаний (Walsh et al., 2002). Поскольку контролируемые плацебо испытания АД становится проводить все сложнее, со временем, возможно, стандартные требования будут пересмотрены. Данный анализ указывает, что сертралин лучше других АД нового поколения в плане эффективности и переносимости, и может использоваться в третьей фазе стандартных испытаний в качестве активного препарата сравнения, а также в прагматических наблюдениях (или испытаниях эффективности), чтобы повысить применимость результатов в условиях реальной практики. Хотя объем выборки может быть больше, чем в контролируемых плацебо испытаниях, применимость результатов в условиях реальной практики устраняет этот недостаток. Кроме того, существует необходимость, чтобы новые виды лечения продемонстрировали лучшую эффективность или переносимость, чем существующие виды стандартной терапии, что послужит препятствием на пути появления «двойников», которые кроме своей меньшей стоимости других положительных характеристик не имеют.
Подготовил Станислав Костюченко