
Драма, связанная с объявлением NIH в 2002 году о досрочном прекращении испытаний эстрогена и прогестина.
Многие испытания заканчиваются хныканьем. Но некоторые заканчиваются взрывом.
Пресс-релиз, пресс-конференция, много фанфар – и негативная реакция. В этом месяце общественность увидела драму о досрочном прекращении очередного клинического испытания. На этот раз это было исследование артериального давления NIH под названием SPRINT.
Тестирование лечения, направленного на достижение более низкого, чем обычно, целевого артериального давления, по сравнению со стандартным лечением, должно было продолжаться еще год. Они пришли к выводу, что после мониторинга промежуточных результатов была обнаружена большая разница в пользу стремления к более низкому, чем обычно, кровяному давлению. Подробнее об этом позже. Но сначала давайте рассмотрим несколько примеров, которые показывают, почему преждевременное прекращение судебного разбирательства является столь спорным.
Для начала: рассказ о 2 испытаниях препарата от вторичного прогрессирующего рассеянного склероза (ВПМС) (интерферон бета-1b). Один начался в Европе в 1994 году; другой начался в США и Канаде в 1995 г. Европейское испытание остановлено на 2 года раньше после получения промежуточных результатов "дали четкие доказательства эффективности. Лечение интерфероном бета-1b задерживает стойкое неврологическое ухудшение" – первый найденный способ лечения SPMS.
Так что же тогда с североамериканским судебным процессом, который все еще находится на начальной стадии? База знаний, обеспечивающая этическое оправдание их испытания, изменилась – и сотни людей принимали плацебо. В исследовании участвовал комитет по мониторингу данных (DMC). DMC призван защищать участников от вреда и выносить суждения о данных во время судебного разбирательства. (DMC также называется советом по мониторингу и безопасности данных (DMSB) или комитетом по мониторингу и этике данных (DMEC).)
DMC посмотрел на их данные и решил продолжить. Прекратились тоже досрочно, в ноябре 1999 г. – не из-за льгот. К сожалению, отсрочка инвалидности не дала никаких преимуществ. Они остановились рано из-за бесполезности – вера в то, что результат не изменится, если они продолжат.
Куда делись люди с СПМС? Несмотря на 2 попытки, картина была мутной. Потребовалось еще одно большое испытание, которое не закончилось рано, чтобы быть уверенным. Согласно систематическому обзору 2011 года, систематическому обзору доказательства того, что интерферон бета-1b не работает, являются "убедительный" (PDF). (Препарат не одобрен для показания SPMS FDA.)
В то время причина, по которой первое испытание произвело преувеличенное впечатление, заключалось в количестве пациентов, которые могли не полностью перейти к ВПРС.
Наша следующая история – это пример спустя несколько лет. На этот раз болезнь представляет собой форму лейкемии (ОМЛ), и в ходе испытания 5 курсов лечения сравниваются с 4 курсами, чтобы увидеть, продлевают ли бремя дополнительной токсичности и интенсивного лечения жизнь.
Статистик Кейт Уитли и председатель DMEC Дэвид Клейтон рассказывают историю того, что произошло. Это было испытание MRC в Великобритании, и данные исследований лейкемии в них отслеживались ежегодно. Первый набор данных показал большую пользу от 5 курсов: было всего 7 смертей по сравнению с 15 в группе с меньшим количеством лечения.
DMEC "долго обсуждали", и решили не рекомендовать прекращать испытание, а еще раз проверить данные через 6, а не через 12 месяцев. Когда дело дошло, польза в пользу 5 курсов усилилась: "И снова DMEC долго и упорно размышлял и снова пришел к выводу, что набор сотрудников должен продолжаться".
Когда испытание завершилось, как и было запланировано, дополнительный курс лечения не показал никаких преимуществ в отношении смертности. На приведенном ниже рисунке показано, что произошло, когда испытание подошло к окончательному подсчету: 157 смертей в группе, получавшей дополнительное лечение, по сравнению с только 140 в другой группе.
Теперь они приходят к выводу, что это было "замечательная случайность". Почему в то время они не рекомендовали остановиться для получения выгоды? В DMEC не было правила остановки – вначале согласовывались рекомендации о результатах, которые повлекли бы за собой рекомендацию прекратить испытание. Они пришли к выводу, что клинически неправдоподобно, чтобы дополнительный курс лечения имел такой драматический эффект:
Довольно экстремальные случайные эффекты могут происходить и происходят чаще, чем считают многие клиницисты. В любой момент времени проводятся сотни, если не тысячи, испытаний, часто с анализами в несколько временных точек и с рядом анализов подгрупп. Таким образом, при всех этих множественных сравнениях неизбежны такие весьма значимые результаты (стр<0.002) иногда происходит случайно, и это условно значимо (стр<0.05), но ложные различия будут возникать часто. Взятые по отдельности, они могут показаться исследователям настолько поразительными, что будет трудно поверить, что это случайные выводы. Ни одно испытание не застраховано от таких случайных эффектов, как бы хорошо оно ни было спланировано и проведено.
Наша следующая история переносит нас в Нидерланды, где проходит испытание по преимплантационному генетическому скринингу (PGS) при ЭКО. Результаты неконтролируемых исследований показали, что это может привести к более жизнеспособным беременностям. Виллем Аннкум и его коллеги рассказывают историю этого.
DMC решил провести промежуточный анализ на полпути. Была четкая разница в частоте наступления беременности, которая была значимой на p<0.05 – но они установили предустановленное правило остановки, требующее, чтобы оно было намного выше, чем это. Они рекомендовали продолжить испытание.
Результат этого испытания оказался не таким, как люди ожидали: у женщин в группе PGS была более низкая частота беременностей. Если бы испытание было прекращено досрочно, роды родили бы еще несколько женщин, участвовавших в испытании. Однако, отмечает Аннкум, результат "были бы отклонены главными героями PGS как недопустимо несовершенные", и, может быть, еще больше женщин пострадает. (С тех пор было больше испытаний – и ЭКО с ПГС по-прежнему дает худшие результаты, чем ЭКО без него.)
Обеспокоенность по поводу врачей, у которых были твердые убеждения, была частью дилеммы, с которой столкнулся DMSB испытаний гормональной терапии в Инициативе по охране здоровья женщин (WHI). Драма объявления о том, что гормональная терапия увеличивает риск рака груди, сочетается с драматической закулисной драмой, которая к этому привела.
Джанет Виттес и ее коллеги из DSMB WHI рассказывают эту историю – и она захватывающая (PDF). Они встречались каждые 6 месяцев:
Мы мучились из-за баланса наших обязательств перед участниками исследования и широкой общественностью, потому что наши рекомендации могут отрицательно повлиять на любое из них… Когда такое вмешательство, как терапия эстрогеном, называемая в те дни «заместительной гормональной терапией», широко принималось, только однозначные доказательства изменит клиническую практику.
Трудные решения, разделение мнений внутри Правления и борьба со спонсором испытаний (NIH) – это мощный аргумент, который дает понять, что даже остановить испытания из-за серьезного неожиданного вреда далеко не так просто.
Опыт WHI также подчеркивает, насколько мы должны участникам испытаний. Виттес сообщает, "несколько женщин прекратили участие из-за того, что их проинформировали о недавно обнаруженных рисках". Испытание АЗТ для лечения ВИЧ показало, что и в 1990 году, когда другие испытания прекращали досрочно в целях получения положительных результатов. Майкл Симберкофф и его коллеги сообщают, что, когда они решили снова обратиться к участникам, 74% решили продолжить.
Но согласно систематическому обзору литературы по практике мониторинга данных по состоянию на 2001 год, участники исследования обычно не информируются о том, что происходит, если испытание не прекращено. Это обостряет потребность DMC включать представителя сообщества, хотя это, вероятно, не является обычным явлением.
Лишь несколько процентов испытаний прекращены досрочно из-за пользы, вреда или бесполезности. Конечно, они не всегда оставляют после себя беспорядок. Дирк Басслер и исследовательская группа STOPIT-2 с изящным названием провели систематический обзор испытаний, преждевременно прекращенных из-за преимуществ, по сравнению с другими испытаниями в систематических обзорах с ними, которые не были прекращены досрочно. Прерванные испытания имели больший эффект. Они утверждают, что практика преждевременного прекращения испытаний в целях получения выгоды искажает литературу, создавая преувеличенное впечатление об эффективности.
Стивен Гудман пишет, что это не так уж отличается от слишком маленьких исследований, даже если они идут своим курсом. Если в суде вопрос о превосходстве – лучше ли этот вариант, чем тот?? – тогда, возможно, говорит он, желание точной оценки величины эффекта противоречит тому, на что подписались добровольцы.
Гудман отмечает, что мы действительно не знаем, действительно ли более точная оценка окажет большое влияние на решения людей. Он утверждает, что нам нужно знать больше – не только об этих вопросах, но и о ценностях общества и участников судебных процессов по этим вопросам. Независимо от того, насколько хорошо мы умеем разрабатывать методы мониторинга, учитывающие правдоподобие и другие сложности, решения, с которыми сталкиваются РСЧ и все остальные, участвующие в продолжении или прекращении судебного разбирательства, останутся чрезвычайно трудным решением.
А как насчет испытания SPRINT, которое вызвало столько шума в этом месяце?? Почему это было остановлено? Что сейчас витает в воздухе и где это оставляет людей с высоким кровяным давлением?
