SDTM - SDTM

SDTM (Модель табулирования данных исследования) определяет стандартную структуру для человек Таблицы данных клинических испытаний (исследований) и таблицы данных доклинических исследований, которые должны быть представлены как часть заявки на продукт в регулирующий орган, такой как Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA). Группа стандартов данных для представления Консорциум стандартов обмена клиническими данными (CDISC) определяет SDTM.

21 июля 2004 г. SDTM был выбран в качестве стандартной спецификации для представления табулированных данных в FDA для клинических испытаний и 5 июля 2011 г. для доклинических исследований. В конечном итоге ожидается, что все представляемые данные будут соответствовать этому формату. В результате менеджеры клинических и доклинических данных должны будут овладеть SDTM, чтобы подготовить заявки и применить структуры SDTM, где это необходимо, для управления оперативными данными.

Фон

SDTM построен на концепции наблюдений, собранных за субъектами, которые участвовали в клиническом исследовании. Каждое наблюдение может быть описано серией переменных, соответствующей строке в наборе данных или таблице. Каждую переменную можно классифицировать в соответствии с ее ролью. Роль определяет тип информации, передаваемой переменной о каждом отдельном наблюдении, и то, как ее можно использовать. Переменные можно разделить на четыре основные роли:

  • Переменные-идентификаторы, которые идентифицируют исследование, предмет наблюдения, область и порядковый номер записи.
  • Переменные темы, которые определяют фокус наблюдения (например, название лабораторного теста)
  • Временные переменные, которые описывают время наблюдения (например, дата начала и дата окончания).
  • Переменные-квалификаторы, которые включают дополнительный иллюстративный текст или числовые значения, описывающие результаты или дополнительные характеристики наблюдения (например, единицы измерения или описательные прилагательные).

Пятый тип переменной роли, Правило, может выражать алгоритм или исполняемый метод для определения условий начала, окончания или цикла в модели Проектирования испытания.

Набор переменных квалификатора можно разделить на пять подклассов:

  • Квалификаторы группировки используются для группировки набора наблюдений в одном домене. Примеры включают --CAT и --SCAT.
  • Квалификаторы результатов описывают конкретные результаты, связанные с тематической переменной для вывода. Это ответ на вопрос, поставленный переменной темы. Примеры включают --ORRES, --STRESC и --STRESN. Многие значения в домене DM также классифицируются как квалификаторы результата.
  • Квалификаторы синонимов определяют альтернативное имя для конкретной переменной в наблюдении. Примеры включают --MODIFY и --DECOD, которые являются эквивалентными терминами для тематической переменной --TRT или --TERM, --TEST и --LOINC, которые являются эквивалентными терминами для --TESTCD.
  • Квалификаторы записи определяют дополнительные атрибуты записи наблюдения в целом (а не описывают конкретную переменную в записи). Примеры включают --REASND, AESLIFE и все другие переменные флага SAE (серьезное неблагоприятное событие) в домене AE; и --BLFL, --POS и --LOC, --SPEC, --LOT, --NAM.
  • Квалификаторы переменных используются для дальнейшего изменения или описания конкретной переменной в наблюдении и имеют значение только в контексте переменной, которую они квалифицируют. Примеры включают --ORRESU, --ORNRHI и --ORNRLO, все из которых являются квалификаторами переменных для --ORRES, и --DOSU и --DOSFRM, все из которых являются квалификаторами переменных для --DOSE.

Например, в наблюдении «Субъект 101 испытывал легкую тошноту, начиная с 6-го дня исследования», значение переменной «Тема» является термином «NAUSEA» для неблагоприятного события. Переменная идентификатора - это идентификатор субъекта, «101». Переменная времени - это учебный день начала события, в который фиксируется информация, «начиная с учебного дня 6», в то время как примером квалификатора записи является серьезность, значение для которой - «УМЕРЕННЫЙ».

Могут быть включены дополнительные переменные времени и квалификатора, чтобы предоставить необходимые детали для адекватного описания наблюдения. • Добавление SDTM к PROC CDISC не преобразует существующее содержимое SDS 2.x в представления SDTM 3.x.

Наборы данных и домены

Наблюдения обычно собираются по всем предметам в серии областей. Домен определяется как набор логически связанных наблюдений с тематической общностью в отношении субъектов исследования. Логика взаимоотношений может относиться к научному содержанию данных или к их роли в исследовании.

Как правило, каждый домен представлен набором данных, но можно иметь информацию, относящуюся к одной и той же тематике, разбросанной среди нескольких наборов данных. Каждый набор данных отличается уникальным двухсимвольным кодом DOMAIN, который следует последовательно использовать на протяжении всей отправки. Этот код DOMAIN используется в имени набора данных, значении переменной DOMAIN в этом наборе данных и в качестве префикса для большинства имен переменных в наборе данных.

Структура набора данных для наблюдений - это плоский файл, представляющий таблицу с одной или несколькими строками и столбцами. Обычно для каждого домена отправляется один набор данных. Каждая строка набора данных представляет одно наблюдение, а каждый столбец представляет одну из переменных. Каждый набор данных или таблица сопровождается определениями метаданных, которые предоставляют информацию о переменных, используемых в наборе данных. Метаданные описаны в документе с описанием данных под названием «Определить», который вместе с данными отправляется в регулирующие органы.

Модель метаданных отправки использует семь различных атрибутов метаданных, которые должны быть определены для каждой переменной набора данных в документе определения метаданных:

  • Имя переменной (ограничено 8 символами для совместимости с Система SAS V5 Транспортный формат)
  • Описательная метка переменной длиной до 40 символов, которая должна быть уникальной для каждой переменной в наборе данных.
  • Тип данных (например, является ли значение переменной символьным или числовым)
  • Набор контролируемой терминологии для значения или формата представления переменной (контролируемые термины или формат)
  • Происхождение или источник каждой переменной
  • Роль переменной, которая определяет, как переменная используется в наборе данных. Роли используются для представления категорий переменных как идентификатор, тема, время или пять типов квалификаторов. Поскольку эти роли предопределены для всех доменов, следующих за общими классами, спонсоры не должны указывать их в их документе определения данных Define. Фактические метаданные отправки могут использовать дополнительные обозначения ролей, и для каждой переменной может быть назначено более одной роли для удовлетворения различных потребностей.
  • Комментарии или другая важная информация о переменной или ее данных.

Данные, хранящиеся в переменных набора данных, включают как исходные (в том виде, в котором они были изначально собраны), так и производные значения (например, преобразованные в стандартные единицы или вычисленные на основе нескольких значений, например среднего). В SDTM перечислены только имя, метка и тип с набором рекомендаций CDISC, которые предоставляют общее описание для каждой переменной, используемой общим классом наблюдения.

Комментарии включаются по мере необходимости в соответствии с потребностями отдельных исследований. Наличие звездочки (*) в столбце «Контролируемые термины или формат» указывает на то, что ожидается, что для этой переменной будет доступен дискретный набор значений (контролируемая терминология). . Этот набор значений может быть определен спонсором в случаях, когда стандартные словари еще не определены (представлены одним *) или из внешнего опубликованного источника, такого как MedDRA (представлена ​​**).

Специальные домены

Модели домена данных передачи CDISC версии 3.x включают специализированные домены с определенной структурой и не могут быть расширены никакими дополнительными квалификаторами или переменными времени, кроме указанных.

  • Демографические данные включают набор стандартных переменных, которые описывают каждого участника клинического исследования.
  • Комментарии описывают фиксированную структуру для записи произвольных текстовых комментариев по теме или комментариев, относящихся к записям или группам записей в других доменах.

Дополнительная фиксированная структура, нерасширяемые домены специального назначения обсуждаются в модели Trial Design.

Общие классы домена

Большинство наблюдений, собранных в ходе исследования (кроме тех, которые представлены в областях специального назначения), следует разделить на три общих класса наблюдений: вмешательства, события или результаты:

  • Класс «Вмешательства» включает исследуемые методы лечения, терапевтические методы лечения и хирургические процедуры, которые преднамеренно вводятся субъекту (с некоторым фактическим или ожидаемым физиологическим эффектом) в соответствии с протоколом исследования (например, «воздействие»), совпадающим с периодом оценки исследования. (например, «сопутствующие лекарства») или другие вещества, принимаемые субъектом самостоятельно (например, алкоголь, табак или кофеин)
  • Класс Events фиксирует события или инциденты независимо от запланированных оценок исследования, происходящих во время исследования (например, «нежелательные явления» или «диспозиция») или до исследования (например, «история болезни»).
  • Класс «Результаты» фиксирует наблюдения, полученные в результате запланированных оценок, для решения конкретных вопросов, таких как наблюдения, сделанные во время медицинского осмотра, лабораторных тестов, тестирования ЭКГ и наборов отдельных вопросов, перечисленных в анкетах.

В большинстве случаев идентификация общего класса, соответствующего конкретному набору данных по актуальности, проста. Часто общий класс «Выводы» является лучшим выбором для общих данных наблюдений, собранных в виде измерений или ответов на вопросы. В тех случаях, когда актуальность может быть не такой ясной, выбор класса может больше основываться на научных целях протокола или плана анализа или структуры данных.

Все наборы данных, основанные на любом из общих классов наблюдений, имеют набор общих переменных идентификатора и переменных времени. При определении, какие переменные включать в домен, применяются три общих правила:

  • Тот же набор переменных идентификатора применяется ко всем доменам на основе общих классов наблюдения. При необходимости можно использовать необязательный идентификатор.
  • Любая действительная временная переменная допустима для использования в любом наборе данных для отправки (например, для описания исследований с более точными временными точками, таких как исследование фармакокинетики), но ее следует использовать последовательно, где это применимо для всех областей.
  • Любые дополнительные квалификационные переменные из того же общего класса могут быть добавлены в модель предметной области.

Стандартные доменные модели CDISC (SDTMIG 3.2)

Домены специального назначения:

  • Комментарии (CO)
  • Демография (DM)
  • Элементы темы (SE)
  • Тематические посещения (SV)

Общий класс наблюдения за вмешательством:

  • Сопутствующие лекарства (CM)
  • Экспозиция в собранном виде (EC)
  • Экспозиция (EX)
  • Использование психоактивных веществ (SU)
  • Процедуры (PR)

Общий класс наблюдения за событиями:

  • Нежелательные явления (НЯ)
  • Клинические события (CE)
  • Диспозиция (DS)
  • Отклонения от протокола (DV)
  • История болезни (MH)
  • Встречи со здоровьем (HO)

Выводы Общий класс наблюдения:

  • Подотчетность по наркотикам (DA)
  • Подробности смерти (DD)
  • Результаты теста ЭКГ (EG)
  • Не соблюден критерий включения / исключения (IE)
  • Оценка иммуногенности образцов (IS)
  • Результаты лабораторных тестов (LB)
  • Микробиологический образец (МБ)
  • Результаты микроскопии (MI)
  • Морфология (МО)
  • Микробиологический тест на чувствительность (МС)
  • Концентрации ПК (ПК)
  • Параметры ПК (PP)
  • Физический осмотр (PE)
  • Анкеты (QS)
  • Результаты исследования репродуктивной системы (RP)
  • Реакция на заболевание (RS)
  • Характеристики предмета (SC)
  • Статус темы (SS)
  • Идентификация опухоли (TU)
  • Результаты по опухолям (TR)
  • Показатели жизнедеятельности (VS)

Выводы о:

  • Выводы о событиях или вмешательствах (FA)
  • Кожная реакция (SR)

Области разработки пробной версии:

  • Пробное оружие (TA)
  • Оценка пробного заболевания (TD)
  • Элементы испытаний (TE)
  • Пробные посещения (ТВ)
  • Критерии включения / исключения исследования (TI)
  • Резюме испытания (TS)

Наборы данных о взаимоотношениях специального назначения:

  • Дополнительные квалификаторы - SUPPQUAL
  • Связать записи - RELREC

Ограничения и критика стандартов

Одна из критических замечаний по поводу стандартов SDTM заключается в том, что они постоянно меняются, с частыми выпусками новых версий. CDISC утверждает, что стандарты SDTM обратно совместимы. Но претензия ненадежна. Невозможно сопоставить данные из СУБД EDC со стандартами SDTM до завершения клинического испытания. Недавно были добавлены новые домены, например, домен экспонирования как собранный (EC). Однако обратная совместимость с более ранними доменами не всегда возможна. [1] Стандарты ненадежны и хорошо разработаны. Контролируемая терминология - это очень небольшая часть терминологии Национального института рака. [2]

Рекомендации

  1. ^ Фузе, 2011. «Руководство по внедрению SDTM - Ясно как грязь» (PDF). Лекс Янсен. PHUSE. Получено 17 декабря 2015.CS1 maint: числовые имена: список авторов (связь)
  2. ^ CDISC, Терминология. «Национальный институт рака». Cance.gov. Национальные институты здравоохранения США. Получено 17 декабря 2015.

Смотрите также

внешняя ссылка