Аналитический метод обнаружения оценщиков выбросов

Методология медицинских исследований BMC, том 23, Номер статьи: 177 (2023) Цитировать эту статью

112 Доступов

Подробности о метриках

Эпидемиологические и медицинские исследования часто полагаются на оценщиков для получения измерений воздействия или результатов для участников исследования, а достоверные оценки ассоциаций зависят от качества данных. Несмотря на то, что статистические методы были предложены для корректировки ошибок измерений, они часто полагаются на непроверяемые предположения и могут привести к смещенным оценкам, если эти предположения нарушаются. Следовательно, необходимы методы обнаружения потенциальных «выпадающих» оценщиков для улучшения качества данных на этапе сбора данных.

В этой статье мы предлагаем двухэтапный алгоритм для обнаружения «выпадающих» оценщиков, чьи результаты оценки имеют тенденцию быть выше или ниже, чем у их аналогов. На первом этапе эффекты оценщиков получаются путем подбора регрессионной модели. На втором этапе выполняются проверки гипотез для выявления «выбросов» оценщиков, при этом мы учитываем как мощность каждого теста гипотезы, так и уровень ложных открытий (FDR) среди всех тестов. Мы проводим обширное симуляционное исследование для оценки предлагаемого метода и иллюстрируем его, выявляя потенциальных «выбросов» аудиологов на этапе сбора данных для отдела оценки аудиологии исследования сохранения слуха, эпидемиологического исследования для изучения факторов риска потери слуха. в исследовании здоровья медсестер II.

Наше моделирование показывает, что наш метод не только может обнаружить истинных «выбросов» оценщиков, но также с меньшей вероятностью ошибочно отклонит истинных «нормальных» оценщиков.

Наш двухэтапный алгоритм обнаружения «выбросов» представляет собой гибкий подход, который может эффективно обнаруживать оценщиков «выбросов», и, таким образом, качество данных может быть улучшено на этапе сбора данных.

Отчеты экспертной оценки

Многие медицинские и эпидемиологические исследования, изучающие взаимосвязь между факторами риска и исходами заболеваний, полагаются на участие нескольких экспертов (например, врачей, технических специалистов) для измерения воздействия или интересующих результатов среди участников исследования. Например, в крупных эпидемиологических исследованиях потери слуха измерения чистотональной аудиометрии обычно проводятся несколькими аудиологами или обученными техническими специалистами в звукообработанных кабинах [1,2,3]. Аналогичным образом, в крупных исследованиях зрения тесты зрения часто проводятся несколькими экспертами в клинических условиях [4, 5]. Кроме того, потенциальные проблемы, связанные со сбором данных несколькими оценщиками, могут также распространяться на исследования, которые полагаются на данные, собранные нечеловеческими методами тестирования, такими как автоматические аудиометры [6], для получения тестовых измерений. Получение точных оценок связи между факторами риска и исходами заболеваний зависит не только от используемых статистических методов, но и от качества самих данных. Хотя было предложено множество аналитических методов для корректировки ошибок измерений, возникающих из-за данных, собранных с низким качеством, эти методы обычно основаны на непроверяемых предположениях [7] и платят за точность оценок. Поэтому сбор данных более высокого качества предпочтительнее использования статистических методов для корректировки систематических ошибок, вызванных данными худшего качества на этапе статистического анализа. В этой статье мы предлагаем методы контроля качества на этапе сбора данных, чтобы проблемы с измерением воздействия или результатов можно было обнаружить и оперативно решить.

Наша работа мотивирована исследованием сохранения слуха (CHEARS), исследованием факторов риска потери слуха среди участников исследования здоровья медсестер II (NHS II), текущего группового исследования, в котором приняли участие 116 430 зарегистрированных женщин-медсестер в США. в возрасте 25-42 лет на момент поступления в 1989 г. [8]. Группа оценки аудиологии CHEARS (AAA) оценивала продольное изменение аудиометрических порогов слуха по чистому тону по воздушной и костной проводимости (интенсивность звука чистого тона, при котором он впервые воспринимается), измеренное в децибелах на уровне слуха, или дБ HL. во всем диапазоне обычных частот (0,5-8 кГц) [9]. Базовое тестирование было проведено на 3749 женщинах, которые по самооценке состояния слуха были «отличными», «очень хорошими» или «небольшими проблемами со слухом», и проживали в непосредственной близости от одного из 19 центров тестирования CHEARS в США [9]. Трехлетнее последующее тестирование было завершено у 3136 участников (84%). Чтобы получить надежные измерения слуха, решающее значение имеет выявление потенциальных аудиологов, которые, как правило, имеют более высокие или более низкие результаты тестов слуха, чем другие аудиологи. Как только будет выявлен «выдающийся» аудиолог, устройства, используемые этим аудиологом, могут быть проверены, и при необходимости может быть проведено раннее вмешательство на этапе сбора данных. Более того, эта информация о выбросах может иметь важные последствия для подхода к анализу данных.

10 \text { dB}\)) coefficient estimate than their counterparts, and Audiologist 4 has a much smaller (\(<10 \text { dB}\)) coefficient estimate than the rest of the audiologists. Moreover, Audiologists 14, 15, 22, 47, 48, 54, 55 and 59 have a mildly different (5-10\(\text { dB}\)) coefficient estimates from the average effect./p>0\). A challenge of this method might be how to select a. We will consider this method in our future research and compare it with the current method. Moreover, when calculating the evaluator-specific significance level, the knowledge of the alternative hypothesis is needed. However, if the prior knowledge is not available, we recommend performing sensitivity analysis for a series of reasonable values of the alternative hypothesis. In addition, the FDR approximation in Eq. (2) holds when the number of hypotheses (M) being conducted is large. However, when M is small, alternatively, we can use the Benjamini-Hochberg (BH) procedure to control the FDR [15]. The BH procedure proceeds by first specifying an FDR level \(\alpha\), and sort the null hypothesis based on p-values in ascending order (\(P_{(1)}, P_{(2)},\ldots , P_{(M)}\)). Then the largest k such that \(P_{(k)}\le \frac{k}{M}\alpha\) is obtained, and the first k null hypotheses will be rejected. The BH procedure can ensure that the FDR is controlled at level \(\alpha\). However, different from our approach, the BH procedure does not consider the power of tests and to be conservative, we might use a relatively larger \(\alpha\) level such as 0.1 when conducting the BH procedure./p>