3.2. Особенности медицинских данных
Первым шагом, предваряющим собственно статистический анализ, является исследование типа данных, основными из которых являются количественные и качественные.
Качественные данные подразделяются на порядковые, или ранговые (например, тяжесть проявлений заболевания), и классификационные, или номинальные (например, перенесенные заболевания, классы ксенобиотиков). Процедура ранжирования данных, т.е. упорядочивания их в соответствии с числовыми градациями, проводится в возрастающем, либо в нисходящем ряду значений. Число градаций, характеризующих данные, не должно быть излишне большим, так как в этом случае увеличивается элемент субъективности.
При обработке данных часто приходится переводить качественные данные в количественные. В свою очередь количественные данные могут подвергаться квантованию в зависимости от поставленной задачи (для выделения интервалов, соответствующих различным состояниям, например температура нормальная, субфебрильная, высокая и др.), и тогда они становятся аналогичны качественным шкалированным.
В случае пропусков информации (отсутствующие данные) нельзя использовать так называемое «обнуление», т.е. приписывать кодовое число нуль, так как это в большинстве случаев совпадает с кодированием нормы по данному признаку. Также методически неверно использовать среднее по классу, особенно при малых выборках, так как классы далеко не всегда являются однородными (гомогенными). Предпочтительно исключать такие наблюдения или кодировать пропущенные данные специальным знаком (числом) при условии, что «обход» таких «значений» предусмотрен в программе, т.е. обработка проводится только по известным значениям данных.
В клинической и экспериментальной медицинской практике исследователь реже употребляет слово «данные», но чаще — «параметры» или «переменные», ставя между этими понятиями знак равенства.
Нужно отличать понятие «переменная» от понятия «признак»: температура тела — параметр (переменная), температура тела более 37° С — признак (человек нездоров). Переменные бывают непрерывными и дискретными, в том числе, дихотомическими (принимающими одно из двух значений, например «здоров — болен»).
В клинической практике переменные часто описываются шкалами. Как было отмечено ранее, шкалы бывают качественными (сознание ясное, спутанное и т.д.), классификационными (цвет кожных покровов — розовые, синюшные, желтушные, характер хрипов в легких — сухие, влажные мелкопузырчатые, крупнопузырчатые и т.д.) и количественные, в том числе интервальные, порядковые, балльные.
Интервальные переменные (например, ударный объем, мл: 50 — 80, менее 50, более 80) полезно использовать для решения конкретной клинической задачи. Их также можно переводить в порядковые (на основе построения шкал), но лучше (при наличии возможности и если это не противоречит смыслу решаемой задачи) использовать собственно количественные значения переменной.
Балльные шкалы получают по-разному: после предварительной математической обработки, на основе чисто клинической оценки параметра, комбинированным способом.
Как правило, затруднения в отнесении параметров к количественным или качественным не возникают. Гораздо сложнее при переводе качественных данных в количественные, когда реально нужно определить «вес» градаций качественного параметра. Не всегда правомерен вариант «в лоб»: 1, 2, 3, 4 и т.д. (но не более девяти значений, исходя из известного закона в области психологии, определяющего пределы способности человека к переработке информации). Часто для получения реальных «весов» параметров необходимо проводить дополнительное исследование.
Особым типом данных являются даты. Бывает, что по смыслу работы с ними приходится производить действия (например, определять, сколько времени прошло между соседними исследованиями), поэтому нужно следить, чтобы они записывались в определенном формате.
Важен вопрос о точности измерения и представления медицинских параметров. Понятно, что точность исходных данных определяется точностью метода и(или) прибора, с помощью которых осуществляется измерение.
В описательной статистике при работе с медицинскими данными необходимо поступать следующим образом: с одной стороны, не допускать потерь информации исходно — использовать данные с той точностью, которая имеет место при измерении; с другой — при представлении результатов статистической обработки данных не приводить избыточной информации — в большинстве случаев достаточно той точности представления информации, что и в исходных данных, либо использования одного Дополнительного разряда. Обычно при предъявлении числовых данных указываются два знака после запятой. Исключением являются случаи представления констант и весовых коэффициентов функций, полученных в результате многомерного анализа (например, дискриминантного); тогда в результирующих таблицах обязательно должны приводиться все цифры после запятой.
Следует остановиться на еще одной особенности медицинских данных.
В математической статистике выводы основаны на допущении: то, что верно на случайной выборке, верно и для генеральной совокупности, из которой она получена.
Генеральная совокупность — это набор данных, описывающих нечто всеобъемлющее, например все дети, живущие на планете Земля, вся совокупность пациентов, которые могли бы получать определенный препарат и т. п.
Выборка — часть генеральной совокупности, описывающая ее с той или иной долей погрешности.
Часто сформировать истинно случайную выборку из генеральной совокупности не представляется возможным в силу того, что для выполнения требований репрезентативности объекты исследования (пациенты) должны проживать на разных континентах земного шара. Проведение таких исследований в настоящее время возможно, однако в силу существенных физиологических различий между людьми, живущими в разных уголках планеты, может быть потерян клинический смысл исследования. Это утверждение справедливо для достаточно широко распространенных в настоящее время международных мультицентровых исследований, посвященных, например, метаболическому синдрому, в которых принимают участие крупные отечественные центры и институты. В таких случаях выборка должна быть репрезентативна к исследуемой популяции (населению РФ или определенных, этнически сходных, регионов России).
Современная технология статистического анализа данных включает:
1) постановку задачи и планирование исследования: составление детального плана сбора исходных данных, определение характера выборки;
2) подготовку данных;
3) выбор методов обработки данных;
4) проведение анализа данных;
5) интерпретацию и представление результатов анализа.
Суть современной технологии обработки медицинских данных с помощью методов математической статистики и их последующей интерпретации кратко изложена в подразд. 3.3 — 3.5.
- Введение
- Медицинская инфоматика как наука
- 1.1. Исторический обзор
- 1.2. Основные понятия медицинской информатики
- 1.3. Место медицинской информатики в здравоохранении
- Глава 2 стандартные прикладные программные средства в решении задач медицинской информатики
- 2.1. Применение текстового редактора в медицинских задачах
- 2.2. Применение электронных таблиц при работе с медицинскими данными
- 2.3. Возможности систем управления базами данных при построении информационных систем
- Глава 3 компьютерный анализ медицинских данных с использованием методов математической статистики
- 3.1. Программные средства математической статистики
- 3.2. Особенности медицинских данных
- 3.3. Подготовка, предварительный анализ информации и выбор методов обработки данных
- 3.4. Использование методов математической статистики для анализа данных
- 3.5. Интерпретация и представление полученных результатов
- Глава 4 телекоммуникационные технологии и интернет-ресурсы для медицины и здравоохранения
- 4.1. Понятие телемедицины
- 4.2. Этапы становления российской телемедицины
- 4.3. Телеконсультирование, теленаблюдение и телепомощь
- 4.4. Дистанционное обучение
- 4.5. Медицинские ресурсы сети интернет
- Глава 5 информационные медицинские системы
- 5.1. Классификация информационных медицинских систем
- 5.2. Общие требования к информационным медицинским системам
- 5.3. Значение стандартов в создании и обеспечении взаимодействия информационных медицинских систем
- 5.4. Организационное и правовое обеспечение функционирования информационных медицинских систем
- Глава 6 информационная модель лечебно-диагностического процесса
- 6.1. Основные составляющие лечебно-диагностического или оздоровительно-профилактического процесса
- 6.2. Процесс деятельности медицинского работника как объект информатизации
- 6.3. Моделирование и использование моделей в медицине
- Глава 7 поддержка лечебно-диагностического процесса методами кибернетики и информатики
- 7.1. Медико-технологические системы и их особенности
- 7.2. Автоматизированные системы для обработки медицинских сигналов и изображений
- 7.3. Автоматизированные системы для консультативной помощи в принятии решений
- 7.3.1. Автоматизированные системы для распознавания патологических состояний методами вычислительной диагностики
- 7.3.2. Автоматизированные консультативные системы для помощи в принятии решений на основе интеллектуального (экспертного) подхода
- База знаний
- 7.3.3. Автоматизированные гибридные системы для консультативной помощи в принятии решений
- 7.4. Автоматизированные системы для управления жизненно важными функциями организма
- Глава 8 автоматизированное рабочее место медицинского работника
- 8.1. Основные функции автоматизированного рабочего места медицинского работника
- 8.2. Классификации автоматизированных рабочих мест в здравоохранении
- 8.3. Особенности интеллектуальных автоматизированных рабочих мест
- 8.4. Специализированные рабочие места
- 8.5. Автоматизированные рабочие места и современные информационно-компьютерные технологии
- Глава 9 информационно-технологические системы
- 9.1. Построение и основные функции информационно-технологических систем
- 9.2. Поддержка процесса обследования и лечения в информационно-технологических системах
- 9.3. Информационно-технологические системы диспансерного наблюдения
- 9.4. Электронная история болезни
- 9.5. Информационно-технологические системы отделений лечебных учреждений
- 9.6. Регистры (специализированные информационно-технологические системы)
- 9.7. Права доступа к информации и конфиденциальность медицинских данных
- Глава 10 автоматизированные информационные системы лпу
- 10.1. Концепции разработки информационных систем лечебных учреждений
- 10.2. Функциональное назначение учрежденческих систем
- 10.3. Общие принципы построения автоматизированных информационных систем лпу
- 10.4. Уровни автоматизации современных лечебно-профилактических учреждений
- 10.5. Технологические решения
- Глава 11 информационные системы территориального уровня
- 11.1. Структура и функции медицинских информационных систем территориального уровня
- 11.2. Информационно-аналитические и геоинформационные системы в поддержке принятия управленческих решений
- 11.2.1. Информационно-аналитические системы
- 11.2.2. Географические информационные системы
- Глава 12 системы федерального уровня и мониторинга здоровья населения
- 12.1. Цели и задачи информационных медицинских систем федерального уровня
- 12.2. Принципы и место компьютерного мониторинга здоровья населения в общей системе здравоохранения
- 12.3. Федеральные системы мониторинга состояния здоровья
- Федеральная база данных
- Федеральная база данных
- 12.4. Интеграция информационных систем различных служб и уровней оказания медико-социальной помощи
- Федеральная имс
- Глава 13 перспективы перехода к электронному здравоохранению
- 13.1. Понятие электронного здравоохранения
- 13.2. Принципы построения единого информационного пространства
- 13.3. Подходы и первый опыт электронного здравоохранения
- 13.4. Возможности электронного здравоохранения
- Заключение: медицинская информатика в системе оказания помощи населению
- Оглавление