Психологическая интуиция искусственных нейронных сетей

1.3 Математические модели и алгоритмы психодиагностики

В работе исследователя по конструированию психодиагностического теста принято выделять три этапа [20], [47].

На первом этапе конструируется «черновой» вариант теста. В него включаются задания, ответы на которые, по мнению экспериментатора, должны отражать индивидуально-психологические различия испытуемых по данному конструкту.

На втором этапе исследователь выбирает диагностическую модель и определяет ее параметры. Под диагностической моделью понимается способ компоновки (преобразования, агрегирования) исходных диагностических признаков (вариантов ответов на задания теста) в диагностический показатель.

На третьем этапе проводится стандартизация и испытание построенной диагностической модели.

Наиболее употребляемой в психодиагностике является линейная диагностическая модель. Без применения эмпирико-статистического анализа не обходится ни одна серьезная попытка конструирования или адаптации тестов [97]. Исходным материалом для такого анализа служат результаты экспериментального обследования репрезентативной выборки испытуемых с помощью «чернового» варианта психодиагностического теста. Из полученных данных формируется таблица экспериментальных данных (см. табл. 1)

Таблица 1

Структура таблицы экспериментальных данных

Объекты (	Исходные признаки
испытуемые)	x1	x2	...	xi	...	xp
X1	x11	x12	...	x1j	...	x1p
...	...	...	...	...	...	...
Xi	xi1	xi2	...	xij	...	xip
...	...	...	...	...	...	...
XN	xN1	xN2	...	xNi	...	xNp

В табл. ... N - общее количество объектов (испытуемых), p - общее количество признаков, xj - j-й признак, xij - значение j-го признака, измеренное у i-го объекта, X=( x1, ... , xp)T - вектор признаков, Xi=( xi1, ... , xip)T - i-й объект, X={ Xi} - множество объектов.

Исходные признаки xj, как правило, измерены в номинальных и порядковых (ординальных) шкалах [18],[82],[89]. Для большинства объективных методик нельзя априорно установить ни количественных отношений ни отношений порядка, поскольку их признаки представляют собой номинальные измерения. Зачастую при формализации тестовых методик применяют «дихотомизацию» [65] - процедуру преобразования исходных показателей в набор признаков с двумя градациями.

Для ординальных признаков существенен лишь порядок градаций на шкале, и для них считаются допустимыми любые монотонные преобразования не нарушающие этот порядок. Методически строгим является применение к ординальным признакам методов обработки, результат которых инвариантен относительно допустимых преобразований порядковой шкалы [49].

Далее, после сформирования таблицы экспериментальных данных, производится построение диагностической модели. Считается, что модель должна в определенной форме выражать зависимость между вектором входных признаков и тестируемым свойством (значение выраженности свойства далее будет обозначаться y). Модель должна отражать механизм преобразования y=y(x).

Предварительным этапом в построении диагностических моделей является как правило выяснение структуры таблицы экспериментальных данных. На этом этапе производится оценка корреляции между факторами и близости между объектами. Набор математических моделей и алгоритмов, используемых для этого, определяется исходя из специфики экспериментальных данных в психодиагностике.

Для определения степени связи между признаками используются [48],[65],[73]:

Коэффициент корреляции Пирсона, являющийся мерой линейной связи двух переменных: , где и . В рамках этого же подхода сконструированы коэффициент ранговой корреляции Спирмена, точечный бисериальный коэффициент корреляции и тетрахорический коэффициент корреляции.

Коэффициент , предназначенный для измерения связи двух дихотомических признаков [73]. Коэффициент вычисляется на базе таблиц сопряженности признаков (см. табл. 2) по формуле .

Таблица 2

Таблица сопряженности дихотомических признаков

Признак	Признак	Итог
	1	0
1	a	b	a+b
0	c	d	c+d
Итог	a+c	b+d

Коэффициент ранговой корреляции «тау» Кенделла, основанный на подсчете числа несовпадений в ранжировке объектов по сопоставляемым переменным. Данный коэффициент разработан исходя из задачи истолкования процесса измерения связи между переменными без помощи принципа произведения моментов. Рассматриваются два признака и , на каждый из которых N объектов отображаются в N последовательных рангов. Из N объектов формируется пар. Тогда коэффициент вычисляется по формуле , где P - количество совпадений порядка на признаке с порядком на признаке , Q - количество несовпадений.

Степень связи между признаками может быть использована для оценки избыточности набора признаков «черновой» модели, для взаимоконтроля шкал и т.п.

Для определения близости объектов используются различные меры расстояния:

Евклидово расстояние .

Взвешенное евклидово расстояние .

Расстояние Махаланобиса , где S - ковариационная матрица генеральной совокупности, из которой извлечены объекты и .

Расстояние Минковского (городская метрика), применяющееся для измерения расстояния между объектами, описанными ординальными признаками. равно разнице номеров градаций по k-му признаку у сравниваемых объектов и .

Расстояние Хэмминга , которое используется для определения различий между объектами, задаваемыми дихотомическими признаками и интерпретируется как число несовпадений значений признаков у рассматриваемых объектов и .

Полученная на основе какой-либо метрики (подробнее - [25], [48], [50]) информация о степени близости объектов может быть использована для выделения их группировок.

Представление информации о структуре экспериментальных данных служит промежуточным звеном в построении диагностической модели. Независимо от типа модели ее создание может опираться на два подхода:

1.Стратегия, основанная на автоинформативности экспериментальных данных.

Высокая степень близости между группой признаков может свидетельствовать о том, что признаки, вошедшие в группу, отражают эмпирический фактор, соответствующий диагностическому конструкту.

Выделение геометрических группировок в пространстве объектов может свидетельствовать о различии изучаемых объектов по тестируемому свойству, что позволяет строить диагностический алгоритм.

Для стратегий, основанных на автоинформативности экспериментальных данных, важной категорией является согласованность заданий теста.

Согласованность измеряемых реакций испытуемых на тестовые стимулы означает, что они должны иметь статистическую направленность на выражение общей, главной тенденции теста.

На стратегии, основанной на автоинформативности экспериментальных данных, строятся конструирование диагностического алгоритма при помощи метода главных компонент [17], [18], [19], факторного анализа [66] и метода контрастных групп [97].

2. Стратегия, основанная на критериях внешней информативности. Внешняя информация может быть представлена в виде привязки к объектам значений «зависимой» переменной, измеренной в количественной шкале, в виде номера однородного по тестируемому свойству класса, в виде порядкового номера (ранга) объекта в ряду всех объектов, упорядоченных по степени проявления диагностируемого свойства или в виде совокупности значений набора внешних (не включенных в таблицу экспериментальных данных) признаков, характеризующих тестируемый психологический феномен.

Методы, основанные на внешней информативности признаков принято подразделять на экспертные, экспериментальные и жизненные.

К числу экспертных критериев относят оценки, суждения, заключения об испытуемых, вынесенные одним экспертом или их группой.

Экспериментальными критериями служат результаты одновременного и независимого исследования испытуемого другим тестом, который считается апробированным и измеряющим то же свойство, что и конструируемый тест.

В качестве жизненных критериев используются объективные социально - демографические и биографические данные.

На стратегии, основанной на внешней информативности экспериментальных данных, строятся конструирование диагностического алгоритма при помощи регрессионного анализа, дискриминантного анализа [49] и типологического подхода [60], [99].

Наиболее широко в настоящее время употребляются линейные диагностические модели. Однако в условиях неоднородности обучающей выборки они обладают практической успешностью не выше 70-80% [60].

Построенная диагностическая модель может считаться психодиагностическим тестом только после прохождения ею испытаний на предмет проверки психометрических свойств - надежности и валидности [20],[27].

Надежность теста - характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к воздействию посторонних случайных факторов [27].

Валидность - мера соответствия тестовых оценок представлениям о сущности свойств или их роли в той или иной деятельности [60].

Содержание