logo search
Сборник методов нейроинформатики

4. Эксперименты по предсказанию группового статуса

В этой серии экспериментов предполагалось проверить, насколько нейронные сети способны моделировать вхождение в группу отдельного человека.

По вышеописанной методике были обследованы три студенческие группы - третьего, четвертого и пятого курсов, общее число собранных анкет - 48 (19, 17 и 12 по группам соответственно). Результаты анкетирования каждой из групп был составлен задачник, представляющий собой реляционную таблицу, включающую следующие поля:

№ - автоиндексируемый номер записи, ID - номер испытуемого по списку группы,w1_1 - w1_29 - ответы на вопросы первого субтеста,w2_1 - w2_25 - ответы на вопросы второго субтеста,w3_1 - w3_36 - ответы на вопросы третьего субтеста,to1 - to30 - оценки, выставленные данным испытуемым членам группы (строка социометрической матрицы),St - значение стеновой оценки статуса данного испытуемого,Ex - экспансивности.

Для первого и третьего субтестов, у которых вопрос имел два варианта ответа («Да»/«Нет»), ответ кодировался по принципу 1 - «Да», 2 - «Нет». Второй субтест, имеющий три варианта ответов («а», «б, «в») - 1 - вариант «а», 2 - «б», 3 - «в».

При формирования структуры задачника поля w1_1 - w3_36 были обозначены как входные, полеEx - как выходное. Нейросеть в процессе обучения должна была приобрести умение предсказывать статус члена группы по его ответам на опросник А.Г. Копытова.

На первом этапе были проведены эксперименты для выяснения оптимальных параметров нейросети, предназначенной для решения задачи предсказания статуса члена группы. Из-за малочисленности выборок эксперименты велись в режиме «скользящего тестирования», когда для решения задачи обучается столько же сетей, сколько задач в задачнике. При обучении каждой из сетей одна задача исключалась, и потом сеть тестировалась по ней. Для оценки качества предсказания Hвыб применялся средний модуль ошибки, чем ниже значение - тем, соответственно лучше предсказание. Результаты этого этапа э

Таблица 1

Результаты экспериментов по подбору оптимальных параметров нейросети, решающей задачу предсказания статуса исследуемых.

№№

Характеристики сети

Hвыб

Nneu

1

16

0.1

2,475

2

16

0,4

2,791

3

16

0,7

2,488

4

32

0,1

2,569

5

32

0,4

3,006

6

32

0,7

3,384

7

64

0,1

2,891

8

64

0,4

2,703

9

64

0,7

2,676

кспериментов сведены в таблицу 1.

Значения чисел нейронов - Nneu- были взяты из следующих соображений: нейросети с числом нейронов менее 16 обучались решению задачи неустойчиво, процесс оптимизации постоянно заходил в тупик, аHвыбво всех таких экспериментах превышало 3 (30% относительной погрешности). 64 является максимально допустимым значением числа нейронов для программыMultiNeuron v.2.0. Значения характеристических чисел нейронов были распределены в интервале от 0.1 до 0.7, поскольку данный интервал является, по опыту, накопленному в группе «НейроКомп»[4], [5], [6], [7], [8], [9], [11], [13], [15], интервалом, в котором как правило лежат оптимальные характеристические числа нейронов.

Таким образом, по результатам данной серии экспериментов оптимальным было признано количество нейронов, равное 16, и характеристический параметр нейрона равный 0.1, поскольку данные значения обеспечивают наилучшую выборочную оценку качества прогноза Hвыб.

Следующим этапом работы была серия экспериментов, позволяющих оценить точность предсказания статуса исследуемых внутри групп. Для каждой из групп было выполнено обучение сетей для проведения скользящего контроля. Затем результаты скользящего контроля фиксировались и сводились в табл. 2.

О

Таблица 2

Результаты экспериментов по установлению точности предсказания стауса исследуемых внутри групп

Количество испытуемых

Hвыб

1

19

2,587

2

17

2,854

3

12

2,475

днако, по опыту применения нейроимитаторов, известно, что на одних и тех же обучающих выборках предсказание выдаваемое сетью может существенно разниться.

П

Таблица 3

Оценки погрешностей предсказания статуса исследуемых в группах консилиумами сетей.

Nиссл

H1

H2

H3

H4

H5

H6

H7

H8

H9

H10

Hср

Hвыб

19

3,02

3,68

3,88

4,13

3,14

3,38

4,09

3,46

2,82

3,32

3,49

2,83

17

3,32

4,80

4,33

4,50

4,46

3,15

3,72

4,31

3,20

4,51

4,03

3,84

12

2,20

2,68

3,23

2,59

3,86

2,96

2,82

3,28

3,52

2,58

2,97

2,41

ричина этого в том, что начальная карта синаптических весов генерируется случайным образом. Для преодоления данной проблемы в практике создания нейросетей (см. например[7]) используется предсказание ответов группой сетей, обученных на одних и тех же данных - консилиумом.

Решено было применить этот метод и для данной задачи. При проведении скользящего контроля по выборке для каждого из случаев обучалась не одна нейросеть, а десять.

Фиксировались средние выборочные значения ошибки предсказания статуса каждым из экспертов, а затем, оценивалась погрешность предсказания всем консилиумом.

Для этого в качестве ответа на каждую из задач скользящего контроля подавалось среднее значение ответов десяти нейросетей - экспертов. Результаты этого эксперимента представлены в табл. 3.

Здесь Nиссл- число исследуемых в данной группе,H1 - H10- средние ошибки предсказания статуса для каждой из сетей консилиума,Hср - среднее значение ошибки по всем сетям консилиума,Hвыб- ошибка предсказания всем консилиумом.

Таким образом, по трем группам средний модуль ошибки составляет 3,08 (или, в относительных цифрах, средняя погрешность составляет 30,8%).

Такая погрешность является удовлетворительной для задачи предсказания статуса членов группы, поскольку как правило не выводит испытуемого из групп классификации - «лидер»-«середняк»-«аутсайдер», то есть отражает тенденцию вхождения в группу нового человека.

Кроме того, при статистическом исследовании экспериментальных выборок было вычислено среднее расстояние между случайными оценкамии

,

где N - количество элементов выборки.

Можно считать, что характеризует математическое ожидание расстояния между двумя случайными примерами выборки.

Для экспериментов установления статуса тестируемых в группе , или 40.33%. Таким образом можно утверждать, что полученная сетью погрешность (30,8%) значимо отличается от случайной.

Следующая серия экспериментов производилась с целью уяснения, насколько можно предсказывать результаты вхождения в одну группу на базе опыта, накопленного сетью по другой группе.

В ходе экспериментов для каждой из групп был обучен консилиум из десяти нейросетей (их характеристики, как и в предыдущих экспериментах, Nneu=16,=0,1). Здесь задачник подавался для обучения полностью, то есть сеть обучалась предсказанию статуса по всем представителям группы. Затем на сетях этого консилиума тестировались две другие группы.

Для сглаживания фактора случайности при генерации сетей в качестве вычисленных значений при расчете ошибки определения статуса брались по каждой оценке средние значения из вычисленных десятью сетями консилиума. Результаты этой серии экспериментов представлены в табл. 4.

З

Таблица 4

Результаты перекрестного тестирования

Об.

Тст.

H1

H2

H3

H4

H5

H6

H7

H8

H9

H10

Hср

Hвыб

1

2

1,87

3,96

2,85

3,65

4,62

1,82

2,82

1,97

1,77

4,32

2,97

2,48

1

3

2,26

3,98

3,58

3,61

2,36

2,46

3,64

2,16

2,55

3,11

2,97

1,79

2

1

4,31

4,03

3,92

3,48

4,17

3,66

3,83

4,33

4,03

3,78

3,95

3,5

2

3

3,82

1,81

2,91

3,43

2,75

3,13

3,08

2,53

2,57

3,06

2,91

2,05

3

1

3,4

4,09

3,21

2,91

2,76

3,65

3,03

2,56

2,89

3,51

3,20

2,79

3

2

3,60

3,28

3,72

2,94

4,24

4,30

3,91

4,35

3,60

4,13

3,81

3,77

десьОб.- порядковый номер группы, по которой обучались нейронные сети консилиума,Тст. - порядковый номер группы, по которой сети тестировались.

При анализе данной серии экспериментов заметны следующие закономерности:

П

Таблица 5

Результаты тестирования консилиумов сетей, обученных по полной выборке.

Hвыб

1

3,02

2

2,56

3

2,88

4

3,04

5

2,94

6

2,88

7

2,74

8

2,46

9

2,59

10

3,12

Весь консилиум

2,32

осле оценки качества предсказания между группами решено было проверить гипотезу о том, что нейросеть может накапливать опыт не только по отдельной группе, но и аккумулировать его по любой заданной последовательности испытуемых. Для проверки гипотезы была предпринята следующая серия экспериментов: данные по всем группам были объединены в один задачник, по которому проводилось скользящее тестирование консилиума из десяти сетей - экспертов. Результаты данной серии из 480 экспериментов представлены в табл. 5.

Видно, что, как и в предыдущей серии экспериментов, погрешность каждого из экспертов (и, как минимум, математическое ожидание погрешности) выше, чем погрешность консилиума, то есть математическое ожидание оценок по консилиуму сетей всегда (или, вернее, в большинстве случаев) ближе к верному ответу, чем оценки отдельных экспертов.

Кроме того, легко заметить, что предсказание статуса исследуемых в группе улучшается с накоплением выборки - оценка погрешности предсказания, сделанного нейросетями, обученными по объединенной выборке лучше, чем в любых других экспериментах.

Иначе говоря, нейросети обладают возможностью аккумулировать опыт предсказания социометрического статуса исследуемых в группе, причем этот опыт не локален - навык, полученный на исследуемых одной группы значим и для оценки исследуемых, принадлежащих к другим группам.

Этот результат подтверждает тезис, приведенный в [18], о том, что оценки равных в группе устойчивы и, видимо, на них не влияет изменение состава группы.

Причина этого феномена, предположительно, в том, что при предсказании статуса испытуемых информация о них существенно ограничена - отсутствуют данные анамнестического плана, данные об их социальном положении.

Этим практически исключается из состава используемых в прогнозе данных информация о внешнем облике, принадлежности к социокультурной или национальной группе - то есть вся социальная история личности и коллектива в целом, хотя известно, что эти факторы могут вызвать существенное различие в поведении людей со схожим типом личности.

Информация же о константных психологических качествах испытуемых относительно однородна от группы к группе, что позволяет нейросети накапливать опыт, основанный на ней.