logo search
Mylnik_ISU / Мыльник_Исследование систем управления_2001

10.1. Полный факторный эксперимент и дробные реплики

Планирование экспериментов, как отмечалось выше в гл. 9, является составной частью процесса имитационного моделирования поведения системы управления. Кроме того, инструментарий методологии планирования экспериментов может быть использован для решения экстремальных задач, описанных в главе 8 в ситуации, когда у исследователя очень мало информации о характере оптимизируемой функции и области ее оптимальных значений.

Как правило, системы, подлежащие оптимизации, оказываются столь сложными, что не поддаются теоретическому изучению и в большинстве случаев экстремальные задачи решаются экспериментально при неполном знании механизма явлений. Теория планирования экспериментов – математическая теория экстремальных экспериментов, позволяющая выбирать оптимальную стратегию исследования при неполном знании процесса.

Существенным является то, что при этом подходе исследователь получает математическую модель процесса. На математическом языке задача формулируется следующим образом:

нужно получить представление о функции отклика ,

где – параметр процесса, подлежащий оптимизации, а- независимые переменные, которые можно варьировать при постановке экспериментов.

Основываясь на априорных сведениях об изучаемом процессе, исследователь выбирает некоторую оптимальную стратегию для управления экспериментом. На каждом этапе исследования выбирается оптимальное расположение точек в пространстве переменных для того, чтобы получить представление о функции отклика. Затем находится направление движения к той области, где условия протекания процесса оптимальны. После ее достижения формируется представление о виде функции отклика в области оптимума. Изложение материала следует 1 и 2 .

В этой части рассмотрены вопросы, связанные с планированием экспериментов методом полного и дробного факторного эксперимента. Детальное изложение этих вопросов необходимо для отчетливого понимания современных методов планирования экстремальных экспериментов. Факторный эксперимент – это первое звено в цепи тех идей, последовательное развитие которых привело к разработке статистических методов математического описания сложных процессов.

Построение полного факторного эксперимента и дробных реплик от него. Допустим, что мы имеем дело с двумя независимыми переменными x1 и x2 и каждую из них варьируем на двух уровнях, условно обозначаемых символами +1 и -1. Например, если в каком-то эксперименте варьировать два фактора – температуру и давление – так, чтобы они принимали только значение 800 или 1200 и 2 или 3 атм, то опыт, в котором температура была 1200, а давление 2 атм, в кодовом обозначении запишется так: x1=+1, x2=-1, а кодовое обозначение x1=-1, x2=+1 будет указывать на то, что опыт нужно проводить при температуре 800 и давлении 3 атм.

Легко видеть, что все возможные комбинации для двух факторов, варьируемых на двух уровнях, будут исчерпаны, если мы поставим четыре опыта так, как это показано в табл.3. Эта таблица называется матрицей планирования. В первом столбце таблицы приведены значения фиктивной переменной x0=1; во втором и третьем столбцах – значения переменных x1 и x2 (эти два столбца образуют собственно планирование); в четвертом столбце записано значение произведения х1х2; наконец, пятый столбец не относится непосредственно к матрице планирования – это вектор значений результатов наблюдений. Первая строка таблицы соответствует первому опыту, в котором обе независимые переменные x1 и x2 находятся на нижнем уровне. Во втором опыте первая независимая переменная x1 находится на верхнем уровне, вторая x2 - на нижнем, и т.д.

Таблица 3.

Полный факторный эксперимент для двух независимых переменных, варьируемых на двух уровнях (планирование типа 22)

Матрица планирования Х

Планирование

Вектор выхода Y

х0

х1

х2

х1х2

+1

-1

-1

+1

У1

+1

+1

-1

-1

У2

+1

-1

+1

-1

У3

+1

+1

+1

+1

У4

Пользуясь таким планированием, можно вычислить коэффициенты регрессии неполного квадратного уравнения.

у=b0+b1x1+ b2x2+ b12 x1x2;

в этом случае число опытов будет равно числу оцениваемых параметров – у нас не останется степеней свободы для проверки нуль-гипотезы об адекватном представлении результатов эксперимента выбранной математической моделью. Если есть основания полагать, что изучаемый процесс в заданном интервале варьирования переменных может быть описан линейной моделью, то можно воспользоваться методом наименьших квадратов для определения трех коэффициентов регрессии b0,b1 и b2 – одна степень свободы останется для проверки гипотезы адекватности.

Перейдем к рассмотрению экспериментов с тремя независимыми переменными х1, х2, х3, варьируемыми также только на двух уровнях. Чтобы исчерпать все возможные комбинации трех факторов, варьируемых на двух уровнях, нужно поставить восемь опытов, планируя эксперимент так, как это показано в табл. 4.

Таблица 4.

Полный факторный эксперимент для двух независимых переменных, варьируемых на двух уровнях (планирование типа 23)

Матрица планирования Х

Планирование

Кодовое обозна-чение строк

Вектор выхода Y

х0

х1

х2

х3

х1х2

Х1х3

х2х3

х1х2х3

+

-

-

-

+

+

+

-

(1)

У1

+

+

-

-

-

-

+

+

a

У2

+

-

+

-

-

+

-

+

b

У3

+

+

+

-

+

-

-

-

ab

У4

+

-

-

+

+

-

-

+

c

У5

+

+

-

+

-

+

-

-

ac

У6

+

-

+

+

-

-

+

-

bc

У7

+

+

+

+

+

+

+

+

abc

У8

Здесь введены два дополнительных упрощения в системе обозначений: символы +1 и –1 обозначены просто знаками «+» и «-» и добавлен новый столбец с условными обозначениями строк с помощью малых латинских букв и одной цифры. Буквы a,b,c обозначают, что в соответствующих строчках на уровне +1 был только один из факторов х1, х2, х3; произведение двух букв ab, bc, … обозначает, что в соответствующих строчках на верхних уровнях было два фактора: х1, х2, х3, …; произведение трех букв abc указывает на то, что на верхнем уровне были все три фактора; наконец, символ (1) означает, что все факторы были на нижних уровнях. С помощью такого кодового обозначения матрица планирования, представленная в табл. 2, может быть записана одной строкой:

(1), a, b, ab, c, ac, bc, abc.

Аналогичным образом, матрица планирования для табл.3. запишется строкой:

(1), a, b, ab.

Пользуясь планированием, предоставленным в табл.4, можно определить: свободный член b0, три коэффициента регрессии при линейных членах b1, b2, b3, три коэффициента при парных произведениях b12, b13, b23, и один коэффициент регрессии при тройном произведении b123. Если ограничиться линейным приближением, то останется четыре степени свободы для проверки гипотезы адекватности.

Матрицу планирования для трех независимых переменных получают из планирования для двух переменных, повторив его дважды: один раз при значениях х3, находящихся на нижнем уровне, второй раз – на верхнем уровне. Если нужно включить в рассмотрение четвертый фактор х4, то аналогичным образом дважды повторяют планирование для трех переменных: один раз для фактора х4, находящегося на нижнем уровне, другой раз – на верхнем уровне. В результате получают матрицу планирования, которая будет представлена следующей строкой:

(1), a, b, ab, c, ac, bc, abc, d, ad, bd, abd, cd, acd, bcd, abcd.

Аналогичным образом могут быть построены планы для сколь угодно большого числа независимых переменных. Легко видеть, что с ростом числа факторов k число опытов растет по показательной функции N=2k. Планирования, представленные в табл. 3 и 4, обычно называют планированиями типа 22 и 23 соответственно. При k независимых переменных мы будем иметь дело с полным факторным экспериментом типа 2k

Если при решении той или иной задачи можно ограничиться линейным приближением, то полный факторный эксперимент типа 2k также оказывается недостаточно эффективным, особенно при большом k. При линейном росте числа независимых переменных число опытов для полного факторного эксперимента растет по показательной функции, в результате слишком много степеней свободы остается на проверку гипотезы адекватности. Например, при k=2, при линейном приближении, для проверки гипотезы адекватности используется только одна степень свободы, тогда как при k=6 – уже 57 степеней свободы. Правда, при постановке таких больших экспериментов резко снижается ошибка в определении коэффициентов регрессии, так как при факторном планировании все опыты используются для оценки каждого из коэффициентов регрессии. Но это обстоятельство далеко не всегда является достаточным основанием для постановки большого числа опытов. Часто, особенно на первых этапах исследования, бывает нужно получить некоторую, хотя бы и не очень точную, информацию о процессе при минимальной затрате труда на проведение экспериментов. Если можно ограничиться линейным приближением, то число опытов можно резко снизить, используя для планирования так называемые дробные реплики от полного факторного эксперимента1.

Поясним идею дробных реплик на конкретных примерах. Допустим, что нам нужно получить линейное приближение некоторого небольшого участка поверхности отклика при трех независимых переменных. Для решения этой задачи можно ограничиться четырьмя опытами, если в планировании для полного факторного эксперимента типа 22 произведение х1х2 приравнять третьему фактору х3.. Будет получена матрица планирования, представленная в табл. 5.

Таблица 5.

Первая полуреплика от полного факторного эксперимента типа 23 (планирование типа 23-1)

Матрица планирования Х

Планирование

Кодовое обозна-чение строк

Вектор выхода Y

х0

х1

х2

х3

+

-

-

+

с

У1

+

+

-

-

a

У2

+

-

+

-

b

У3

+

+

+

+

abс

У4

Элементы этой матрицы в точности равны элементам матрицы, представленной в табл. 3. но опыты здесь будут уже ставиться с включением третьего независимого переменного х3. В первом опыте переменные х1 и х2 находятся на нижнем уровне, х3 – на верхнем; во втором опыте х1 находится на верхнем уровне, х2 и х3 - на нижних уровнях, и т.д. Пользуясь таким планированием, можно оценить свободный член b0 и три коэффициента регрессии при линейных членах. Если коэффициенты регрессии ij при парных произведениях не строго равны нулю, то найденные нами коэффициенты регрессии будут оценками для совместных эффектов:

b11+23,

b22+13,

b33+12.

Эти эффекты не могут быть раздельно оценены в планировании, состоящем всего из четырех опытов, так как здесь неразличимы столбцы для линейных членов и парных произведений. Если, например, в дополнение к столбцам, приведенным в табл. 5, мы вычислим еще столбец для произведения х1х3, то увидим, что элементы этого столбца в точности равны элементам столбца х2.

Если после постановки первых четырех опытов у исследователя почему-либо возникнут сомнения в том, что ij=0, то он может поставить еще четыре опыта, приравняв теперь х3 к – х1х2. Матрица такого планирования приведена в табл.6. Пользуясь этой матрицей, можно оценить совместные эффекты:

b’’11- 23,

b’’22- 13,

b’’33- 12.

Таблица 6.

Вторая полуреплика от полного факторного эксперимента типа 23 (планирование типа 23-1)

Матрица планирования Х

Планирование

Кодовое обозна-чение строк

Вектор выхода Y

х0

х1

х2

х3

+

-

-

+

(1)

У5

+

+

-

-

У6

+

-

+

-

У7

+

+

+

+

аb

У8

Здесь элементы столбцов x1,x2,x3 равны соответственно элементам столбцов x2x3, x1x3, x1x2, взятым с обратным знаком.

Взяв среднее из сумм и разностей для первой и второй системы совместных оценок, мы получим коэффициенты регрессии, которые будут уже оценками для разделенных эффектов (если ограничиться рассмотрением членов до второго порядка включительно).

Например, ,и т.д.

Легко видеть, что, объединив планирования, заданные таблицами 5 и 6, мы получим планирование, представленное таблицей 4. Первые две схемы планирования можно рассматривать как две половины или как две «полуреплики» от полного факторного эксперимента типа 23. Отсюда понятно, что, реализовав обе полуреплики от полного факторного эксперимента типа 23, получаем разделенные оценки для линейных эффектов и эффектов взаимодействия. Такие же разделенные эффекты будут получены, если реализовать сразу все восемь опытов для планирования типа 23.Нужно обратить внимание на то, что разбиение матрицы планирования, представленного таблицей 5, нельзя производить путем механического распределения строк на две группы. В первую полуреплику здесь отбираются строки с нечетным числом латинских букв (это соответствует требованию х31х2 - здесь третья переменная попадает на верхний уровень только в тех строках, где две другие переменные находятся одновременно на верхних или нижних уровнях). Во вторую полуреплику берутся строки с четным числом латинских букв (в соответствии с требованием х3= - х1х2).

Обратимся теперь к задаче с четырьмя независимыми переменными. Здесь можно поступить следующим образом: в планировании 23, представленном таблицей 4, приравнять тройное взаимодействие х1х2х3 к четвертому фактору x4, постулируя, что 123=0. Мы получим одну из полуреплик от полного факторного эксперимента типа 24. Матрица такого планирования будет задана строкой:

(1), ad, bd, ab, cd, ac, bc, abcd.

Здесь все строки четные. Эта матрица планирования получилась из матрицы планирования 23:

(1), a, b, ab, c, ac, bc, abc

путем умножения на букву d нечетного сочетания букв (соответственно требованию х41х2х3, четвертый фактор берется на верхнем уровне только в тех строках, где на верхнем уровне находится или один, или три других фактора). Вторую полуреплику получим, приравняв х4= - х1х2х3. Матрица планирования этой полуреплики будет задаваться нечетной строкой:

d, a, b, abd, c, acd, bcd, abc

Эта строка получена путем умножения на букву d четных комбинаций букв в исходной матрице планирования. Объединив две полуреплики, мы опять получим матрицу планирования для полного фактора эксперимента. Число четных и нечетных строк в полном факторном эксперименте всегда одинаково. Можно пойти дальше и построить дробные реплики высокой степени дробности. Если, например, нужно изучить влияние семи переменных, то для получения линейного приближения можно ограничиться восемью опытами. Постулируя возможность линейного приближения, мы утверждаем, что все эффекты взаимодействия пренебрежимо малы. Это дает возможность получить дробную реплику из полного факторного эксперимента типа 23, положив x4=x1x2, x5=x1x3, x6=x2x3, x7=x1x2x3.

Для обозначения дробных реплик, в которых p линейных эффектов приравнены к эффектам взаимодействия, удобно пользоваться условным обозначением 2k-p. В последнем примере мы рассмотрели дробную реплику, представляющую собой планирование типа 27-4. Полуреплика от полного факторного эксперимента 24 будет записываться как планирование типа 24-1. Такой способ записи еще полностью не характеризует свойств реплики. Дробные реплики можно получать, приравнивая основные эффекты различным эффектам взаимодействия. Например, планирование типа 24-1 можно получить, приравнивая x4 к тройному взаимодействию х1x2x3 или к одному из парных взаимодействий xixj. Естественно, что при этом изменится система совместных оценок.

Исследование уравнений регрессии, полученных с помощью полного факторного эксперимента и дробных реплик. Легко видеть, что рассмотренные выше схемы – полный факторный эксперимент и дробные реплики – обладают следующими свойствами:

где k – номер последнего столбца в матрице планирования.

Формально полный факторный эксперимент всегда можно рассматривать как некоторое планирование первого порядка, заменяя в матрице планирования произведения независимых переменных новыми переменными. Первое из написанных выше свойств – это свойство ортогональности: скалярное произведение всех вектор-столбцов здесь равно нулю. Второе свойство – это условие симметричного расположения всех независимых переменных относительно центра эксперимента. Наконец, третье свойство – это равенство сумм квадратов элементов для всех столбцов. Из первого условия следует, что матрица коэффициентов нормальных уравнений диагональна. Из третьего условия следует, что все диагональные элементы этой матрицы равны числу наблюдений N, а диагональные элементы обратной матрицы cij=1/N.

Для проведения регрессионного анализа мы получаем здесь следующие очень простые формулы:

В зависимости от постановки задачи можно различным образом использовать информацию, полученную при определении SR: