logo search
Алексеев информатика

8.3. Аппроксимация с помощью пакетов тсwiNи тс 3d

При разработке математических моделей часто пользуются таким приемом: экспериментально измеряют какие-то величины (например, вес и рост студентов) и затем эти полученные из опыта данные заменяют математической формулой типа

где у – вес студента; х – рост студента; а и bнекоторые коэффициенты, которые определяются в процессе аппроксимации. (Такая формула позволяет впоследствии предсказать вес студента, если известен только его рост.)

Процесс получения математической формулы из эмпирических (опытных) данных называют аппроксимацией. Теоретические основы замены численных данных на математическую формулу рассматриваются в разделе математики с названием регрессионный анализ.

С помощью методов регрессионного анализа удается установить форму связи между случайными величинами, т. е. подобрать такую функцию (формулу, уравнение регрессии), которая наилучшим образом описывает усредненное, массовое течение анализируемого явления.

Будем обозначать зависимую переменную через у, а независимую переменную через х.

Заметим, что в различных литературных источниках независимая переменная может называться фактором, предиктором, предсказывающей переменной, регрессором, регрессионной переменной, причиной. Синонимами зависимой переменной являются термины отклик, предсказываемая переменная, следствие. В дальнейшем мы чаще всего будем использовать термины фактор и отклик.

Понятия «фактор» и «отклик» по смыслу близки к понятиям «аргумент» и «функция». Однако первая пара терминов относится к стохастическим (вероятностным) зависимостям, а вторая пара – к функциональным (жестко определенным, детерминированным) зависимостям типа : и т. п.

Для получения линейных зависимостей одной величины от другой широко используется метод наименьших квадратов (МНК). Геометрическая сущность МНК состоит в том, что через облако эмпирических точек проводят прямую линию таким образом, чтобы эта линия располагалась как можно ближе к каждой имеющейся в облаке точке.

Для нахождения параметров однофакторного линейного уравнения регрессии у = а + b х используют одну из естественных характеристик точности подбора прямой регрессии – сумму квадратов отклонений. Чем меньше эта величина, тем ближе располагается прямая регрессии к каждой точке облака на диаграмме рассеяния.

Площади показанных на рисунке затемненных квадратов пропорциональны квадратам отклонений рассчитанных значений отклика от исходных значений в соответствующих точках. Для упрощения рисунка число эмпирических точек в облаке взято небольшим (n = 3). Очевидно, что изменение положения прямой регрессии на плоскости приведет к изменению суммарной площади выделенных квадратов. На рисунке символами уi обозначены точки на линии регрессии (т. е. это расчетные значения, которые заменяют исходные данные). Символами обозначены значения отклика, полученные опытным путем.

МНК дает расчетные формулы для определения коэффициентов а и b. Вывод расчетных соотношений приведен во многих источниках [30].

В науке и технике используются разнообразные зависимости, которые описываются не только линейными зависимостями, но и нелинейными (например, зависимости могут иметь экспоненциальный или гиперболический вид).

Автоматизировать процесс математического описания данных, полученных из опыта, позволяют многие математические и статистические пакеты (например, Mathcad, STATISTICA, Excel, Mathematica, STATGRAPHICS, STADIA и др.).

Недостатком перечисленных пакетов является то, что они предоставляют в распоряжение пользователя малое число моделей (т. е. разновидностей математических формул, с помощью которых можно аппроксимировать исходные данные).

Специализированные пакеты ТС WIN и ТС 3D ориентированы на получение нескольких сотен моделей, которые описывают один и тот же процесс. Пользователь (экспериментатор, исследователь) отбирает из имеющегося множества моделей подходящую для него математическую модель. Отбор производится с помощью нескольких показателей точности аппроксимации и с учетом опыта, накопленного самим экспериментатором.

Различие пакетов ТС WIN и ТС 3D состоит в том, что первый пакет предназначен для получения однофакторной зависимости (например, зависимость тока диода от напряжения). Пакет ТС 3D предназначен для получения двухфакторных зависимостей (например, зависимость тока анода электронной лампы от напряжения на аноде и напряжения на сетке).

Оба пакета разработаны одной фирмой Jandel, и поэтому освоение одной программы облегчает впоследствии переход ко второй программе.

После запуска программы ТС WIN на экране появляется окно с изображением Главного меню. Для ввода исходных данных с помощью клавиатуры в Главном меню следует выбрать пункт Edit (редактирование).

Далее в ниспадающем меню нужно активизировать пункт TableCurve Editor... На экране появится окно редактора в виде электронной таблицы, в которую можно занести большое число эмпирических точек (1500 – 2000).

Для ввода или редактирования данных нужно установить курсор в соответствующую ячейку таблицы. В любую ячейку можно записать константу, которая содержит до 80 символов.

Перемещение курсора между ячейками таблицы осуществляется стандартными курсорными клавишами клавиатуры, а также командными кнопками редактора.

Значения факторов заносятся в колонку X, а значения откликов – в колонку Y. В третью колонку Weights вводят веса, которые показывают «ценность» каждой экспериментальной точки. Чем больше значение веса, тем ближе (точнее) пройдет линия регрессии к данной точке. По умолчанию вес принимается равным единице для всех точках.

Для примера в данную электронную таблицу введены опытные данные, полученные при исследовании вольт-амперной характеристики туннельного диода.

С помощью кнопки Calculation есть возможность предварительно преобразовать введенные данные, например, умножить на какой-либо коэффициент, прологарифмировать, прибавить или вычесть постоянную составляющую и т. п. Если нужно увеличить отклик на три порядка (скажем, перевести миллиамперы в микроамперы), то после нажатия кнопки Calculation достаточно сделать запись: Если требуется сделать вес функцией отклика, то нужно записать:

При необходимости можно ранжировать фактор и отклик по возрастанию или по убыванию (кнопка Sort Table), поменять местами значения фактора и отклика (кнопка Reverse X, Y), посмотреть график исходных данных (кнопка Graph), ввести названия графика и осей (кнопка Titles), сохранить набранные данные в файле (кнопка Save), стереть все имеющиеся данные (кнопка Clear All).

После завершения ввода опытных данных следует нажать кнопку ОК. В результате этого появится диалоговое окно, в котором спрашивается о необходимости сохранения набранных с клавиатуры данных. После выполнения стандартных действий на экране возникнет окно Table Curve, в котором представлен график исходных данных и некоторые описательные статистики.

Для проведения аппроксимации в Главном меню активизируется пункт Process. В том случае, когда известен вид функциональной связи между откликом и фактором, в ниспадающем меню можно выбрать соответствующие уравнения: простые (Simple Equations), полиномиальные и рациональные (Poly/Ratl) и др. В противном случае нужно выполнить команду АИ Equations (Все формулы), которая использует для аппроксимации все имеющиеся в системе математические модели.

После проведения расчета можно поочередно получить изображение графиков всех моделей, а также численные значения коэффициентов уравнений регрессии. На рисунке показана «лучшая» модель, отобранная путем сортировки всех уравнений регрессии с помощью критерия Фишера (F-statistic).

Чтобы получить количественные значения коэффициентов выбранного уравнения регрессии, нужно в Главном меню выбрать пункт Review, a затем Graph Start...

В появившемся окне Review Curve-Fit, фрагмент которого показан на рисунке, следует нажать кнопку Numeric. На экране появятся результаты расчета, среди которых указаны параметры модели, значения критериев сортировки и др.

Кнопка List на вертикальном меню окна Review Curve-Fit (Просмотр моделей) позволяет поочередно вывести на экран результаты расчетов с помощью всех моделей. Кнопка Data служит для вывода исходных данных и данных, рассчитанных с помощью полученной модели.

В данном случае программой создана и отобрана как лучшая модель

Во второй и третьей строках открытого окна приведены значения критериев сортировки, с помощью которых отбирают лучшие (наиболее точные, адекватные) модели. Такими критериями являются коэффициент детерминации r2, модифицированный коэффициент детерминации Adj r2, стандартная ошибка Fit Std Err, критерий Фишера F-value.

Чем ближе коэффициенты r2 и Adj r2 к единице, тем точнее полученная модель. При сортировке моделей с помощью критерия Fit Std Err лучшей будет та модель, у которой эта величина меньше. Наконец при отборе моделей с помощью F-value наиболее адекватное уравнение регрессии будет иметь наибольшее значение данного критерия.

Пользователь по своему усмотрению может выбирать критерий сортировки.

Вслед за значениями критериев сортировки приведены значения коэффициентов в уравнении регрессии (а, b, с) и их статистические характеристики.

Программа ТС 3D позволяет работать с двумя независимыми переменными (факторами). Аппроксимация исходных данных осуществляется уже не линиями, а поверхностями. График полученной модели становится трехмерным (отклик и два фактора). По этой причине в названии программы присутствуют символы 3D. Порядок работы с этой программой аналогичен порядку работы с ТС WIN.

На рисунке показан фрагмент таблицы с исходными данными. Значения факторов заносятся в колонки X и Y, а отклик – в колонку Z.

Одна из множества рассчитанных моделей

содержит коэффициенты а, b, ..., g, которые определяются в процессе работы программы. График выглядит в виде причудливой поверхности.