logo
Аппроксимация 2012_верстка

Глава 1 аппроксимация методом наименьших квадратов

Пусть имеем сеточную функцию yi(xi) (табл. 1), полученную экспериментально (или табулированием исходной сложной функции). Для получения аппроксимирующей функции Y(x) будем использовать МНК, согласно которому аппроксимирующую кривую проводят таким способом, чтобы сумма квадратов невязок Δi (отклонений рассчитанных по аппроксимирующей функции значений Yi) и экспериментальных значений yi) была минимальной:

(1)

В качестве аппроксимирующей функции Y(x) в общем случае можно представить линейную комбинацию нескольких функций:

Y(x) = c1y1(x) + c2y2(x) + ... + ckyk(x) (2)

где в качестве функций y1(x) … yk(х) можно использовать от одной до k функций, среди которых могут быть (или отсутствовать) степенная, показательная, логарифмическая, экспоненциальная и другие функции; с1 … сk – параметры аппроксимирующей функции.

Задача аппроксимации в этом случае сводится к вычислению постоянных с1, с2, ..., сk уравнения (2). Для этого подставим уравнение (2) в уравнение (1) и найдем минимум функции R, приравняв частные производные по искомым параметрам к нулю:

(3)

Это условие эквивалентно системе уравнений

(4)

или

Эти k уравнений можно представить в матричном виде как

Y C = B, (5)

где Y – матрица параметров, С – столбец искомых параметров; B – столбец свободных членов:

Все элементы матрицы Y и вектора-столбца B можно вычислить из сеточной функции по экспериментальным данным (табл. 1), поэтому (5) является системой из k уравнений с k неизвестными. Система линейных алгебраических уравнений (5) может быть решена относительно вектора С способами, описанными ранее в пособии [4]. В дальнейшем мы будем широко использовать метод обращения матрицы для решения СЛАУ, так как его реализация в МаthCad проста и лаконична:

С = Y-1 B. (6)

В качестве промежуточного результата расчета имеется матрица, обратная матрицы параметров Y-1, диагональные элементы которой можно использовать для расчета погрешностей (оценок дисперсий) искомых параметров С, связанных с величиной дисперсии адекватности (2):

, (7)

где R – сумма квадратов невязок; N – количество узлов (экспериментальных точек); k – число искомых параметров; f – число степеней свободы. Таким образом, аппроксимацию экспериментальных данных выбранной функцией при достаточно большом числе степеней свободы f можно использовать для регрессионного анализа.

Уравнение (5) и его решение (6), записанные в общем виде, можно использовать для получения решений при выборе любых функций и их линейных комбинаций в уравнении аппроксимирующего уравнения (2). Рассмотрим несколько приложений метода наименьших квадратов, часто встречающихся при обработке экспериментальных данных.

1. Линейная регрессия. Если в качестве аппроксимирующего уравнения выбрать линейную зависимость:

Y(x) = c1 + c2 x, (8)

то в уравнении (2) функции примут следующий вид:

y1(x) = 1; y2(x) = x;

а количество функций k = 2. Подставляя эти данные в уравнение (5) получим два уравнения с двумя неизвестными:

с1N + c2xi = yi

с1xi + c2x2i = yixi. (9)

При использовании MathCad, для расчета параметров линейной регрессии можно использовать расчет обращением матрицы, а также с использованием ключевого слова line(x, y)(программа 1), где х – вектор-столбец значений аргумента, а у – вектор-столбец значений функции. Решение находится в матрице, нулевым элементом является отсекаемый отрезок, а первым – тангенс угла наклона прямой.

Расчет погрешностей параметров выполнен по уравнению (7), которое справедливо тогда, когда линейный характер зависимости не вызывает сомнений. При обработке физико-химических данных часто возникает необходимость проверки линейной зависимости. Для этого вычисляют величину коэффициента парной корреляции r между экспериментальными данными yi и xi, представляющего собой вероятность соблюдения линейной зависимости между этими величинами:

(10)

Для вычисления r в MathCad есть специальная функция corr(x,y) (программа 1).