Регрессионный анализ

Регрессионный анализ часто используют в промышленности для описания результатов пассивного или активного промышленного эксперимента в виде линейных (1) или нелинейных (2) уравнений регрессии:

Уi = a0 + a1x1 + а2x2 + а3x3 + ... + аixi = (1)

Уi = а0 +а1x1 +а2x2 +а12x1x2 +а11x12 +а22x22 +...= а0 +Sаixi +Sаijxixj +Sаiixi2 +Sаjjxj2 (2)

где Уi - выходной параметр (степень превращения, степень извлечения, содержание основного вещества, длительность процесса и т.п.);

xi - входные параметры, влияющие на выходной параметр (температура, концентрация, давление и т.п.);

а0, аi - коэффициенты регрессии;

m - количество входных параметров.

При проведении пассивного эксперимента процесс проводится в рамках установленных технических норм, входные и выходной Регрессионный анализ параметры регистрируются на компьютере или в технологическом журнале. Как правило, изменение указанных параметров от регламентных составляет небольшие величины, поэтому результаты промышленного пассивного эксперимента представляются линейными уравнениями регрессии.

При проведении активного эксперимента (исходя из задач эксперимента) диапазон изменения входных и выходных величин существенно расширяется. В этом случае результаты активного эксперимента представляются нелинейными уравнениями регрессии, более точно описывающими многомерные функции выходного параметра Уi.

Уравнения регрессии (1 и 2) представляют математическую модель изучаемого объекта только для того диапазона, в котором проводилось исследование объекта. При расширении диапазона изменения входных переменных найденные уравнения регрессии (коэффициенты регрессии) становятся некорректными и должны быть пересчитаны. Вычисляемые коэффициенты и уравнения регрессии не имеют Регрессионный анализ физического смысла и для одного и того же объекта (процесса) может быть найдено несколько уравнений регрессии, отличающихся точностью описания изучаемого объекта. Уравнения регрессии могут использоваться для оптимизации изучаемых процессов.

Выбор того или иного уравнения регрессии зависит от исследователя и определяет точность (адекватность) с которой уравнение описывает в требуемых пределах исследуемый (наблюдаемый) объект. Такой выбор уравнения определяется исследователем на основании априорных сведений об объекте, влияющих факторов и удобства использования математической модели конкретного вида. Методы регрессионного анализа позволяют из нескольких различных по виду моделей выбрать наиболее адекватную.

Регрессионный анализ сводится к определению коэффициентов уравнения регрессии (на основании экспериментальных данных), оценки значимости Регрессионный анализ этих коэффициентов и степени адекватности математической модели. Для проведения регрессионного анализа полученные массивы данных пассивного или активного эксперимента обрабатываются, производится отсев неверных значений, далее очищенные от ошибок данные подвергаются математической обработке и представляются в виде функции регрессии одной или более переменных.

Вычисление коэффициентов регрессии проводится по методу наименьших квадратов. Суть метода заключается в следующем. Пусть входные и выходной параметры имеет линейную корреляционную связь, тогда при оценке выходного параметра используется линейное регрессионное уравнение вида (1). Необходимо найти коэффициенты регрессии а0, аi (i=1...m, m-число коэффициентов уравнения регрессии) такие, чтобы экспериментальные точки (yj), (j=1..n, n-число экспериментальных наблюдаемых точек Регрессионный анализ) построенные по данным наблюдений, лежали как можно ближе к расчетной прямой У=f(x), вычисляемой по уравнению регрессии (см. рис.1).



Рис.1

Для нахождения коэффициентов регрессии составляют функцию квадратов отклонений расчетных и экспериментальных (наблюдаемых) значений:

(3)

где Yj - вычисленное по уравнению (1) значение, соответствующее наблюдаемым значениям xij, yj - наблюдаемое значение выходного параметра, соответствующее xij.

Подбирают коэффициенты регрессии так, чтобы сумма квадратов отклонений (3) была минимальной. Подставляя в уравнение (3) уравнение (1) получают:

(4)

Поскольку условием существования экстремума функции (4) является равенство частных производных по каждой переменной (искомым коэффициентам) нулю, то для отыскания минимума функции F приравнивают нулю соответствующие частные производные:

В итоге получают систему из m+1 линейных Регрессионный анализ уравнений, решив которую находят коэффициенты регрессии а0, аi (i=1...m). Для решения системы линейных уравнений обычно используют компьютеры и программное обеспечение.

При необходимости получения нелинейных уравнений регрессии, например в виде уравнения (2), расчет коэффициентов регрессии проводят аналогично.

Если анализируемая функция зависит от одного параметра, то уравнение линейной регрессии представляется в простом виде:

(5)

где – – свободный коэффициент (пересечение с осью у при х=0);

b – коэффициент - тангенс угла наклона прямой к оси х.

Коэффициенты регрессии для уравнения (5) можно непосредственно вычислить по формулам:

b= (6)

= (7)

где –n- число экспериментальных точек.

Статистический анализ уравнений регрессии

Статистический анализ уравнений регрессии заключается в проверке адекватности полученного уравнения Регрессионный анализ и значимости коэффициентов регрессии. Он дает возможность найти пределы измерения углового коэффициента и отрезка на оси ординат для линии регрессии, а исследование адекватности позволяет оценить степень отклонения экспериментальных точек от расчетной линии.

Дисперсия адекватности уравнения регрессии S2ад характеризует меру отклонения расчетных данных Ур, полученных по уравнению, от реальных экспериментальных результатов уi для i-й точки, в которой произведено измерение. Значение S2ад находят по формуле:

S2ад = (6)

где (n-2)=f – число степеней свободы.

Дисперсии коэффициентов уравнения регрессии (5) находят из выражений:

(7)

(8)

при числе степеней свободы f=n-2.

После вычисления дисперсий вычисляют статистическую значимость коэффициентов регрессии. Эта проверка дает ответ на Регрессионный анализ вопросы о том, проходит ли прямая, выраженная уравнением (5) через начало координат и отличается ли угол её наклона от 450. Критерием значимости для такой проверки является критерий Стьюдента.

Доверительные интервалы (границы) Dа и Dв для коэффициентов регрессии вычисляют по формулам:

Dа=±tSa (9)

Dв=±tSb (10)

Некоторые из найденных коэффициентов могут оказаться пренебрежимо малыми – незначимыми, которые могут быть отброшены. Факторы, перед которыми стоят незначимые коэффициенты, оказывают незначимое влияние на анализируемую функцию. Коэффициенты регрессии ai значимы, если абсолютная величина коэффициента больше половинного значения Dа/2 или Dв/2, т.е. если выполняется условие:

(11)

где si - оценка дисперсии каждого из коэффициентов регрессии;

t - значение критерия Стьюдента, определяемое по статистической Регрессионный анализ таблице или вычисляемое на компьютере по уровню значимости a=1-Р и числу степеней свободы f, (см. приложение ниже).

Проверку адекватности уравнения регрессии проводят по F-критерию Фишера:

Fр= S2ад/S2y (12)

при числе степеней свободы числителя (n-2), а знаменателя n(m-1). Выборочная дисперсия S2y определяется по формуле:

S2y= (13)

где n - число серий измерений , i=1,2,..n;

m - число параллельных измерений в каждой серии, j=1,2,..m.

Если в каждой из серий число измерений mi разное, то для расчета S2y используют выражение:

S2y= (14)

Для вычисления по этой формуле предварительно находят значения дисперсий S2i в Регрессионный анализ каждой из i-серий.

Если значение Fр, определяемое по формуле (12) меньше табличного значения Fт, при избранном уровне значимости a=1-Р, то уравнение регрессии (5) адекватно описывает экспериментальные данные. Если значение Fр> Fт, то уравнение регрессии (5) неадекватно, следует предложить другой вид уравнения и исследовать новое уравнение.


documentaqswuir.html
documentaqsxbsz.html
documentaqsxjdh.html
documentaqsxqnp.html
documentaqsxxxx.html
Документ Регрессионный анализ