Археология Бурятии информационно-справочная система
 
карта сайта
 

2.2. Теория математического планирования экспериментов

ВВЕДЕНИЕ

Началом экспериментальных исследований является сбор, изучение и анализ всех имеющихся данных об объекте. Априорная информация может быть скупой или обширной, но именно она является той базой, на которой строятся первые шаги исследования. Чем полнее знания об объекте, тем быстрее исследователь придет к окончательному решению поставленной задачи. В результате проведения этого предварительного, априорного этапа исследователь должен: составить полный список факторов, влияющих на изучаемое явление, исходя из того, что лучше назвать несколько малозначащих факторов, чем пропустить один существенно значимый; задать ориентировочные пределы изменения факторов с учетом требований их совместимости; выбрать параметры (меры) оценки результатов экспериментов (критерии оптимизации, функцию отклика, etc) в соответствии с поставленной задачей.

Если список факторов окажется большим (реально - больше 5-7), необходимо выделить из них 3 - 5 наиболее значимых с помощью так называемых отсеивающих экспериментов. На этом завершается предварительный этап экспериментальных исследований.

В соответствии с идеей шагового поиска эксперимент проводится в несколько этапов. Число этапов и действия на каждом из них зависят от результатов предыдущего этапа и конечной цели исследования. Все многообразие конечных целей исследования можно обобщенно разделить на два типа: найти адекватное описание изучаемого явления или найти значения факторов, при котором исследуемый процесс протекает наилучшим образом. (Эти вопросы более подробно будут освещены в статье по моделированию).

1. Постановка задачи

Пусть в процессе исследования какого-либо явления (очистки жидкости, выращивания урожая, изменения прибыли и т.п.) обнаруживается, что интересующее нас качество (мера) этого явления Y зависит от нескольких величин xi и мы хотим выяснить характер этой зависимости. Иными словами, предполагается существование функции нескольких переменных

Y = f(xi), (1)

о которой мы имеем лишь самые общие, иногда интуитивные представления.

Проводя эксперименты, - изменяя значения факторов (xi) и регистрируя значения результатов (y) - можно получить как угодно много информации о функции (1) необходимо только знать, как правильно использовать эту возможность. Функцию Y обычно представляют в виде уравнения регрессии

Y = f(a +bi *xi), (2)

Факторы xi могут быть представлены в первой (линейная зависимость) или более высокой степени (нелинейная зависимость), а также в виде взаимных произведений (то есть влияния на Y взаимодействия двух или более факторов). Значения коэффициентов (a, bi) определяются на основе метода наименьших квадратов (сейчас уже можно говорить - с помощью Excel). Диапазоны изменения всех факторов, в которых изучается их влияние на функцию Y, могут быть широкими, ограниченными лишь физическими соображениями ("а не -"), если необходимо получить общее описание явления (интерполяционные задачи), или, наоборот, узкими, когда ищется путь к экстремуму (задачи оптимизации). Так или иначе, для каждого из факторов xi необходимо однозначно определить граничные - минимальные и максимальные - значения. Факторы xi в общем случае размерные величины, хотя имеют различную природу и размерность. Для устранения связанных с этим сложностей, в т.ч. анализа, методика планирования экспериментов предусматривает использование кодированных значений факторов. Для осуществления операции кодирования необходимо, прежде всего, выбрать исходную область экспериментирования, т.е. задать минимальные и максимальные значения каждого фактора. Тогда операция кодирования сводиться к переносу начала координат факторного пространства в точку с координатами xi(0) =(xi min + xi max)/2 и выбору для каждого фактора нового масштаба, при котором xi min = -1, а xi max =+1.

Например, если мы изучаем влияние скорости на какой-то процесс в диапазоне от 40 до 90 км/час, то значению фактора 40км/час будет соответствовать кодированное значение -1, а 90км/час - +1. Начало координат будет помещено в точку 0, соответствующую 65км/час. То есть при расчете уравнений регрессии будут использоваться значения факторов +1, 0 и -1. Если же фактор имеет дискретный характер или, тем более, имеет качественное варьирование, то операция кодирования сводится просто к приписыванию каждому возможному уровню фактора чисел +1 и -1. Например, если изучаются два вида топлива - бензин и солярка, то, произвольно, бензину можно присвоить значение -1, а солярке +1.

2. Планы экспериментов

Математический аппарат планирования экспериментов позволяет проводить действительно активный эксперимент и получать только необходимую информацию отдельно о каждом факторе или сочетании факторов. В частности, это выражается в том, что коэффициенты регрессии, которые являются основными характеристиками каждого фактора, определяются независимо друг от друга. Управляемость процесса получения информации заключается в том, что в процессе исследований ставятся эксперименты не по всем возможным сочетаниям факторов, а только по сочетаниям (значениям факторов в каждом эксперименте), которые обеспечат получение нужной информации. Это, в первую очередь, резко сокращает количество опытов и облегчает обработку и анализ полученных результатов, и, во-вторых, заставляет целенаправленно проводить исследования, четко обосновывая условия и количество экспериментов.

Если высказывается гипотеза о линейной зависимости исследуемого процесса, а прямую линию можно построить по двум точкам, то минимальное значение числа уровней факторов в экспериментах равно двум (-1 и +1). При количестве факторов равном n, количество экспериментов N будет равно 2 в степени n. План, построенный таким образом, получил название полного факторного эксперимента (ПФЭ).

В ряде случаев бывает нужным определить не все коэффициенты в уравнении (2), а лишь часть из них. В этом случае ПФЭ даст избыточную информацию. В подобных ситуациях надо переходить к планам, представляющим собою части плана ПФЭ (половину, четверть и т.д.) и называемым дробными репликами ПФЭ или дробным факторным экспериментом (ДФЭ) и количество опытов N равно уже 2 в степени (n - k).

Дробные реплики особенно удобны при большом числе факторов (n больше 5), так как там удается смешивать коэффициенты при факторах и, например, двойных взаимодействиях с коэффициентами при тройных и более высоких взаимодействиях, которые обычно слабо влияют на процессы. В теории планирования экспериментов разработаны планы ДФЭ, учитывающие какие коэффициенты в (2) необходимо определить.

Планы ПФЭ и ДФЭ позволяют найти коэффициенты регрессии в уравнении (2), если аппроксимируемая поверхность (исследуемый процесс) хорошо описывается полиномом без квадратичных членов. Если же исследуемый процесс носит нелинейный характер, то соответственно, двух уровней значения факторов уже недостаточно. В этом случае используются так называемые ортогональные планы второго порядка.

В ортогональном плане второго порядка к ядру, представляющему собой план ПФЭ, добавляются центральная точка (xi = 0, i = 1,2, -, n) и по две так называемые "звездные" точки для каждого фактора (xi = ¦a). Величина a зависит от n, при n = 2, 3, 4, 5 велична a = 1,000; 1,215; 1,414; 1,515.

Таким образом, в случае трехфакторного эксперимента ортогональный план второго порядка будет состоять из 8 опытов по ПФЭ, где каждый фактор будет варьировать на уровне -1 и +1; 6 опытов, в которых каждый фактор берется в кодированных значения на уровнях 0 и ¦1,215 и один эксперимент проводится, когда все факторы имеют центрально значение 0. (Естественно, что для дискретных факторов эти эксперименты не реальны.) Как для ПФЭ, ДФЭ, так и для ортогональных планов второго порядка и других методов в теории математического планирования экспериментов разработаны стандартные планы, соответствующие различным ситуациям и целям проведения исследований.

Разработаны такие планы и для отсеивающих экспериментов. Эти планы обеспечивают получение информации достаточной только для того, чтобы сравнить между собой степень влияния каждого фактора на исследуемый процесс. Анализ полученных результатов позволит выбрать для последующих экспериментов только наиболее значащие факторы.

3. Оценка результатов экспериментов

Известна концепция, что "существует ложь, наглая ложь и статистика" (мы коснемся этого вопроса в статье по моделированию). В экспериментальной работе, предусматривающей получение статистических уравнений регрессии надо учитывать, что единственным ограничением здесь является количество опытов (число степеней свободы) и, если это условие соблюдено, уравнение регрессии любого вида может быть получено для любого результата, вплоть до таблицы случайных чисел. Для снижения влияния этой концепции в статистике и теории планирования экспериментов используют ряд оценочных показателей, в основе которых лежит анализ дисперсий полученных результатов.

Оценка воспроизводимости опытов необходима для того, чтобы определить, в какой степени обычные для любых экспериментов расхождения результатов повторностей одного и того же опыта обусловлены статистически случайными явлениями или являются следствием некорректной постановки опытов и влиянием неучтенного фактора(ов). Эта оценка в общем случае проводится по критерию Фишера, а в случае, когда все эксперименты проводятся с одинаковым числом повторностей, используют критерий Кохрена.

Статистическая значимость коэффициентов регрессии проверяется с помощью критерия Стьюдента.

Адекватность (степень соответствия) полученного уравнения регрессии экспериментальным результатам проверяется на основании критерия Фишера.

Rambler's Top100
Hosted by uCoz