Главная страница  Анализ эмпирических данных 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 39 ] 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

включены в состав Проекта 3 без каких-либо переделок, другие модифицировались, а третьи создавались заново. Следует подчеркнуть, что модули, обнаруживавшие грубые выбросы, из регрессионного анализа исключались. Полученные в результате анализа значения г (фактически г) показывают долю общей дисперсии числа ошибок, объясняемую с помощью соответствующих регрессионных зависимостей.

В табл. 3.12 приводятся значения коэффициента корреляции общего числа ошибок с каждым из показателей Стот, Ltot и Стот - Ltot для подсистем А, В, С, D, Е и функции Gi. Значения коэффициента г существенны: 100г% всюду превосходит 50%, а для функции Gi - даже807о>



Глаёа 4

Регрессионный анализ экспериментальных данных

4.1. Обобщенная регрессионная модель

Для прогнозирования числа ошибок в Проекте 3 с помощью измеряемых показателей, характеризующих текст программы на входном языке, был применен неклассический метод регрессионного анализа. В основе этого метода лежит известная техника построения линейной функции измеряемых параметров путем минимизации суммы квадратов отклонений фактического числа ошибок от его значения, получаемого по модели, т. е. линейный регрессионный анализ или метод наименьших квадратов. Основным отличием модификации этого метода, примененной в наших исследованиях, является условие неотрицательности коэффициентов линейной функции, которое обеспечивает эффект неубывания отклика при возрастании значений отдельных факторов (аналогично на коэффициенты тех показателей, которые вызывают убывание числа ошибок, было наложено ограничение неположительности). Это отличие превращает несложную технику метода наименьших квадратов в трудную задачу нелинейного программирования с квадратичной функцией потерь и линейными ограничениями типа неравенств.

Вопросы статистического анализа коэффициентов модели, полученных с помощью метода нелинейного программирования (например, оценка степени связи и доверительных границ коэффициентов), недостаточно освещены в литературе даже для самых простых случаев квадратичной функции потерь и ограничений типа неположительности или неотрицательности, не говоря уже о произвольных нелинейных выпуклых



*) Точка зрения профессора А. Мадански из Чикагского университета, изложенная им в частной беседе.

) Для получения пакета этих программ к данных на машинных носителях запросы следует направлять в International Mathematical and Statistical Libraries, Inc., Suite 510, 6200 Hillcroft, Houston, Texas 77036.

функциях цели Однако оценка дисперсии числа ошибок относительно оптимальной линейной модели с заданным набором факторов является достаточно хорошей мерой качества приближения при различных вариантах выбора подмножества факторов. С этой целью она используется в дальнейшем.

После регрессионного анализа с ограничениями проводился обычный регрессионный анализ по некоторым подмножествам исходного множества факторов- исключались из рассмотрения те факторы, оценки коэффициентов которых по методу нелинейного программирования были нулевыми (несущественными). В результате этого применять к оставшимся факторам выводы обычного регрессионного анализа следует с большой осторожностью, за исключением, возможно, того случая, когда оставляются лишь те факторы, которые будут использованы для расчета прогноза. С другой стороны, если при выполнении обычного регрессионного анализа получаются отрицательные значения оценок некоторых из коэффициентов, необходимо повторить описанную процедуру оценки сначала.

Вполне возможно, что с развитием теоретических моделей прогнозирования уровня ошибок в программных средствах потребуется применять нелинейный регрессионный анализ. В этом случае можно было бы воспользоваться методами, изложенными в работе [8].

Обсуждение метода наименьших квадратов для случая, когда вводятся ограничения, дается в работе [9], содержащей в приложении С набор программ на ФОРТРАНе для решения этой задачи ). Поскольку, однако, в нашем распоряжении подобных программ ие было, мы пользовались в своем исследовании обычными программами задач нелинейного программирования [8].



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 [ 39 ] 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования.