Анализ эмпирических данных. Публикации по электрике, материалам и мебели

Меню
Главная страница

Главная страница Анализ эмпирических данных

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 [ 77 ] 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

ших из п элементов множества Е. Прн этом выборка осуществлялась случайным образом в соответствии с распределением вероятностей р,-. Однако в определенных условиях более эффективными могут оказаться другие методы, в частности методы, предусматривающие разбиение множества Е на подмножества S/ и использующие выражения для дисперсии и доверительных границ результатов измерения надежности, полученных на определенном наборе входных данных.

6.3.1. Теория выборочного метода

Предположим, что при каждом / из множества S,-выбирается и/ массивов данных. Предположим также, что такая выборка является независимой; точнее, на выбор любой точки в S/ не влияет, был ли произведен выбор в нем некоторой другой точки ), а вероятности выбора всех точек одинаковы. Единственная особенность производимой выборки состоит в том, что в ней различаются точки, принадлежащие подмножествам S/ и S/. Таким образом, мв: имеем дело с выборками, которые называются простыми биномиальными выборками. В выборках указанного типа вероятность формирования последовательности из и,-гочек множества 5/ определяется величиной (Р )/(Р) /~ Р , где fj представляет собой число

точек в сделанной выборке, принадлежащих S {т. е. точек, с которыми связаны отказы программных средств).

Возможен и иной метод выборки. Например, можно осуществлять выборку до тех пор, пока не будет набрано определенное количество точек подмножества S/, для которого случайным является не параметр , а параметр п/.

Оценка величины Ri. Вообще говоря, выборка мо жет затрагивать не все подмножества S/. Если имеет место именно такая ситуация, то определенная ниже оценка R будет являться смещенной. Пусть Т - сово-

*) Множество S/ включает так много точек, что можно пренебречь .влиянием на вероятность выбора некоторой точки наличия или отсутствия замещения точек, выбранных ранее. -

купность индексов подмножеств S/ заданного разбиения множества Е, которые присутствуют в выборках, а Т - совокупность всех остальных индексов / пе вошедших в Т. Тогда

R = l-E ( / /) Р/. (6.1)

Ожидаемое значение R, обозначаемое через M(R), определятся как

M(R)==i-i:(p;7P,)p =

= 1-ZP7>i-Spr=R. (6.2)

где в последней сумме суммирование проводится по всем /==1, 2, К. Таким образом, когда выборка является неполной, значение R будет смещено вверх. Заметим, что можно было бы устранить это смешение путем включения в выборку (без изменения ее объема п = Z 1 = Z / l по одному массиву данных

из каждого подмножества S/ для / s f.

Оценка точности измерения R. Одним из показателей точности измерения случайной величины является ее дисперсия V ( ). Поскольку V(/y)=nyPyP /Pj, то можно показать, что

ir(R)==Zp;p;7v (6-3)

Оценка R в случае неполной выборки оказывается смещенной, поэтому более подходяш.ей оценкой точности измерения надежности является среднеквадратичная ошибка, определяемая как М{ф.-~RY].

Имеем

М [(R - R)] = Е + (Е Р/J. (6.4)

Таким образом, среднеквадратичная ошибка ни при каких условиях пе может быть меньше величины Р/у, даже при больших значениях щ. Данное

Для существования выписанной выше несмещенной оценки величины Vt(R), очевидно, необходимо, чтобы при каждом / было 2.

Минимизация дисперсии. Дисперсия величины

R = i-Z№) Р/

для полной выборки определяется соотиошеннСхМ

Р-Р

V(R) = 2 -. (6.30

. /

Определим, при каких значениях параметров щ величина V(R) будет иметь наименьшее возможное

) Через ( ) обозначается численная оценка величины, стоящей внутри скобок.

СВОЙСТВО делает величину M{{U - R) в каком-то смысле мерой полноты выборки. Однако, к сожалению, не существует способа вычисления этой величины, так как, хотя и имеется информация о значениях Р/ и Р для / е Т, ничего не известно {не считая грубых границ изменения) о значениях Ргдля / е Т. Молено показать, что

Отсюда, используя грубые границы изменения для значений Р/ (/ е Т), можно получить совокупность приближенных численных оценок (снизу и сверху) величины среднеквадратичной ошибки. Соответствующие оценки имеют следующий вид ):

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 [ 77 ] 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105