Главная Переработка нефти и газа 5.1. Безэталонное измерение и идентификация с помощью порядковых статистик Знанию всегда предшествует предположение. В. Гумбольт Рассмотрим некоторую случайную величину X , характеризуемую плотностью распределения вероятности f (x) и интегральной функцией распределения F(x). Обозначим через E, D и а математическое ожидание, дисперсию и среднеквадратичное отклонение величины X : E = E\X \= xf (x )dx, а2 = d\x\ = E - E 2 Пусть (xi, x2,xn) - выборка объема n, образованная из n случайных реализаций X . Переставим элементы этой выборки так, чтобы они были ранжированы по величине, т. е. расположены в ряд по возрастанию. Полученную при этом упорядоченную выборку обозначим (x(i), x(2),..., x(n)). Про величину, стоящую на r-м месте в этой выборке, говорят, что она имеет ранг r. Из генеральной совокупности X можно об- Основой смелости и безошибочности поведения в повседневной жизни человека являются опыт и интуиция. Аналог этих понятий вводится с помощью термина «априорная информация». Говоря, что метод основан на привлечении априорной информации, мы просто хотим подчеркнуть, что опыт и интуиция нужны не только на этапе решения математических задач, но и на этапе их постановки. Многие задачи без привлечения априорной информации не могут быть решены; при ближайшем рассмотрении оказывается, что они попросту неправильно (некорректно) поставлены. И исправить ситуацию можно только за счет привлечения дополнительной информации априорного характера (см. по этому поводу также гл. 2). Использование априорной информации часто приводит к результатам, которые, на первый взгляд, кажутся невозможными: «ниоткуда» появляются новые данные, неустойчивые алгоритмы становятся устойчивыми, ненадежные решения - надежными. Из приведенных ниже примеров будет видно, что априорная информация может быть привнесена в задачу самыми различными способами. Так, при анализе случайных величин огромную пользу может оказать априорная информация о виде функции распределения. Наиболее полно эти сведения используются в рамках теории порядковых статистик. разовать множество таких упорядоченных выборок. Разумеется, элементы, имеющие один и тот же ранг r, в разных выборках будут разными. Иначе говоря, они являются реализациями некоторой случайной величины, которую мы будем обозначать X(r). Ранжированная выборка, таким образом, может быть представлена в виде набора случайных величин (XX(2),X(n)j. Элемент X(r) этой выборки (совокупность значений х с рангом r в выборках объема n) называется r -й порядковой статистикой, а раздел статистики, изучающей свойства упорядоченных выборок, называется теорией порядковых статистик [1-3]. Для примера, представим себе генеральную совокупность в виде кучи щебня, состоящей из камней, вес которых распределен случайным образом [1]. Выбрав наудачу n камней, отранжируем их с помощью рычажных весов. Обратим внимание на то, что в данном случае весы нужны только как компаратор (от англ. compare - «сравнивать») - устройство для попарного сравнения значений случайной величины, - поэтому гири не нужны. Предположим, что после упорядочивания выборки камни раскладываются в n ящиков, на которых написаны цифры, обозначающие соответствующие ранги. Многократно повторив эту процедуру, мы можем приступить к статистическому анализу каждого ящика. Если исходная куча щебня велика (в пределе - бесконечно велика), то отбор любого количества камней не изменяет статистические характеристики кучи щебня в целом. Тогда веса камней, содержащихся в каждом ящике, будут случайными величинами, математическое ожидание и дисперсия которых могут быть определены исходя из функции распределения генеральной совокупности. Так, если веса камней в куче щебня распределены равномерно, т. е. () a < x < b, f (x ) = j b - a 0, x < a, x > b (a и b - веса самого маленького и самого большого камня в куче), то средние и дисперсии порядковых статистик определяются выражениями [1] r\ n 1) (5.1) (n +1) (n + 2) Будем характеризовать отклонение случайных реализаций порядковой статистики X(r) от среднего Er величиной er = . Из (5.1) следу- (b - a) ет, что с увеличением объема выборок значение £r уменьшается асимпто- тически по закону - для крайних порядковых статистик (r = 1 и r = n) и по закону .- для средних рангов r 2 J . Для примера на рис. 5.1 при- л/4П ведены значения £r для разных рангов при нескольких значениях n. Как видим, даже при сравнительно небольших объемах выборок отклонение порядковых статистик от их средних значений мало. Так, при n = 23 веса камней в ящике № 23 в среднем всего лишь на 4% отличаются от среднего E23. 5.1.1. Безэталонное измерение («взвешивание без гирь») Итак, мы показали, что при достаточно больших объемах выборок «разброс» случайных реализаций порядковых статистик мал. Применительно к примеру с кучей щебня это означает, что веса камней, находящихся в r -м ящике, мало отличаются друг от друга и от математического ожидания Er. Отсюда следует поразительный вывод [1]: оказывается, мы можем определить веса камней, не имея гирь! Нужно только, чтобы мы знали функцию распределения камней по весам и имели компаратор (например, рычажные весы), с помощью которого камни могут быть отран-жированы. После этого в качестве оценки веса камня, занявшего r -е место в ряду, можно принять заранее вычисленное значение математического ожидания r -й порядковой статистики Er . При этом допускается ошибка x(r)- Er, относительная величина которой может быть сколь угодно малой. Так, для равномерного распределения при n = 1000 относительная ошибка такой оценки не превышает 2% даже в середине выборки. Если весов нет, то довольно точное ранжирование может произвести человек, сравнивая камни, находящиеся в двух его руках (это делает полученный результат еще более удивительным). Обращаясь к практике нефтегазодобычи, отметим, что некоторые опытные цеховые работники могут оценить дебит скважины без всяких замеров, просто приложив руки к выкидной арматуре. Очевидно, что при этом они, сами того не подозревая, подсознательно применяют алгоритмы порядковых статистик. Роль компаратора в данном случае вновь исполняет человек, ориентируясь на гул, создаваемый многофазным потоком, и температуру труб. Неявным образом используются также сведения о возможных пределах изменения и виде закона распределения дебита. Таким образом, пользуясь свойствами порядковых статистик, можно получить количественные оценки (иногда сколь угодно точные), не имея эталона (безэталонное измерение). 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 [ 92 ] 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 |
||