STAT(1G) STAT(1G) НАЗВАНИЕ stat - статистическая обработка информации, полезная для графических команд СИНТАКСИС |имя_узла [опция ...] [файл ...] ОПИСАНИЕ Stat - набор команд (узлов), которые могут быть связаны в так называемую статистическую сеть при помощи sh(1). Все эти функции располагаются в каталоге /usr/bin/graf [см. graphics(1G)]. Единицей обмена данными между узла- ми сети служат вектора, то есть последовательности чи- сел. Ниже, в зависимости от контекста, они иногда назы- ваются также выборками, а составляющие их числа - наб- людениями. Числа представляются в форме: [знак](цифры)(.цифры)[e[знак]цифры] и интерпретируются обычным образом. Скобки здесь не входят в представление числа, а используются для выде- ления полей. Никакое поле этого представления само по себе не является обязательным, но по крайней мере одно из полей, заключенных в круглые скобки, должно при- сутствовать. Любой символ, приходящий в узел и не явля- ющийся частью числа, воспринимается как разделитель. Узлы сети stat разбиваются на четыре класса: Преобразователи Осуществляют покомпонентную обработку векторов, переводя элементы входного вектора в элементы вы- ходного вектора. Операторы Вычисляют различные статистики вектора (то есть скалярные или векторные функции векторного аргу мента). Форматизаторы Осуществляют преобразования форматов. Генераторы Порождают вектора по заданным правилам. Ниже описывается синтаксис каждого из узлов stat. Опци- ям должен предшествовать символ -. Вообще говоря, опция задается в виде символа, за которым следует значение, например c5. Это интерпретируется как c := 5 (c присва ивается значение 5). Для указания ожидаемых типов зна- чений использованы следующие обозначения: c Символ. i Целое число. f Число с плавающей точкой или целое число. файл Имя файла. цепочка Цепочка символов (символы, интерпретируемые shell'ом, должны быть экранированы). Опции без значений называются флагами. В описаниях синтаксиса узлов специальные упоминания о файлах опущены, так как все узлы, кроме генераторов, предполагают их наличие и читают из этих файлов исход- ные данные. Если файл не указан, данные читаются со стандартного ввода. Опция -c задает количество колонок при выводе. По умол чанию ее значение равно 5. Преобразователи abs [-ci] - абсолютная величина af [-ci t v выражение] - арифметические действия t - поместить в результирующий файл заголовок, считан- ный со стандартного ввода, v - подробные пояснения, вы- ражение - арифметическое выражение, в котором участвуют имена файлов, константы, знаки операций и круглые скоб- ки (имена файлов не должны содержать символов /). ceil [-ci] - округление до ближайшего целого с избытком cusum [-ci] - нарастающий итог Сумма текущей и всех предшествующих компонент. exp [-ci] - экспонента floor [-ci] - округление до ближайшего целого с недостатком gamma [-ci] - гамма-функция list [-ci dцепочка] - перечисление элементов вектора d - допустимые наряду с пробелом разделители числовых полей. Поле, в котором присутствуют не входящие в сос- тав числа символы, игнорируется. log [-ci bf] - логарифм b - основание. mod [-ci mf] - остаток от деления нацело m - делитель. pair [-ci Fфайл xi] - попарное (или более) объединение элементов F - файл, содержащий основной вектор, x - размер груп- пы: вывод группы из i последовательных элементов основ- ного вектора чередуется с выводом одного элемента вход- ного вектора. power [-ci pf] - возведение в степень p - показатель степени. root [-ci rf] - извлечение корня r - показатель радикала. round [-ci pi si] - округление до указанного разряда p - количество оставляемых позиций после десятичной точки, s - количество оставляемых значащих цифр. sin [-ci] - синус subset [-af bf ci Fфайл ii lf nl np pf si ti] - формирование подмножества a - по превышению указываемого уровня, b - по (строго- му) непревышению уровня, F - файл, содержащий номера элементов, i - шаг по номерам (используется совместно с s и t), l - по несовпадению с указываемым значением, nl - элементы с номерами, содержащимися в файле, не вклю- чаются в подмножество, np - в подмножество включаются только элементы с номерами, содержащимися в файле, p по совпадению с указываемым значением, s - начальный номер, t - конечный номер. Операторы bucket [-ai ci Fфайл hf if lf ni] - группировка предварительно отсортирова a - среднее количество наблюдений, приходящееся на час- тичный интервал, F - файл, содержащий границы частичных интервалов, h - верхняя граница полного интервала, i - длина частичного интервала, l - нижняя граница полно- го интервала, n - количество частичных интервалов. cor [-Fфайл] - коэффициент корреляции F - файл, содержащий основной вектор (вычисляются коэф- фициенты корреляции основного вектора с каждым из вход- ных). Все вектора должны иметь одинаковое количество элементов. hilo [- h l o ox oy]- нахождение максимума и минимума h - только максимум, l - только минимум, o - выдача ре- зультата в формате опций (например, "l-2.3,h5.1,"), ox - выдача результата в формате опций с подцепленным сим- волом x (например, "xl-2.3,"), oy - то же с символом y (например, "yl-2.3,yh5.1,"). lreg [-Fфайл i o s] - линейная регрессия F - файл, содержащий вектор значений "независимой" пе- ременной (входной вектор должен содержать значения "за- висимой" переменной; оба вектора должны иметь одинако- вое количество элементов), i - вычисление только отрез- ка, отсекаемого на оси ординат, o - выдача результата в формате опций для узла siline (например, "i3,s1.2,"), s - вычисление только наклона линии регрессии. point [-ff ni pf s] - квантиль эмпирической функции распределения f - вероятность, определяющая квантиль, n - порядковый номер вариационного ряда выборки, p - вероятность в процентах, определяющая квантиль, s - выборка предвари тельно отсортирована (то есть совпадает со своим вариа ционным рядом). mean [-ff ni pf] - среднее арифметическое, взятое с весом f - вес в долях, n - вес в целых числах, p - вес в про- центах. prod - внутреннее произведение qsort [-ci] - быстрая сортировка rank - размерность вектора total - общая сумма var - несмещенная оценка дисперсии [с делителем (n-1)] Форматизаторы bar [-a b f g ri wi xf xa yf ya ylf yhf ] - построение столбцовой диаграмм a - подавить вывод осей, b - утолщенные линии, f - по- давить вывод рамки, g - подавить вывод масштабной сет- ки, r - размер области определения (то есть количество столбцов), w - ширина столбца в процентах, x - начало по оси x, xa - подавить вывод метки оси x, y - начало по оси y, ya - подавить вывод метки оси y, yl - нижняя граница по оси y, yh - верхняя граница по оси y. Данные округляются до целых. hist [-a b f g ri xf xa yf ya ylf yhf ] - построение гистограммы a - подавить вывод осей, b - утолщенные линии, f - по- давить вывод рамки, g - подавить вывод масштабной сет- ки, r - размер области определения (то есть количество столбцов), x - начало по оси x, xa - подавить вывод метки оси x, y - начало по оси y, ya - подавить вывод метки оси y, yl - нижняя граница по оси y, yh - верхняя граница по оси y. label [-b c Fфайл h p ri x xu y yr] - маркировка осей в файле GPS-формата b - ввод данных столбцовой диаграммы, c - сохранить большие/малые буквы в названиях (по умолчанию осуществ- ляется переход к большим), F - маркируемый файл, h - ввод данных гистограммы, p - ввод данных графика, r - поворот осей, x - ось x, xu - ось x вверху, y - ось y, yr - ось y справа. pie [-b o p pni ppi ri v xi yi] - построение круговой диаграммы b - утолщенные линии, o - значения отображаются вне круга, p - значения заданы в процентах, pn - значения вычисляются как процент от заданной величины, pp - в качестве значения отображать процент, r - количество секторов, v - значения не отображать, x - x-координата центра, y - y-координата центра. В отличие от других узлов, вводимые данные представляют собой строки вида: [< i e f cc >] значение [метка] i - игнорировать (не изображать) сектор, e - выдвинуть сектор, f - сплошная закраска сектора, c - цвет сектора c=(b - черный, r - красный, g - зеленый, u - синий). plot [-a b cцепочка d f Fфайл g m ri xf xa xif xhf xlf xni xt yf ya yif yh a - подавить вывод осей, b - утолщенные линии, c - сим волы, используемые при построении графика, d - разрыв- ный график, f - подавить вывод рамки, F - файл, содер- жащий x-вектор, g - подавить вывод масштабной сетки, m - маркировать точки, r - количество точек, x - начало по оси x, xa - подавить вывод метки оси x, xi - длина интервала по оси x, xh - верхняя граница по оси x, xl - нижняя граница по оси x, xn - число отсчетов по оси x, xt - подавить вывод названия оси x, y - начало по оси y, ya - подавить вывод метки оси y, yi - длина ин- тервала по оси y, yh - верхняя граница по оси y, yl - нижняя граница по оси y, yn - число отсчетов по оси y, yt - подавить вывод названия оси y. title [-b c lцепочка vцепочка uцепочка] - внесение заголовка в файл, содер b - жирный шрифт заголовка, c - сохранить большие/малые буквы в заголовке (по умолчанию осуществляется переход к большим), l - заголовок внизу, u - заголовок вверху, v - заголовок вектора. Генераторы gas [-ci if ni sf tf] - генерация арифметической прогрессии i - разность, n - количество элементов, s - начальное значение, t - верхняя граница. prime [-ci hi li ni] - генерация простых чисел h - верхняя граница, l - нижняя граница, n - количество элементов. rand [-ci hf lf mf ni si] - генерация случайной последовательности h - верхняя граница, l - нижняя граница, m - множитель, n - количество элементов, s - инициализирующее значение. siline [-ci if ni sf ] - генерация ординат прямой по заданному наклону и о i - отрезок, отсекаемый на оси ординат, n - количество целых неотрицательных значений абсциссы, для которых вычисляются ординаты, s - наклон прямой. СМ. ТАКЖЕ graphics(1G). gps(4) в Справочнике программиста. ОГРАНИЧЕНИЯ Некоторые узлы имеют ограничение на размер входного вектора. СЮРПРИЗЫ Узлы abs, exp, gamma, log, power, root, sin работают неправильно. Узел af с опцией -t работает в соответствии с описанием только в том случае, когда стандартный ввод осуществля- ется из файла (вектора), куда заголовок был помещен ко- мандой title -v'...'. Опция -v никакого влияния на ра- боту узла af не оказывает. Узлы ceil, floor фактически осуществляют вычисление дробной части. Узел mod фактически осуществляет вычисление функции |f(x) = (x mod m) / m. Узел cor фактически осуществляет вычисление суммы |(x[i]-x) * (y[i]-y) по i, то есть полуфабрикат коэффициента ковариации. Узел mean работает нормально только в отсутствие опций. Узел point работает нормально только с опцией -n. Узел prod фактически осуществляет вычисление произведе- ния всех компонент вектора. Узел prime фактически генерирует последовательные не четные числа.