Глава 3. Управление

Порядок, в котором выполняются вычисления, определяется инструкциями управления. Мы уже встречались с наиболее распространенными управляющими конструкциями такого рода в предыдущих примерах; здесь мы завершим их список и более точно определим рассмотренные ранее.

3.1. Инструкции и блоки

Выражение, скажем x = 0, или i++, или printf(...), становится инструкцией, если в конце его поставить точку с запятой, как, например, в записи

x = 0;
i++;
printf(...);

В Си точка с запятой является заключающей литерой инструкции, а не разделителем, как в языке Паскаль.

Фигурные скобки { и } используются для объединения описаний и инструкций в составную инструкцию, или блок, чтобы с точки зрения синтаксиса эта новая конструкция воспринималась как одна инструкция. Фигурные скобки, обрамляющие группу инструкций, образующих тело функции, — это один пример; второй пример — это скобки, объединяющие инструкции, помещенные после if, else, while или for. (Переменные могут быть описаны внутри любого блока, об этом разговор пойдет в гл. 4.) После правой закрывающей фигурной скобки в конце блока точка с запятой не ставится.

3.2. Конструкция `if-else`

Инструкция if-else используется для принятия решения. Вот ее синтаксис:

if (выражение)
    инструкция1
else
    инструкция2

причем else-часть может быть, а может и отсутствовать. Сначала вычисляется выражение, и, если оно истинно (т.е. отлично от нуля), выполняется инструкция1. Если выражение ложно (т.е. его значение равно нулю) и существует else-часть, то выполняется инструкция2.

Так как if просто проверяет числовое значение выражения, условие иногда можно записывать в сокращенном виде. Так, запись

if (выражение)

короче, чем

if (выражение != 0)

Иногда такие сокращения естественны и ясны, в других случаях, наоборот, затрудняют понимание программы.

Отсутствие в одной из вложенных друг в друга if-конструкций else-части может привести к неоднозначному толкованию записи. Эту неоднозначность разрешают тем, что else связывают с ближайшим if, у которого нет своего else. Например, в

if (n > 0)
    if (a > b)
        z = a;
    else
        z = b;

else относится к внутреннему if, что мы и показали с помощью отступов. Если нам требуется иная интерпретация, необходимо должным образом расставить фигурные скобки:

if (n > 0) {
    if (a > b)
        z = a;
}
else
    z = b;

Ниже приводится пример ситуации, когда неоднозначность особенно опасна:

if (n >= 0)
    for (i = 0; i < n; i++)
        if (s[i] > 0) {
            printf("...");
            return i;
        }
else        /* НЕВЕРНО */
    printf("ошибка -- отрицательное n\n");

С помощью отступов мы недвусмысленно показали, что нам нужно, однако компилятор не воспримет эту информацию и отнесет else к внутреннему if. Такого рода ошибки особенно тяжело искать. Здесь уместен следующий совет: вложенные if обрамляйте фигурными скобками. Кстати, обратите внимание на точку с запятой после z = a в

if (a > b)
    z = a;
else
    z = b;

Здесь она обязательна, поскольку по правилам грамматики за if должна следовать инструкция, а выражение-инструкция типа z = a; всегда заканчивается точкой с запятой.

3.3. Конструкция `else-if`

Конструкция

if (выражение)
    инструкция
else if (выражение)
    инструкция
else if (выражение)
    инструкция
else if (выражение)
    инструкция
else
    инструкция

встречается так часто, что о ней стоит поговорить особо. Приведенная последовательность инструкций if — самый общий способ описания многоступенчатого принятия решения. Выражения вычисляются по порядку; как только встречается выражение со значением «истина», выполняется соответствующая ему инструкция; на этом последовательность проверок завершается. Здесь под словом инструкция имеется в виду либо одна инструкция, либо группа инструкций в фигурных скобках.

Последняя else-часть срабатывает, если все предыдущие условия не выполняются. Иногда в последней части не требуется производить никаких действий, в этом случае фрагмент

else
    инструкция

можно опустить или использовать для фиксации ошибочной («невозможной») ситуации.

В качестве иллюстрации трехпутевого ветвления рассмотрим функцию бинарного поиска значения x в массиве v. Предполагается, что элементы v упорядочены по возрастанию. Функция выдает положение (число в пределах от 0 до n-1) x в v, если оно там встречается, и -1, если его нет.

При бинарном поиске значение x сначала сравнивается с элементом, занимающим серединное положение в массиве v. Если x меньше, чем это значение, то областью поиска становится «верхняя» половина массива v, в противном случае — «нижняя». В любом случае следующий шаг — это сравнение с серединным элементом отобранной половины. Процесс «уполовинивания» диапазона продолжается до тех пор, пока либо будет найдено значение, либо станет пустым диапазон. Запишем функцию бинарного поиска:

/* binsearch: найти x в v[0] <= v[i] <= ... <= v[n-1] */
int binsearch(int x, int v[], int n)
{
    int low, high, mid;

    low = 0;
    high = n - 1;
    while (low <= high) {
        mid =(low + high) / 2;
        if (x < v[mid])
            high = mid - 1;
        else if (x > v[mid])
            low = mid + 1;
        else    /* x найден */
            return mid;
    }

    return -1;  /* x не найден */
}

Основное действие, выполняемое на каждом шаге поиска, — сравнение значения x (меньше, больше или равно) с элементом v[mid]; это сравнение естественно поручить конструкции else-if.

Упражнение 3.1.

В нашей программе бинарного поиска внутри цикла осуществляются две проверки, хотя могла быть только одна (при увеличении числа проверок вне цикла). Напишите программу, предусмотрев в ней одну проверку внутри цикла. Оцените разницу во времени счета.

3.4. Переключатель

Инструкция switch используется для выбора одного из многих путей. Она проверяет, совпадает ли значение выражения с одним из значений, входящих в некоторое множество целых констант, и выполняет соответствующую этому значению ветвь программы:

switch (выражение) {
    case конст_выр: инструкции
    case конст_выр: инструкции
    default: инструкции
}

Каждая ветвь case помечена одной или несколькими целочисленными константами или же константными выражениями. Вычисления начинаются с той ветви case, в которой константа совпадает со значением выражения. Константы всех ветвей case должны отличаться друг от друга. Если выяснилось, что ни одна из констант не подходит, то выполняется ветвь, помеченная словом default, если таковая имеется, в противном случае ничего не делается. Ветви case и default можно располагать в любом порядке.

В гл. 1 мы написали программу, подсчитывающую число вхождений в текст каждой цифры, пробельных литер (пробелов, табуляций и новых_строк) и всех остальных литер. В ней мы использовали последовательность if...else if...else. Теперь приведем вариант этой программы с переключателем:

#include <stdio.h>
/* подсчет цифр, пробелов и прочих литер */
main()
{
    int c, i, nwhite, nother, ndigit[10];

    nwhite = nother = 0;
    for (i = 0; i < 10; i++)
        ndigit[i] = 0;
    while ((c = getchar()) != EOF) {
        switch (c){
            case '0': case '1': case '2': case '3': case '4':
            case '5': case '6': case '7': case '8': case '9':
                ndigit[c-'0']++;
                break;
            case ' ': case '\n': case '\t':
                nwhite++;
                break;
            default:
                nother++;
                break;
        }
    }
    printf("цифры =");
    for (i = 0; i < 10; i++)
        printf(" %d", ndigit[i]);
    printf(", пробелы = %d, прочие = %d\n", nwhite, nother);

    return 0;
}

Инструкция break вызывает немедленный выход из переключателя. Поскольку выбор ветви case реализуется как переход на метку, то после выполнения одной ветви case, если ничего не предпринять, программа провалится вниз на следующую ветвь. Инструкции break и return — наиболее распространенные средства выхода из переключателя. Инструкция break используется также для принудительного выхода из циклов while, for и do-while (мы еще поговорим об этом чуть позже).

«Сквозное» выполнение ветвей case вызывает смешанные чувства. С одной стороны, это хорошо, поскольку позволяет несколько ветвей case объединить в одну, как мы и поступили с цифрами в нашем примере. Но с другой — это означает, что в конце почти каждой ветви придется ставить break, чтобы избежать перехода к следующей. Последовательный проход по ветвям — вещь ненадежная, он чреват ошибками, особенно при изменении программы. За исключением случая с несколькими метками для одного вычисления, старайтесь по возможности редко пользоваться сквозным проходом, но если уж вы его применяете, обязательно комментируйте эти особые места.

Добрый вам совет: даже в конце последней ветви (после default в нашем примере) помещайте инструкцию break, хотя с точки зрения логики в ней нет необходимости. Но эта маленькая предосторожность спасет вас, когда однажды вам потребуется добавить в конец еще одну ветвь case.

Упражнение 3.2.

Напишите функцию escape(s, t), которая при копировании текста из t в s преобразует литеры типа новая_строка и табуляция в «видимые последовательности литер» (типа \n и \t). Используйте инструкцию switch. Напишите функцию, выполняющую обратное преобразование эскейп-последовательностей в настоящие литеры.

3.5. Циклы `while` и `for`

Мы уже встречались с циклами while и for. В цикле

while (выражение)
    инструкция

вычисляется выражение. Если его значение отлично от нуля, то выполняется инструкция, и вычисление выражения повторяется. Этот цикл продолжается до тех пор, пока выражение не станет равным нулю, после чего вычисления возобновятся с точки, расположенной сразу за инструкцией.

Инструкция for

for (выр1; выр2; выр3)
    инструкция

эквивалентна конструкции

выр1;
while (выр2) {
    инструкция
    выр3;
}

если не считать отличий в поведении инструкции continue, речь о которой пойдет в разд. 3.7.

С точки зрения грамматики три компоненты цикла for представляют собой произвольные выражения, но чаще выр1 и выр3 — это присваивания или вызовы функций, а выр2 — выражение отношения. Любое из этих трех выражений может отсутствовать, но точку с запятой опускать нельзя. При отсутствии выр1 или выр3 считается, что их просто нет в конструкции цикла; при отсутствии выр2 полагается, что его значение как бы всегда истинно. Например,

for (;;) {
    ...
}

есть «бесконечный» цикл, выполнение которого, вероятно, прерывается каким-то другим способом, например с помощью инструкций break или return.

Какой цикл выбрать: while или for — это дело вкуса. Так, в

while ((c = getchar()) == || c == '\n' || c == '\t')
    ;   /* обойти пробельные литеры */

нет ни инициализации, ни пересчета параметра, поэтому здесь больше подходит while.

Там, где есть простая инициализация и пошаговое увеличение значения некоторой переменной, больше подходит цикл for, так как в этом цикле организующая его часть сосредоточена в начале записи. Например, начало цикла, обрабатывающего первые n элементов массива, имеет следующий вид:

for (i = 0; i < n; i++)
    ...

Это похоже на DO-циклы в Фортране и for-циклы в Паскале. Сходство, однако, не очень точное, так как в Си индекс и его предельное значение могут изменяться внутри цикла, и значение индекса i после выхода из цикла всегда определено.

Поскольку три компоненты цикла могут быть произвольными выражениями, организация for-циклов не ограничивается только случаем арифметической прогрессии. Однако включать в заголовок цикла вычисления, не имеющие отношения к инициализации и инкрементации, считается плохим стилем. Заголовок лучше оставить только для операций управления циклом.

В качестве более внушительного примера приведем другую версию программы atoi, выполняющей преобразование стринга в его числовой эквивалент. Это более общая версия по сравнению с рассмотренной в гл. 2, в том смысле, что она игнорирует левые пробельные литеры (если они есть) и должным образом реагирует на знаки + и -, которые могут стоять перед цепочкой цифр. (В гл. 4 будет рассмотрен вариант atof, который осуществляет подобное преобразование для чисел с плавающей точкой.)

Структура программы отражает вид вводимой информации:

проигнорировать пробельные литеры, если они есть
получить знак, если он есть
взять целую часть и преобразовать ее

На каждом шаге выполняется определенная часть работы и четко фиксируется ее результат, который затем используется на следующем шаге. Обработка данных заканчивается на первой же литере, которая не может быть частью числа.

#include <ctype.h>

/* atoi: преобразование s в целое число; версия 2 */
int atoi(char s[])
{
    int i, n, sign;
    for (i = 0; isspace(s[i]); i++)
        ;   /* проигнорировать пробельные литеры */
    sign = (s[i] == '-') ? -1 : 1;
    if (s[i] == '+' || s[i] == '-')     /* пропуск знака */
        i++;
    for (n = 0; isdigit(s[i]); i++)
        n = 10 * n + (s[i] - '0');

    return sign * n;
}

Заметим, что в стандартной библиотеке имеется более совершенная функция преобразования стринга в длинное целое — strtol (см. разд. 5 приложения B).

Преимущества, которые дает централизация управления циклом, становятся еще более очевидными, когда несколько циклов вложены друг в друга. Проиллюстрируем их на примере сортировки массива целых чисел методом Шелла, предложенным им в 1959 г. Основная идея этого алгоритма в том, что на ранних стадиях сравниваются далеко отстоящие друг от друга, а не соседние элементы, как в обычных перестановочных сортировках. Это приводит к быстрому устранению массовой неупорядоченности, благодаря чему на более поздней стадии остается меньше работы. Интервал между сравниваемыми элементами постепенно уменьшается до единицы, и в этот момент сортировка сводится к обычным перестановкам соседних элементов. Программа shellsort имеет следующий вид:

/* shellsort: сортируются v[0]...v[n-1] в возр. порядке */
void shellsort(int v[], int n)
{
    int gap, i, j, temp;

    for (gap = n / 2; gap > 0; gap /= 2)
        for (i = gap; i < n; i++)
            for (j = i-gap; j >= 0 && v[j] > v[j+gap]; j -= gap) {
                temp = v[j];
                v[j] = v[j+gap];
                v[j+gap] = temp;
            }
}

Здесь использованы три вложенных друг в друга цикла. Внешний управляет интервалом gap между сравниваемыми элементами, сокращая его с помощью деления пополам от n/2 до нуля. Средний цикл перебирает элементы. Внутренний — сравнивает каждую пару элементов, отстоящих друг от друга на расстоянии gap, и осуществляет перестановку элементов в неупорядоченных парах. Так как gap обязательно будет сведен к единице, все элементы в конечном счете будут упорядочены. Обратите внимание на то, что универсальность цикла for позволяет сделать внешний цикл по форме похожим на другие, хотя он и не является циклом типа арифметической прогрессии.

Последний оператор из числа операторов Си «,» чаще всего используют в инструкции for. Пара выражений, разделенных запятой, вычисляется слева направо. Типом и значением результата являются тип и значение правого выражения, что позволяет в инструкции for в каждой из трех компонент иметь по несколько выражений, например вести два индекса параллельно. Продемонстрируем это на примере функции reverse(s), которая «переворачивает» стринг s, оставляя результат в том же стринге s:

#include <string.h>

/* reverse: переворачивает стринг s (результат в s) */
void reverse(char s[])
{
    int c, i, j;

    for (i = 0, j = strlen(s) - 1; i < j; i++, j--) {
        c = s[i];
        s[i] = s[j];
        s[j] = c;
    }
}

Запятые, разделяющие аргументы функции, переменные в описаниях и т.д. не являются операторами — запятыми и не обеспечивают вычислений слева направо.

Запятыми как операторами следует пользоваться умеренно. Более всего они уместны в конструкциях, которые тесно связаны друг с другом (как в for-цикле программы reverse), а также в макросах, в которых многоступенчатые вычисления должны быть выражены одним выражением. Запятой — оператором в программе reverse можно было бы воспользоваться и при обмене литерами в проверяемых парах элементов стринга, мысля этот обмен как одну отдельную операцию:

for (i = 0, j = strlen(s)-1; i < j; i++, j--)
    c = s[i], s[i] = s[j], s[j] = c;

Упражнение 3.3.

Напишите функцию expand(s1, s2), восстанавливающую сокращенную запись типа a-z в стринге s1 до эквивалентной полной записи abc...xyz в s2. В s1 допускаются буквы (прописные и строчные) и цифры. Следует уметь справляться со случаями типа a-b-c, a-z0-9 и -a-b. Считайте знак - в начале или в конце s1 обычной литерой минус.

3.6. Цикл `do-while`

Как мы говорили в гл. 1, в циклах while и for проверка условия окончания цикла выполняется наверху. В Си имеется еще один вид цикла, do-while, в котором эта проверка в отличие от while и for делается внизу после каждого прохождения тела цикла, т.е. после того, как тело выполнится по крайней мере один раз.

Цикл do-while имеет следующий синтаксис:

do
    инструкция
while (выражение);

Сначала выполняется инструкция, затем вычисляется выражение. Если оно истинно, то инструкция выполняется снова и т.д. Когда выражение становится ложным, цикл заканчивает работу. Цикл do-while эквивалентен циклу repeat-until в Паскале с той лишь разницей, что в первом случае указывается условие продолжения цикла, а во втором — условие его окончания.

Опыт показывает, что цикл do-while гораздо реже используется, чем while и for. Тем не менее потребность в нем время от времени возникает, как, например, в функции itoa (обратной по отношению к atoi), преобразующей число в стринг литер. Выполнить такое преобразование оказалось несколько более сложным делом, чем ожидалось, поскольку простые алгоритмы генерируют цифры в обратном порядке. Мы остановились на варианте, в котором сначала формируется цепочка цифр, а затем она реверсируется.

/* itoa: преобразование n в стринг s */
void itoa(int n, char s[])
{
    int i, sign;

    if ((sign = n) < 0)     /* сохраняем знак */
        n = -n;             /* делаем n положительным */
    i = 0;
    do {    /* генерируем цифры в обратном порядке */
        s[i++] = n % 10 + '0';  /* следующая цифра */
    } while ((n /= 10) > 0);    /* исключить ее */
    if (sign < 0)
        s[i++] = '-';
    s[i] = '\0';

    reverse(s);
}

Конструкция do-while здесь необходима или по крайней мере удобна, поскольку в s посылается хотя бы одна литера, даже если n равно нулю. В теле цикла одну инструкцию мы выделили фигурными скобками (хотя они и избыточны), чтобы неискушенный читатель не принял по ошибке слово while за начало цикла while.

Упражнение 3.4.

При условии, что для представления чисел используется дополнительный код, наша версия itoa не справляется с самым большим по модулю отрицательным числом, значение которого равняется -2^n-1 (где n — размер слова). Объясните, чем это вызвано. Модифицируйте программу таким образом, чтобы она давала правильное значение указанного числа независимо от машины, на которой выполняется.

Упражнение 3.5.

Напишите функцию itob(n, s, b), которая переводит целое n в стринг s, представляющий число по основанию b. В частности, itob(n, s, 16) помещает в s текст числа n в шестнадцатиричном виде.

Упражнение 3.6.

Напишите версию itoa с дополнительным третьим аргументом, задающим минимальную ширину поля. При необходимости преобразованное число слева должно дополняться пробелами.

3.7. Инструкции `break` и `continue`

Иногда бывает удобно выйти из цикла не по результату проверки, осуществляемой в начале или в конце цикла, а каким-то другим способом. Такую возможность для циклов for, while и do-while, а также для переключателя switch предоставляет инструкция break. Эта инструкция вызывает немедленный выход из самого внутреннего из объемлющих ее циклов или переключателей.

Следующая функция, trim, удаляет из стринга хвостовые литеры пробелов, табуляций и новых_строк; break используется в ней для выхода из цикла по первой обнаруженной справа литере, отличной от названных.

/* trim: удаляет хвостовые пробелы, таб. и нов_строки */
int trim(char s[])
{
    int n;

    for (n = strlen(s) - 1; n >= 0; n--)
        if (s[n] != ' ' && s[n] != '\t' && s[n] != '\n')
            break;
    s[n+1] = '\0';

    return n;
}

С помощью функции strlen можно получить длину стринга. Цикл for просматривает его в обратном порядке, начиная с конца, до тех пор, пока не встретится литера, отличная от пробела, табуляции и новой_строки. Цикл прерывается, как только такая литера обнаружится или n станет отрицательным (т.е. вся строка будет просмотрена). Убедитесь, что функция ведет себя правильно и в случаях, когда стринг пуст или состоит только из пробельных литер.

Инструкция continue в чем-то похожа на break, но применяется гораздо реже. Она вынуждает ближайший объемлющий ее цикл (for, while или do-while) начать следующий шаг итерации. Для while и do-while это означает, немедленный переход к проверке условия, а для for — к приращению шага. Инструкцию continue можно применять только к циклам, но не к switch. Будучи помещенной внутрь switch, расположенного в цикле, она вызовет переход к следующей итерации этого цикла.

Вот фрагмент программы, обрабатывающий только неотрицательные элементы массива a (отрицательные — пропускаются).

for (i = 0; i < n; i++) {
    if (a[i] < 0)   /* пропуск отрицательных элементов */
        continue;
    ... /* обработка положительных элементов */
}

К инструкции continue часто прибегают в тех случаях, когда оставшаяся часть цикла сложна, а, замена условия в нем на противоположное и введение еще одного уровня приводит к слишком большому числу уровней вложенности.

3.8. Инструкция `goto` и метки

В Си имеются порицаемая многими инструкция goto и метки для перехода на них. Строго говоря, в этой инструкции нет никакой необходимости, и на практике почти всегда можно легко без нее обойтись. До сих пор в нашей книге мы не использовали goto.

Однако существуют случаи, в которых goto может пригодиться. Наиболее типична ситуация, когда необходимо прервать обработку в некоторой глубоко вложенной структуре и выйти сразу из двух или большего числа вложенных циклов. Инструкция break здесь не поможет, так как она осуществляет выход только из самого внутреннего цикла. В качестве примера рассмотрим следующую конструкцию:

for (...)
    for (...) {
        ...
        if (disaster)   /* если бедствие */
            goto error; /* уйти на ошибку */
    }
error:                  /* обработка ошибки */
    ликвидировать беспорядок

Такая организация программы удобна, если подпрограмма обработки ошибочной ситуации не тривиальна и ошибка может встретиться в нескольких местах.

Метка имеет вид обычного имени переменной, за которым следует двоеточие. На метку можно перейти с помощью goto из любого места данной функции, т.е. метка действительна на протяжении всей функции.

В качестве еще одного примера рассмотрим такую задачу: определить, есть ли в массивах a и b совпадающие элементы. Один из возможных вариантов ее реализации имеет следующий вид:

for (i = 0; i < n; i++)
    for (j = 0; j < m; j++)
        if (a[i] == b[j])
            goto found;
    /* нет одинаковых элементов */
    ...
found:
    /* обнаружено совпадение: a[i] == b[j] */
    ...

Программу нахождения совпадающих элементов можно написать и без goto, правда, заплатив за это дополнительными проверками и еще одной переменной:

found = 0;
for (i = 0; i < n && !found; i++)
    for (j = 0; j < m && !found; j++)
        if (a[i] == b[j])
            found = 1;
if (found)
    /* обнаружено совпадение: a[i-1] == b[j-1] */
    ...
else
    /* нет одинаковых элементов */
    ...

За исключением редких случаев, подобных только что приведенным, программы с привлечением goto, как правило, труднее для понимания и сопровождения, чем программы, решающие те же задачи без goto. Хотя мы и не догматики, все же думается, что к goto следует прибегать крайне редко, если использовать вообще.