Си — универсальный язык программирования. Он тесно связан с системой UNIX, так как был разработан в этой системе, которая как и большинство программ, работающих в ней, написаны на Си. Однако язык не привязан жестко к какой-то одной операционной системе или машине. Хотя он и назван «языком системного программирования», поскольку удобен для написания компиляторов и операционных систем, оказалось, что на нем столь же хорошо писать большие программы другого профиля.
Многие важные идеи Си взяты из языка BCPL, автором которого является Мартин Ричардс. Влияние BCPL на Си было косвенным — через язык B, разработанный Кеном Томпсоном в 1970 г. для первой системы UNIX, реализованной на PDP-7.
BCPL и B — «безтиповые» языки. В отличие от них Си обеспечивает разнообразие типов данных. Базовыми типами являются литеры, а также целые и плавающие числа различных размеров. Кроме того, имеется возможность получать целую иерархию выводимых типов данных из указателей, массивов, структур и объединений. Выражения формируются из операторов и операндов. Любое выражение, включая присваивание и вызов функции, может быть инструкцией. Указатели обеспечивают машинно-независимую адресную арифметику.
В Си имеются основные управляющие конструкции, используемые в хорошо
структурированных программах: составная инструкция ({...}
), ветвление по
условию (if-else
), выбор одной альтернативы из многих (switch
), циклы с
проверкой наверху (while
, for
) и с проверкой внизу (do
), а также средство
прерывания цикла (break
).
В качестве результата функции могут возвращать значения базовых типов, структур, объединений и указателей. Любая функция допускает рекурсивное обращение к себе. Как правило, локальные переменные функции — «автоматические», т.е. они создаются заново при каждом обращении к ней. Определения функций нельзя вкладывать друг в друга, но декларации переменных разрешается строить в блочно-структурной манере. Функции программы на Си могут храниться в отдельных исходных файлах и компилироваться независимо. Переменные по отношению к функции могут быть внутренними и внешними. Последние могут быть доступными в пределах одного исходного файла или всей программы.
На этапе препроцессирования выполняется макроподстановка в текст программы, включение других исходных файлов и условная компиляция.
Си — язык сравнительно «низкого уровня». Однако это вовсе не умаляет его достоинств, просто Си имеет дело с темп же объектами, что и большинство компьютеров, т.е. с литерами, числами и адресами. С ними можно оперировать при помощи арифметических и логических операций, существующих в реальной машине.
В Си нет прямых операций над составными объектами, такими, как стринги,
множества, списки и массивы. В нем нет операций, которые бы манипулировали с
целыми массивами или стрингами, хотя структуры разрешается копировать целиком
как единые объекты. В языке нет каких-либо средств распределения памяти,
помимо возможности определения статических переменных и стекового механизма
при выделении места для локальных переменных функций. Нет в нем «heap–памяти»
(«памяти-кучи», куда обычно «сваливают» разнородную информацию) и «сборщика
мусора». Наконец, в самом Си нет средств ввода-вывода, инструкций READ
(читать) и WRITE
(писать) и каких-либо методов доступа к файлам. Все это —
механизмы высокого уровня, которые в Си должны быть обеспечены исключительно
с помощью явно вызываемых функций. Большинство реализованных Си-систем
содержат в себе разумный стандартный набор этих функций.
В продолжение сказанного следует отметить, что Си предоставляет средства лишь последовательного управления ходом вычислений: механизм ветвления по условиям, циклы, составные инструкции, подпрограммы — и не содержит средств мультипрограммирования, параллельных процессов, синхронизации и организации сопрограмм.
Отсутствие некоторых из перечисленных средств может показаться серьезным недостатком («выходит, чтобы сравнить две цепочки литер, нужно обращаться к функции?»). Однако компактность языка имеет реальные выгоды. Поскольку Си относительно мал, то и описание его кратко, и овладеть им можно быстро. Программист может реально рассчитывать на то, что он будет знать, понимать и на практике регулярно пользоваться всеми возможностями языка.
В течение многих лет единственным определением языка Си было первое издание книги «Язык программирования Си». В 1983 г. Институтом американских национальных стандартов (ANSI) учреждается комитет для выработки современного исчерпывающего определения языка Си. Результатом его работы явился стандарт для Си («ANSI-C»), выпущенный в 1988 г. Большинство положений стандарта уже учтено в современных компиляторах.
Стандарт базируется на первоначальном справочном руководстве. По сравнению с последним язык изменился относительно мало. Одной из целей стандарта было обеспечить, чтобы в большинстве случаев существующие программы оставались правильными или вызывали предупреждающие сообщения компиляторов об изменении поведения.
Для большинства программистов самое важное изменение — это новый синтаксис описания и определения функций. Описание функции может теперь включать и описание ее аргументов. В соответствии с этим изменился и синтаксис определения функции. Дополнительная информация значительно облегчает компилятору выявление ошибок, связанных с несогласованностью аргументов; по нашему мнению, это очень полезное добавление к языку.
Следует также отметить ряд небольших изменений. Присваивание структур и перечислимый тип, которые уже некоторое время широко используются, в языке узаконены. Вычисления с плавающей точкой теперь допускаются и с одинарной точностью. Уточнены свойства арифметики, особенно для беззнаковых типов. Усовершенствован препроцессор. Большинство программистов эти изменения затронут очень слабо.
Второй значительный вклад стандарта — это определение библиотеки, поставляемой вместе с Си-компилятором, в которой специфицируются функции доступа к возможностям операционной системы (например, чтения-записи файлов), форматного ввода-вывода, динамического запроса памяти, манипуляций со стрингами (цепочками литер) и т.д. Набор стандартных головных файлов обеспечивает единообразный доступ к описаниям функций и типов данных. Гарантируется, что программы, использующие эту библиотеку при взаимодействии с операционной системой, будут работать также и на других машинах. Большинство программ, составляющих библиотеку, созданы по образу и подобию «стандартной библиотеки ввода-вывода» системы UNIX. Эта библиотека описана в первом издании книги и широко используется в других системах. И здесь программисты не заметят существенных различий.
Так как типы данных и управляющих структур языка Си поддерживаются командами большинства существующих машин, административная система обеспечения независимого запуска и счета программ очень мала. Обращения к библиотечным функциям пишет сам программист (не компилятор), поэтому при желании их можно легко заменить на другие. Почти все программы, написанные на Си, если они не касаются каких-либо деталей, скрытых в операционной системе, переносимы на другие машины.
Си соответствует аппаратным возможностям многих машин, однако он не привязан к архитектуре какой-либо конкретной машины. Проявляя некоторую дисциплину, можно легко писать переносимые программы, т.е. программы, которые без каких-либо изменений могут работать на разных машинах. Стандарт предоставляет возможность для явного описания переносимости с помощью набора констант, отражающих характеристики машины, на которой программа будет работать.
Си не является «строго типизированным» языком, но в процессе его развития контроль за типами был усилен. В первой версии Си разрешался бесконтрольный обмен указателей и целых, что вызывало большие нарекания, но это уже давным-давно запрещено. Согласно стандарту теперь требуется явное описание или явное указание преобразования, что уже и реализовано в хороших компиляторах. Новый вид описания функций — еще один шаг в этом направлении. Компилятор теперь предупреждает о большей части ошибок в типах и автоматически не выполняет преобразования данных несовместимых типов. Однако главной философией Си остается то, что программисты сами знают, что делают; язык лишь требует явного указания об их намерениях.
Си, как и другие языки программирования, не свободен от недостатков. Уровень старшинства некоторых операторов не является общепринятым, некоторые синтаксические конструкции могли бы быть лучше. Тем не менее, как оказалось, Си — чрезвычайно эффективный и выразительный язык, пригодный для широкого класса задач.
Книга имеет следующую структуру. Гл. 1 — это обзор основных средств языка Си.
Ее назначение побудить читателя по возможности быстрее приступить к
программированию, так как мы убеждены, что единственный способ изучить новый
язык — это писать на нем программы. Эта часть книги предполагает наличие
знаний по основным элементам программирования. Никаких пояснений того, что
такое компьютер, компиляция или что означает выражение вида n = n+1
не
дается. Хотя мы и пытались, там, где это возможно, показать полезные приемы
программирования, эта книга не призвана быть справочником ни по работе со
структурами данных, ни по алгоритмам, когда оказывалось необходимым выбрать,
на что сделать ударение, мы предпочитали сконцентрировать внимание на языке.
В гл. 2–6 различные средства языка обсуждаются более подробно и несколько
более формально, чем в гл. 1; при этом по-прежнему упор делается на примеры,
являющиеся законченными программами, а не изолированными фрагментами. Гл. 2
знакомит с базовыми типами данных, с операторами и выражениями. В гл. 3
рассматриваются средства управления последовательностью вычислений: if-else
,
switch
, while
, for
и т.д. В гл. 4 речь идет о функциях и структуре программы
(внешних переменных, правилах видимости, делении программы на несколько
исходных файлов и т.д.), а также о препроцессоре. В гл. 5 обсуждаются
указатели и адресная арифметика. Гл. 6 посвящена структурам и объединениям.
В гл. 7 описана стандартная библиотека, обеспечивающая общий интерфейс с операционной системой. Эта библиотека узаконена в качестве стандарта ANSI, иначе говоря, она должна быть представлена на всех машинах, где существует Си, благодаря чему программы, использующие ввод-вывод и другие возможности операционной системы, без каких-либо изменений можно переносить с одной машины на другую.
Гл. 8 содержит описание интерфейса между программами на Си и операционной системой UNIX, в частности описание ввода-вывода, файловой системы и распределения памяти. Хотя некоторые разделы этой главы отражают специфику системы UNIX, программисты, пользующиеся другими системами, все же найдут в них много полезных сведений, включая определенный взгляд на то, как реализуется одна из версий стандартной библиотеки, и некоторые предложения по переносимости программ.
Приложение A является справочником по языку. Строгое определение синтаксиса и семантики языка Си содержится в официальном документе стандарта ANSI. Последний, однако, более всего подходит разработчикам компилятора. Наш справочник определяет язык более сжато, не прибегая к законодательному стилю, которым пользуется стандарт. Приложение B — сводка по содержимому стандартной библиотеки и предназначена скорее пользователям, чем реализаторам. В приложении C приводится краткий перечень отличий от первой версии языка. В неясных случаях, однако, окончательным судьей по языку остается стандарт и компилятор, которым вы пользуетесь.