На этом шаге мы рассмотрим представление чисел в различных системах счисления.

Побитовые операторы предназначены для выполнения операций с целочисленными значениями на уровне их побитового (двоичного) представления. Перед тем как приступить к обсуждению собственно побитовых операторов, кратко рассмотрим способы кодирования чисел с помощью бинарных представлений.

Итак, с некоторой натяжкой можно полагать, что в памяти компьютера числа представлены в виде двоичного кода, в котором есть нули и единицы. Идея записи числа с помощью нулей и единиц принципиально мало чем отличается от способа записи числа посредством цифр от 0 до 9. Допустим, параметры а₀, а₁,... а_n - это некоторый набор цифр (то есть каждый такой параметр - это какая-то из цифр 0, 1 и так далее до 9). Мы можем записать с их помощью число а_nа_n-1...а₂а₁а₀. Данная запись означает буквально следующее: а_nа_n-1...а₂а₁а₀ = а₀* 10⁰+ а₁* 10¹+ а₂ * 10² + ... + а_n-1 * 10^n-1 + а_n * 10ⁿ. Например, число 123 = 3*10⁰+ 2*10¹+ 1*10². А теперь воспользуемся теми же принципами, но вместо десяти цифр (от 0 до 9) будем использовать всего две: 0 и 1. То есть теперь параметры а₀, а₁,... а_n могут принимать одно из двух значений (0 или 1). Если число записано в виде последовательности а_nа_n-1...а₂а₁а₀, то это будет означать а_nа_n-1...а₂а₁а₀ = а₀ * 2⁰ + а₁ * 2¹ + а₂ * 2²+ ... + а_n-1 * 2^n-1 + а_n * 2ⁿ. Например, если имеется двоичный код 1011011, то он соответствует десятичному числу 1011011 = 1*2⁰+ 1*2¹+ 0*2²+ 1*2³+ 1*2⁴+ 0*2⁵+ 1*2⁶ = 1 + 2 + 8 + 16 + 64 = 91. Чтобы выполнить обратное преобразование (десятичное число записать двоичным кодом), достаточно число записать в виде суммы слагаемых, являющихся степенями двойки. Например, определим двоичный код для числа 29. Имеем следующее: 29 = 16 + 8 + 4 + 1 = 2⁴ + 2³ + 2² + 2⁰ = 1*2⁰+ 1*2²+ 1*2³+ 1*2⁴ = 11101.

В приведенных формулах код из нулей и единиц - это двоичное представление числа. Все прочие числа записаны в десятичной системе.
Операции, которые выполняются с десятичными числами, можно выполнять и в двоичном представлении. Например, можно складывать числа в столбик. Для этого достаточно учесть простые правила сложения двоичных чисел:

 0 + 0 = 0,
 1 + 0 = 1,
 0 + 1 = 1,
 1 + 1 = 10.

Например, десятичное число 13 имеет двоичный код 1101, а число 9 имеет двоичный код 1001. Складываем эти двоичные коды:

   1101 
 + 1001 
 ------
  10110

Двоичный код 10110 соответствует десятичному числу 22. Так и должно быть, поскольку 13 + 9 = 22.

Все описанное выше касалось положительных чисел. Есть еще один важный вопрос. Связан он с тем, как в памяти компьютера кодируются отрицательные числа. Проблема в том, что для записи отрицательного числа на бумаге достаточно перед таким числом поставить знак "минус". Но компьютер не умеет "писать минус". Он понимает только двоичные коды. Чтобы понять принципы кодирования отрицательных чисел, проведем небольшой мысленный эксперимент.

Допустим, имеется некоторое положительное число A, для которого известен бинарный код. Попробуем выяснить, какой бинарный код должен быть у противоположного по знаку числа -A. Мы будем исходить из того, что код числа -A должен быть таким, чтобы выполнялось условие A + (-A) = 0.

Выполним побитовую инверсию: в бинарном представлении числа A все нули заменим на единицы, а единицы заменим на нули. То, что получилось, обозначим как ~A. Сложим значения A и ~A. Операцию будем выполнять на уровне бинарного кода. Учтем также, что в компьютере для записи числа выделяется определенное количество битов. Обозначим это количество битов как n. Несложно догадаться, что при вычислении суммы A + (~A) мы будем складывать два битовых кода, каждый длиной в n битов. И при складывании битов, находящихся на одинаковых позициях, один бит будет единичный, а другой нулевой. Поэтому в результате вычисления суммы A + (~A) получим бинарный код, который состоит из n битов, и каждый бит равен единице. К тому, что получилось, прибавим единицу - то есть вычислим сумму A + (~A) + 1. Но если к коду из n единиц добавить единицу, то получим бинарный код, в котором самый левый бит единичный, а после него следует n нулей. И вот здесь нужно вспомнить, что речь идет о компьютере, который запоминает только n битов. Поэтому старший единичный бит теряется (для него в памяти просто нет места), и остается код из n нулей. А это код числа 0. Таким образом, компьютер вычисляет указанную сумму как A + (~A) + 1 = 0. Следовательно, код отрицательного числа -A должен совпадать с кодом выражения ~А + 1. Отсюда мы получаем правило записи двоичного кода отрицательного числа.

Берем код соответствующего положительного числа и выполняем побитовую инверсию: меняем единицы на нули и нули на единицы.
К полученному бинарному коду прибавляем единицу. Это и есть код отрицательного числа.

Аналогичным образом выполняется и обратное преобразование, когда по коду отрицательного числа необходимо определить это число в десятичной системе счисления.

В бинарном коде отрицательного числа выполняем побитовую инверсию.
К полученному коду прибавляем единицу.
Переводим полученный код в десятичную систему.
Дописываем перед полученным числом знак "минус". Это и есть искомое число.

Все эти операции для нас имеют скорее теоретический интерес. Но есть важное практическое последствие. Если взять код положительного числа, то старший бит в таком числе будет нулевым. А вот в коде отрицательного числа старший бит единичный. Таким образом, самый старший бит в бинарном коде числа определяет, положительное это число или отрицательное: у положительных чисел старший бит нулевой, у отрицательных чисел - единичный. Поэтому старший бит обычно называют знаковым битом (он определяет знак числа)

В прикладном плане, кроме двоичной, достаточно популярными являются восьмеричная и шестнадцатеричная системы счисления. В восьмеричной системе число записывается с помощью цифр от 0 до 7 включительно. Если в восьмеричной системе число записано в виде последовательности а_nа_n-1...а₂а₁а₀ (параметры а₀, а₁,... а_n - это цифры от 0 до 7), то в десятичной системе счисления это число определяется так: а_nа_n-1...а₂а₁а₀ = а₀* 8⁰+ а₁* 8¹+ а₂* 8²+ ... + а_n-1* 8^n-1+ а_n* 8ⁿ.
В шестнадцатеричной системе счисления число кодируется с помощью шестнадцати символов: это цифры от 0 до 9 и буквы от А до F, которые обозначают десятичные числа от 10 до 15. Для шестнадцатеричной системы справедлива такая формула перевода в десятичную систему: а_nа_n-1...а₂а₁а₀ = а₀*16⁰+ а₁*16¹+ а₂*16²+ ... +а_n-1*16^n-1+а_n*16ⁿ. В данном случае параметры а₀, а₁,... а_n - это цифры от 0 до 9 и буквы от А до F (вместо букв при вычислении суммы подставляются числа от 10 до 15).

На следующем шаге мы закончим изучение этого вопроса.

Предыдущий шаг Содержание Следующий шаг