logo
Методичка_Delphi_Ч1

Символьные типы данных

Символьные типы предназначены для представления символов. В Object Pascal можно использовать две разновидности символов:

В наших лабораторных работах мы будем использовать только тип Char. Фрагмент таблицы кодировки символов представлен ниже, в таблице 6.2.

Таблица 6.2 – Кодировка некоторых символов ANSI

Символ

Код

Двоичное представление

16-ричное представление

Отсутствие символа

0

0000 0000

$00

Пробел

32

0010 0000

$20

!

33

0010 0001

$21

0

48

0011 0000

$30

1

49

0011 0001

$31

2

50

0011 0010

$32

3

51

0011 0011

$33

A

65

0100 0001

$41

B

66

0100 0010

$42

C

67

0100 0011

$43

a

97

0110 0001

$61

b

98

0110 0010

$62

А

192

11000000

$C0

Б

193

11000001

$C1

а

224

1110 0000

$E0

б

225

1110 0001

$E1

я

255

1111 1111

$FF

Обратите внимание на порядок расположения символов в таблице. Такой порядок позволяет упорядочивать слова и идентификаторы в алфавитном порядке с помощью кода символа.

Символьные константы можно записывать разными способами. Для большинства символов можно использовать изображение этого символа, заключенное в одинарные кавычки. Например, ‘1’, ‘z’, ‘*’. Специальные символы удобно представлять с помощью их кода, в виде целого числа, которому предшествует знак #. Например, #0, #8, #13. Кроме того, любой символ может быть получен с помощью функции chr(), которой в качестве аргумента передается код символа. Например, chr(65) возвращает прописную латинскую букву ‘A’, а chr(255) – строчную букву ‘я’ кириллицы.

Обратное преобразование, то есть преобразование символа в код можно выполнить с помощью функции ord(). Например, ord(‘0’) вернет 48.

При вводе отдельных символов из компонентов класса TEdit, необходимо иметь в виду, что свойство text этих компонентов возвращает не символ, а строку символов. Чтобы получить отдельный символ этой строки следует использовать порядковый номер символа в строке, записывая его в квадратных скобках после имени строки символов. Например, Edit1.text[1].

Для символов применимы все операции сравнения. При этом сравниваются коды символов. Поэтому ‘б’ > ’Б’, и ‘а’ кириллицы больше, чем латинское ’a’.

Группы символов, которые соответствуют буквам, расположены таким образом, чтобы упростить преобразование больших букв в маленькие и наоборот. Разница в кодировке больших и маленьких букв и латинского и русского алфавита равна $20 или 32. Следовательно, чтобы превратить строчную букву в прописную, достаточно из ее кода вычесть 32. Число 32 можно и не помнить, так как его можно получить в результате вычитания кода прописной буквы из кода соответствующей строчной. Например, ord(z) – ord(Z), или оrd(a) – ord(A).

Особенность кодировки цифр состоит в том, что младший полубайт символа цифры соответствует ее числовому значению в двоичном представлении. Это позволяет легко преобразовывать код символа цифр в соответствующие числа с помощью логической операции and и маски $0F. Например, в результате операции ord(‘5’) and $0F получится число 5.

Для преобразования символов цифр в соответствующие числа можно использовать тот факт, что символы цифр следуют в таблице кодировки друг за другом в порядке возрастания значений этих цифр.

Ниже приведено два варианта такого преобразования.

Первый вариант использует разницу в кодах нуля и выбранной цифры, которая соответствует числовому значению символа цифры

var c : char; n : integer;

n := ord(c)- 48; // что равносильно ord(c) –ord(‘0’);

Второй вариант такого преобразования использует операцию and $0F с маской $0F.

const maska = $0F; // константа равная двоичному числу 00001111

var c : char; n : integer;

n := ord(c) and maska; // маска удаляет старший полубайт