Термин |
Английский термин |
Разъяснение |
кодовая таблица |
code table 1. |
См. кодировка. |
таблица символов |
code table 1. |
См. кодировка. |
кодировка |
codepage |
Порядок соответствия литер символов целым числам. |
длина кодировки |
codepage length |
Разрядность целого числа, используемого для представления литер. Используются однобайтные, двухбайтные кодировки и кодировки переменной длины. |
EBCDIC-код |
EBCDIC |
Кодировка латинских символов, десятичных цифр, знаков препинания, пробельных и специальных символов на основе 7-ми битного кода. Не имеет сплошной кодировки символов. Данная кодировка применялась в мэйнфреймах IBM-360/370 и советских ЭВМ серии ЕС. В настоящее время безнадежно устарела. |
десятичные цифры |
decimal digits |
Цифры, применяемые в десятичной системе счисления. Содержат в себе литеры от 0 до 9. |
латинский алфавит |
Latin alphabet |
Прописные и строчные буквы от A до Z (всего 52 символа). Латинский алфавит используется в латинском, английском, французском и других "западных" языках. |
знаки препинания |
punctuation marks |
Знаки, используемые в пунктуации, для разделения предложений и их частей. Кроме "обычных" знаков ",", ".", и других к ним относятся кавычки, апострофы, английские сокращения "&" и "@", а также знак подчеркивания и некоторые другие символы. |
пробельные символы |
spacing symbols (characters) |
Символы, используемые для разделения слов в предложениях. К ним относят, кроме пробела, знаки горизонтальной и вертикальной табуляции, "возврат каретки", "перенос строки", "прогон страницы", а также нулевой символ. |
специальные символы |
special characters |
Символы, не относящиеся к другим категориям и используемые для управления устройствами. См. метасимволы. |
сплошная нумерация |
continuous numeration |
Кодировка имеет сплошную нумерацию литер алфавита, если последовательность литер пронумерована "подряд", соседними числами без разрывов. Сплошную нумерацию символов латиницы имеют все кодировки, кроме EBCDIC. Сплошная нумерация кириллических символов реализована в кодировках ANSI cp 1251, USSR GOST, Unicode и некоторых других. |
алгоритм сравнения строк |
compare string algorithm |
Алгоритм, в котором строки сравниваются в лексикографическом порядке, и результат сравнения (больше, меньше, совпадают) передается оператору условия. Алгоритм сравнения строк используется для сортировки строк. |
сортировка строк |
sorting of the screen |
Расположение строк по возрастанию или по убыванию в лексикографическом порядке. В алгоритме сортировке используется алгоритмы сравнения строк. |
лексикографический порядок |
dictionary order |
Порядок слов по алфавиту, в том виде, в котором он представлен в ЭВМ. При этом среди слов, имеющих одинаковое начало, большим будет считаться то, которое содержит больше символов. |
семи битные кодировки |
seven bit codepages |
Кодировки, для представления символов в которых используется семь младших бит байта (из восьми). При этом старший бит используется для проверки правильности передачи символов. |
кириллические символы |
Cyrillic character |
Литеры русского алфавита и алфавитов некоторых других славянских народов, созданные просветителями Кириллом и Мефодием при переводе библии с греческого на славянские языки. Кириллические символы входят в алфавиты всех народов России. В компьютере эти символы кодируются восьми битными кодировками и разновидностями Unicode. |
ASCII ("аски") код |
ASCII |
7-ми битный код для представления основных знаков препинания, цифр и букв латинского алфавита. Имеет "сплошную" нумерацию букв латинского алфавита. В настоящее время является основой для других кодировок. |
UNIX ("ЮНИКС") |
UNIX |
Операционная система персональных компьютеров и мощных ЭВМ, разработанная в корпорации AT&T в 1972 г. Первоначально весь Интернет был доступен только для машин, работающих под операционной системой UNIX. В СССР эта операционная систем была известна под именем: "Демос". |
VAX ("вакс") |
VAX |
Знаменитый компьютер корпорации Digital Equipment, породивший в 70-х - 80-х годах XX века множество своих "клонов" в виде СМ ЭВМ в СССР и странах СЭВ. Имел собственную операционную систему. В настоящее время его производство и техническая поддержка прекратились. |
MS-DOS (ДОС) |
MS-DOS |
Операционная система персональных компьютеров 80-х - 90-х годов XX века, основанных на процессорах Intel. |
Linux ("Линукс") |
Linux |
Одна из реализаций операционной системы UNIX, использующей открытый код и открытое программное обеспечение. Ее "ядро" разработано в начале 90-х годов XX века Линусом Торвальдсом (Финляндия). |
кириллическая кодировка |
Cyrillic codepage |
Кодировка, содержащая кириллические символы. К кириллическим кодировкам относят: OEM 866, ANSI cp 1251, USSR GOST, KOI8-R, Unicode, UTF-8 и др. |
OEM 866 |
OEM 866 |
Кириллическая кодировка MS-DOS. По-другому называется: "альтернативная русская кодировка". |
ANSI cp 1251 |
ANSI cp 1251 |
Кириллическая кодировка MS Windows, основанная на кодировке ASCII и имеющая длину 8 бит. Имеют сплошную нумерацию для латинских литер и частично сплошную - для литер русского алфавита. |
кодировка ГОСТ СССР |
USSR GOST |
8-ми битная кодировка со сплошной нумерацией кириллических символов. Большого распространения не получила. |
транскрипция 1. |
transcription 1. |
Запись кириллических символов вместо латинских букв или наоборот, учитывая их произношение. Например, латинской "P" соответствует буква "П", "C" - "Ц", "S" - "С", "V" - "В" и т.д. Транскрипция использовалась при создании кодировок KOI8-R (KOI8-U), и при составлении раскладки английских литер на "русской" клавиатуре. |
КОИ-8 |
KOI8-R |
8-ми битная кириллическая кодировка, используемая в UNIX и ее клонах. В настоящее время является устаревшей. В этой кодировке латинские символы с номерами 128 - 255 были заменены на кириллические символы в той же транскрипции. При этом кириллические символы упорядочены не по алфавиту: вот первые из семи последовательных кириллических символов в этой кодировке: "Ю, А, Б, Ц, Д, Е, Ф, …". |
юникод |
Unicode |
Кодировка длиной 2 байта для представления всех символов всех национальных алфавитов. Имеет в два раза больший объем, чем основанные на ASCII кодировках. В настоящее время является стандартом для кодирования символов национальных алфавитов. |
UTF-8 |
UTF-8 |
Кодировка переменной длины, хранящая символы латиницы в кодировке ASCII, а все символы национальных алфавитов - в юникоде. Часто позволяет более "компактно" представлять текст. В настоящее время является стандартом для кодирования символов в операционных системах. |
символы псевдографики |
pseudo graphics character |
Символы в восьми битных кодировках OEM, предназначенные для рисования линий таблиц, "заполнений" и стрелок. Эти символы находятся в кодовой таблице под номерами с 176 по 223, и используются только в MS-DOS и совместимых с нею операционных системах. |
знакогенератор |
characters' decoder |
Интегральная схема в мониторе, способная в текстовом режиме его работы преобразовывать символы из кодовых страниц OEM (MS-DOS) в видимые литеры на экране дисплея. В графическом режиме работы дисплея знакогенератор не задействован. |
многоразрядные кодировки |
multidigit codepages |
К многоразрядным кодировкам относят кодировки UTF-8, Unicode и другие, имеющие переменное число разрядов или число разрядов, большее восьми. Многоразрядные кодировки помогают кодировать символы всех существующих национальных алфавитов. |
символьный тип данных |
symbol (character) data type |
Целый тип данных, используемый для хранения в нем символов в одной из кодировок. Различают примитивные символьные данные и специальные символьные типы данных. Они отличаются в "машинной" реализацией типов в языках программирования. |
примитивный символьный тип данных |
primitive character data type |
Символьный тип данных, реализованный в виде целочисленной ячейки памяти для хранения одного символа. Для хранения строки символов будет использован массив этих данных. Обычно этот тип данных обозначается как 'char'. |
строка |
string |
Последовательность символов в одной из кодировок, оканчивающаяся терминальным символом. Обычно строка представляется в виде массива примитивных типов данных. Ориентировочно максимальная длина строки лежит в пределах: ~ 255 - 2047 символов. |
терминальный символ строки |
terminal character of a string |
Символ, указывающий на окончание строки символов. Все символы, расположенные после терминального символа, игнорируются. В Си-подобных языках терминальный символ - ноль ('\0', или '0x00'). |
максимальный индекс строки |
maximal string index |
Заданные программистом или компьютерными системами ограничения на количество символов в строке для примитивных символьных данных. Изменяется от 255 (Бейсик) до 64K (Си), но на практике не советуется устанавливать его большим 2000 символов. |
максимальная длина массива |
ultimate array length |
Общее количество элементов в массиве. Это значение является максимально возможным значением индекса массива. Длина массива может быть постоянной (фиксированной для статичного массива), а может увеличиваться и уменьшаться (для так называемых динамических массивов, не рассматривающихся в данных лекциях). |
фиксирование 1. |
fixation |
Явное указание числа элементов у статичного массива при его объявлении, которое также задает максимальное значение его индекса. Это число указывается либо целой константой, либо именованной макроподстановкой (на языке Си). |
статичный массив |
static array |
Массив с постоянным числом его элементов, который объявляется вначале блока операторов и под которое в программе выделяется место в оперативной памяти в виде "сплошной" последовательности ячеек. В отличие от динамических массивов максимальное число его элементов не изменяется. |
нулевая константа |
zero constant |
Символ с кодом ASCII 0 (0x00), имеющий в Си-подобных языках обозначение '\0'. Именно этим символом заканчивается любая строка примитивных символьных данных. |
создание (массива) |
allocating (of an array) |
Выделение места в оперативной памяти для размещения элементов массива, и присвоение указателю на этот массив адреса этой ячейки памяти на время выполнения программы (run-time). После завершения работы с массивом выделенную под него область памяти необходимо освободить перед завершением работы программы. |
объявление (массива) |
declaration (of an array) |
Выделение места в оперативной памяти для размещения элементов массива и, возможно, его инициализации в процессе компиляции программы. "Объявленную" память освобождать не нужно. |
инициализация (массива) |
initialization (of an array) |
Присвоение конкретных значений элементам массива при его объявлении или сразу после его создания. Обычно символьный массив инициализируется нулевыми символами специальными функциями. |
нулевой символ |
zero character |
См. нулевая константа. |
освобождение памяти |
release of a memory |
Отмена выделения места в оперативной памяти места для элементов массива и присвоение связанному с ним указателю значения "NULL". После освобождения памяти при попытке обратиться к элементу массива возникает ошибка "отказ в доступе" (access denied). |
копия изменяемой строки |
copy of changed string |
Точная копия элементов изменяемого массива, сделанная с него для манипуляции данными. Ее делают для реализации "джентльменского соглашения", согласно которому исходные символьные данные не меняются при манипуляциях со строками. |