Что такое кодировка. Интересные факты

С самого начала существования компьютеров перед человеком встала задача — разработать язык общения с компьютером. Эту задачу решили в те времена настолько успешно, что проходили годы, а та самая первая кодировка ASCII до сих пор используется.

Что такое кодировка

Кодировка — это соответствие символов машинным кодам, а также процесс перевода информации из компьютерного представления в понятный человеку и наоборот.

Как кодируется текст

Текст в машинном виде, как и в обычной жизни состоит их алфавита, только на компьютере используется обычно алфавит в 256 символов. Каждый символ занимает один байт. Каждый символ алфавита пронумерован и имеет свой двоичный код. Коды изменяются в пределах от 00000000 до 11111111. Стандартных символов в таком алфавите 128, остальные это дополнительные и символы национальных алфавитов.

unicode

Интересные факты из истории кодировок:

1. В первой таблице ASCII было всего 128 символов и предназначалась она вовсе не для компьютеров, а для телетайпа. Но IBM создавая компьютер решила воспользоваться этой кодировкой.

2. Когда компьютеры стали распространяться по миру, то 128 символов стало не хватать и стали вводить национальные таблицы для разных стран и языков.

3. Но любопытный факт — волею судьбы кодировок стало больше чем стран и языков. Для одной кириллицы существует несколько вариантов. Это усложнило и без того непростую ситуацию и даже сейчас не все современные программы хорошо распознают кодировки и вместо текста мы порой видим набор непонятных символов.

4. Со временем человечество осознавало, что существующих кодировок недостаточно. Что бы делала программа, если бы вы писали текст на нескольких языках, даже страшно себе представить труд программистов, как бы им приходилось извращаться, чтобы сделать программу, которая воспринимала бы текст в нескольких кодировках. Также существовал ещё такой веселый китайский язык, символы которого не умещались в стандартную 8 битовую кодировку — решено было сделать Unicode.

5. Символы Unicode использует 16 бит, следовательно мы можем в таблицу разместить 65536 символов. Сейчас в Unicode используется всего порядка 49 тысяч символов — следовательно запас ещё имеется.

6. Последнее значимое изменение в кодировке Unicode – введение символа Евро в 1998 году.

Написать ответ

Я не робот.