[:ru]
2.1. Кодирование информации
Для общения друг с другом люди используют естественный язык, например белорусский или русский. В основе естественного языка лежит алфавит, представляющий собой систему графических знаков для передачи звуков устной речи. Алфавит естественного языка является универсальным кодом любой письменной культуры. При разговоре этот код передается звуками, при письме — буквами.
Кроме естественных, человек часто использует искусственно созданные языки со своими особыми кодами: язык математических или химических формул, ноты и др.
Код — совокупность условных знаков, каждому из которых присваивается определенное значение (пример 2.1 и пример 2.2).
Процесс записи или преобразования информации в соответствии с правилами, заданными некоторым кодом, называют кодированием. Процесс, обратный кодированию, называют декодированием.
Кодировать и передавать информацию можно различными способами: устно, письменно, жестами и др.
Компьютер может обрабатывать числовую, текстовую, графическую и звуковую информацию только в цифровом формате. Цифровой формат в компьютере представлен в виде двоичного кода.
Двоичный код — способ кодирования, в котором каждый разряд принимает одно из двух возможных значений, обычно обозначаемых цифрами 0 и 1. Разряд в этом случае называется двоичным разрядом.
Такой способ кодирования связан с тем, что наиболее просто реализуются технические устройства, обладающие двумя устойчивыми состояниями: включено / выключено, соединено / разъединено и др.
Таким образом, для кодирования числовой информации в компьютере вместо известной всем десятичной системы счисления используется двоичная, основанная на двоичном коде.
Кодирование текстовой (символьной) информации в компьютере выполняется с помощью специальных кодовых таблиц, в которых каждому символу ставится в соответствие определенная последовательность из нулей и единиц (пример 2.3).
2.2. Единицы измерения объема информации
В своей деятельности человек постоянно применяет различные единицы измерения. Например, для измерения времени используются секунды, минуты, часы, для измерения расстояния — метры, километры, а для измерения температуры — градусы и т. д. Измерения проводят с помощью измерительных приборов (пример 2.4).
Для определения количества информации существуют свои единицы измерения. Минимальное количество информации, для кодирования которой достаточно одного двоичного разряда, называют битом (bit).
Слово «бит» произошло от двух английских слов — binary (двоичный) и digit (знак). Бит является минимальной единицей, выражающей количество информации. При этом он может принимать только одно из двух значений — 0 или 1. Для удобства введена более крупная единица измерения информации — байт.
Байт — единица измерения количества информации, состоящая из восьми последовательных и взаимосвязанных битов. 1 байт = 23 бит = 8 бит (пример 2.5). Для обозначения большего объема информации используются другие единицы измерения: 1 Кбайт (килобайт) = 1 024 байт; 1 Мбайт (мегабайт) = 1 048 576 байт; 1 Гбайт (гигабайт) = 1 073 741 824 байт; 1 Тбайт (терабайт) = 1 099 511 627 776 байт. |
Значения данных единиц измерения информации для удобства кодирования связаны со степенью числа 2 (пример 2.6).
В этих единицах измеряются количество (объем) оперативной или внешней памяти компьютера, размеры файлов. В примере 2.7 показано, каким образом выполняется перевод одних единиц измерения информации в другие.
Кодирование информации использовалось с глубокой древности для хранения и передачи информации. Примером кодирования могут послужить образцы шумерской клинописи:
Широко известен шифр Юлия Цезаря — кодирование, применявшееся для записи и передачи секретных сообщений. Каждый символ в тексте заменяется символом, находящимся на некотором постоянном расстоянии левее или правее него в алфавите. Например, при кодировании информации с помощью букв русского алфавита путем сдвига вправо на 3 буква А была бы заменена на Г, буква Б станет Д и т. д. |
Пример 2.1. Сегодня широко применяются штрих-коды на различных товарах. Вот так, например, выглядит штрих-код сгущенного молока:
Пример 2.2. С появлением смартфонов стали распространяться QR-коды. Они позволяют моментально заносить в свой телефон текстовую информацию, добавлять контакты в адресную книгу, переходить по web-ссылкам, отправлять SMS-сообщения и т. д. Перед вами QR-код со ссылкой на статью в Wikipedia о QR-кодах. Пример 2.3. Кодирование английского алфавита на компьютере: Пример 2.4. Пример 2.5. Соотношение между битом и байтом Пример 2.6. Соотношение единиц измерения информации. Пример 2.7. |
[:by]
2.1. Кадзіраванне інфармацыі
Для зносін людзі выкарыстоўваюць натуральную мову, напрыклад беларускую або рускую. У аснове натуральнай мовы ляжыць алфавіт — сістэма графічных знакаў для перадачы гукаў вуснага маўлення. Алфавіт натуральнай мовы з’яўляецца ўніверсальным кодам любой пісьмовай культуры.
Акрамя натуральных, чалавек выкарыстоўвае штучна створаныя мовы са сваімі спецыяльнымі кодамі: мову матэматычных ці хімічных формул, ноты і інш.
Код — сукупнасць умоўных знакаў, кожнаму з якіх прысвойваецца пэўнае значэнне (прыклады 2.1 і 2.2).
Працэс запісу ці пераўтварэння інфармацыі ў адпаведнасці з правіламі, зададзенымі некаторым кодам, называюць кадзіраваннем. Працэс, адваротны кадзіраванню, называюць дэкадзіраваннем.
Кадзіраваць і перадаваць інфармацыю можна рознымі спосабамі: вусна, пісьмова, жэстамі і інш. Камп’ютар можа апрацоўваць лікавую, тэкставую, графічную і гукавую інфармацыю толькі ў лічбавым фармаце, які ў камп’ютары прадстаўлены ў выглядзе двайковага кода.
Двайковы код — спосаб кадзіравання, у якім кожны разрад прымае адно з двух магчымых значэнняў, што звычайна абазначаюцца лічбамі 0 і 1. Разрад у гэтым выпадку называецца двайковым разрадам.
Такі спосаб кадзіравання звязаны з тым, што прасцей за ўсё рэалізуюцца тэхнічныя ўстройствы, якія валодаюць двума ўстойлівымі станамі: уключана/выключана, злучана/раз’яднана і інш.
Для кадзіравання лікавай інфармацыі ў камп’ютары замест дзесятковай сістэмы лічэння выкарыстоўваецца двайковая, заснаваная на двайковым кодзе.
Кадзіраванне тэкставай інфармацыі ў камп’ютары выконваецца пры дапамозе спецыяльных кодавых табліц, дзе кожнаму знаку ставіцца ў адпаведнасць пэўная паслядоўнасць з нулёў і адзінак (прыклад 2.3).
2.2. Адзінкі вымярэння аб’ёму інфармацыі
Чалавек ужывае розныя адзінкі вымярэння. Так, для вымярэння часу выкарыстоўваюцца секунды, мінуты, гадзіны, для вымярэння адлегласці — метры, кіламетры і інш. Вымярэнні праводзяць з дапамогай вымяральных прыбораў (прыклад 2.4).
Для вызначэння колькасці інфармацыі ёсць свае адзінкі вымярэння. Мінімальную колькасць інфармацыі, для кадзіравання якой дастаткова аднаго двайковага разраду, называюць бітам (bit).
Слова «біт» утварылася ад англійскіх слоў binary (двайковы) і digit (знак). Біт — мінімальная адзінка, якая паказвае колькасць інфармацыі. Ён можа прымаць адно з двух значэнняў — 0 або 1. Для зручнасці ўведзена больш буйная адзінка вымярэння інфармацыі — байт.
Байт — адзінка вымярэння колькасці інфармацыі, якая складаецца з васьмі паслядоўных і ўзаемазлучаных бітаў. 1 байт = 23 біт = 8 біт (прыклад 2.5). Для абазначэння большага аб’ёму інфармацыі выкарыстоўваюцца іншыя адзінкі вымярэння: 1 Кбайт (кілабайт) = 1 024 байты; 1 Мбайт (мегабайт) = 1 048 576 байт; 1 Гбайт (гігабайт) = 1 073 741 824 байты; 1 Тбайт (тэрабайт) = 1 099 511 627 776 байт. |
Значэнні дадзеных адзінак вымярэння інфармацыі для зручнасці кадзіравання звязаны са ступенню ліку 2 (прыклад 2.6).
У гэтых адзінках вымяраюцца колькасць (аб’ём) аператыўнай ці знешняй памяці камп’ютара, памеры файлаў. У прыкладзе 2.7 паказана, якім чынам выконваецца перавод адных адзінак вымярэння інфармацыі ў іншыя.
Кадзіраванне інфармацыі выкарыстоўвалася са старажытнасці. Шырока вядомы шыфр Юлія Цэзара, які ўжываўся для запісу сакрэтных паведамленняў. Кожны сімвал у тэксце замяняўся сімвалам, што знаходзіўся на некаторай пастаяннай адлегласці лявей ці правей за яго ў алфавіце.
Напрыклад, пры кадзіраванні інфармацыі з дапамогай літар рускага алфавіта шляхам зруху ўправа на 3 літара «А» была б заменена на «Г», літара «Б» стала б «Д» і г. д. |
Прыклад 2.1. Сёння шырока ўжываюцца штрых-коды на розных таварах. Перад вамі штрых-код згушчанага малака:
Прыклад 2.2. Са з’яўленнем смартфонаў пачалі распаўсюджвацца QR-коды. Яны дазваляюць хутка заносіць у тэлефон тэкставую інфармацыю, дадаваць кантакты ў адрасную кнігу, пераходзіць па web-спасылках, адпраўляць SMS-паведамленні і г. д. Вось, напрыклад, QR-код са спасылкай на артыкул у Wikipedia пра QR-коды: Прыклад 2.3. Кадзіраванне некаторых літар англійскага алфавіта на камп’ютары.
Прыклад 2.4. Прыклад 2.5. Суадносіны паміж бітам і байтам. Прыклад 2.6. Суадносіны адзінак вымярэння інфармацыі. Прыклад 2.7. |
[:]