§ 2. Уяўленне інфармацыі ў камп’ютары

2.1. Кадзіраванне інфармацыі

Для зносін людзі выкарыстоўваюць натуральную мову, напрыклад беларускую або рускую. У аснове натуральнай мовы ляжыць алфавіт — сістэма графічных знакаў для перадачы гукаў вуснага маўлення. Алфавіт натуральнай мовы з’яўляецца ўніверсальным кодам любой пісьмовай культуры.

Акрамя натуральных, чалавек выкарыстоўвае штучна створаныя мовы са сваімі спецыяльнымі кодамі: мову матэматычных ці хімічных формул, ноты і інш.

Код — сукупнасць умоўных знакаў, кожнаму з якіх прысвойваецца пэўнае значэнне (прыклады 2.1 і 2.2).

Працэс запісу ці пераўтварэння інфармацыі ў адпаведнасці з правіламі, зададзенымі некаторым кодам, называюць кадзіраваннем. Працэс, адваротны кадзіраванню, называюць дэкадзіраваннем.

Кадзіраваць і перадаваць інфармацыю можна рознымі спосабамі: вусна, пісьмова, жэстамі і інш. Камп’ютар можа апрацоўваць лікавую, тэкставую, графічную і гукавую інфармацыю толькі ў лічбавым фармаце, які ў камп’ютары прадстаўлены ў выглядзе двайковага кода.

Двайковы код — спосаб кадзіравання, у якім кожны разрад прымае адно з двух магчымых значэнняў, што звычайна абазначаюцца лічбамі 0 і 1. Разрад у гэтым выпадку называецца двайковым разрадам.

Такі спосаб кадзіравання звязаны з тым, што прасцей за ўсё рэалізуюцца тэхнічныя ўстройствы, якія валодаюць двума ўстойлівымі станамі: уключана/выключана, злучана/раз’яднана і інш.

Для кадзіравання лікавай інфармацыі ў камп’ютары замест дзесятковай сістэмы лічэння выкарыстоўваецца двайковая, заснаваная на двайковым кодзе.

Кадзіраванне тэкставай інфармацыі ў камп’ютары выконваецца пры дапамозе спецыяльных кодавых табліц, дзе кожнаму знаку ставіцца ў адпаведнасць пэўная паслядоўнасць з нулёў і адзінак (прыклад 2.3).

2.2. Адзінкі вымярэння аб’ёму інфармацыі

Чалавек ужывае розныя адзінкі вымярэння. Так, для вымярэння часу выкарыстоўваюцца секунды, мінуты, гадзіны, для вымярэння адлегласці — метры, кіламетры і інш. Вымярэнні праводзяць з дапамогай вымяральных прыбораў (прыклад 2.4).

Для вызначэння колькасці інфармацыі ёсць свае адзінкі вымярэння. Мінімальную колькасць інфармацыі, для кадзіравання якой дастаткова аднаго двайковага разраду, называюць бітам (bit).

Слова «біт» утварылася ад англійскіх слоў binary (двайковы) і digit (знак). Біт — мінімальная адзінка, якая паказвае колькасць інфармацыі. Ён можа прымаць адно з двух значэнняў — 0 або 1. Для зручнасці ўведзена больш буйная адзінка вымярэння інфармацыі — байт.

Байт — адзінка вымярэння колькасці інфармацыі, якая складаецца з васьмі паслядоўных і ўзаемазлучаных бітаў.

1 байт = 23 біт = 8 біт (прыклад 2.5).

Для абазначэння большага аб’ёму інфармацыі выкарыстоўваюцца іншыя адзінкі вымярэння:

1 Кбайт (кілабайт) = 1 024 байты;

1 Мбайт (мегабайт) = 1 048 576 байт;

1 Гбайт (гігабайт) = 1 073 741 824 байты;

1 Тбайт (тэрабайт) = 1 099 511 627 776 байт.

Значэнні дадзеных адзінак вымярэння інфармацыі для зручнасці кадзіравання звязаны са ступенню ліку 2 (прыклад 2.6).

У гэтых адзінках вымяраюцца колькасць (аб’ём) аператыўнай ці знешняй памяці камп’ютара, памеры файлаў. У прыкладзе 2.7 паказана, якім чынам выконваецца перавод адных адзінак вымярэння інфармацыі ў іншыя.

Кадзіраванне інфармацыі выкарыстоўвалася са старажытнасці. Шырока вядомы шыфр Юлія Цэзара, які ўжываўся для запісу сакрэтных паведамленняў. Кожны сімвал у тэксце замяняўся сімвалам, што знаходзіўся на некаторай пастаяннай адлегласці лявей ці правей за яго ў алфавіце.

Напрыклад, пры кадзіраванні інфармацыі з дапамогай літар рускага алфавіта шляхам зруху ўправа на 3 літара «А» была б заменена на «Г», літара «Б» стала б «Д» і г. д.

Прыклад 2.1. Сёння шырока ўжываюцца штрых-коды на розных таварах. Перад вамі штрых-код згушчанага малака:

Прыклад 2.2. Са з’яўленнем смартфонаў пачалі распаўсюджвацца QR-коды. Яны дазваляюць хутка заносіць у тэлефон тэкставую інфармацыю, дадаваць кантакты ў адрасную кнігу, пераходзіць па web-спасылках, адпраўляць SMS-паведамленні і г. д. Вось, напрыклад, QR-код са спасылкай на артыкул у Wikipedia пра QR-коды:

Прыклад 2.3. Кадзіраванне некаторых літар англійскага алфавіта на камп’ютары.

Літара Двайковы код
A 01000001
B 01000010
C 01000011
D 01000100
E 01000101
F 01000110
G 01000111
H 01001000
I 01001001
J 01001010
K 01001011
L 01001100
M 01001101
N 01001110

Прыклад 2.4.

Прыклад 2.5. Суадносіны паміж бітам і байтам.

Прыклад 2.6. Суадносіны адзінак вымярэння інфармацыі.

Прыклад 2.7.
Перавядзём 2364 Мбайт у кілабайты і гігабайты:
2368 Мбайт = (2368 ≈ 210) Кбайт = 2424832 Кбайт;
2368 Мбайт = (2368 / 210) Гбайт = 2,3 Гбайт.1 Што такое код?2 Які код выкарыстоўваюць для кадзіравання інфармацыі ў камп’ютары?3 Выберыце са спіса адзінкі вымярэння інфармацыі.1 Выкарыстоўваючы шыфр Юлія Цэзара са зрухам управа на 3, закадзіруйце фразу «Хто валодае інфармацыяй, той валодае светам».

2 Выкарыстоўваючы шыфр Юлія Цэзара са зрухам улева на 2, закадзіруйце фразу Сціва Джобса «Камп’ютар — гэта як веласіпед для нашага мозгу».

3 У азбуцы Морзэ літары і лічбы замяняюцца паслядоўнасцямі з кароткіх і доўгіх сігналаў — кропак і працяжнікаў:

А

Б

В

Г

Д

Е

Ж

З

И

К

Л

М

Н

О

.-

-…

.–

–.

-..

.

–..

..

-.-

.-..

-.

П

Р

С

Т

У

Ф

Х

Ц

Ч

Ш

Щ

Ъ, Ь

Ы

Э

.–.

.-.

..-

..-.

.

-.-.

—.

—-

–.-

-..-

-.–

..-..

Ю

Я

1

2

3

4

5

6

7

8

9

0

..–

.-.-

.—-

..—

.-

..

-….

–…

—..

—-.

—–

1. З дапамогай азбукі Морзэ запішыце: «Запас беды не чинит».

2. Расшыфруйце інфармацыю, запісаную на азбуцы Морзэ.

-.

.-

—-

..

-…

-.-

.-

.

..-

—.

.-

.-.-

4 Выканайце перавод адзінак вымярэння інфармацыі:

1. 174 байта ў біты.

2. 342,3 Кбайт у байты.

3. 45638 Мбайт у гігабайты.