Кодування текстової інформації в комп'ютері

15-07-2015, 18:15

2 716

Кодування текстової інформації в комп'ютері – часом невід'ємна умова коректної роботи пристрою або відображення того чи іншого фрагменту. Як відбувається цей процес у ході роботи комп'ютера з текстом і візуальною інформацією, звуком – все це ми розглянемо у цій статті.

Вступ

Електронна обчислювальна машина (яку ми в повсякденному житті називаємо комп'ютером) сприймає текст дуже специфічно. Для неї кодування текстової інформації дуже важливо, оскільки вона сприймає кожен текстовий фрагмент в якості групи відокремлених один від одного символів.

Які бувають символи?

У ролі символів для комп'ютера виступають не тільки російські, англійські та інші букви, але і ще розділові знаки, а також інші знаки. Навіть пробіл, яким ми поділяємо слова при друкуванні на комп'ютері, пристрій сприймає як символ. Чимось дуже нагадує вищу математику, адже там, на думку багатьох професорів, нуль має подвійне значення: він і є числом, і одночасно нічого не означає. Навіть для філософів питання прогалини в тексті може стати актуальною проблемою. Жарт, звичайно, але, як кажуть, в кожному жарті є частка правди.

Яка буває інформація?

Отже, для сприйняття інформації комп'ютера необхідно запустити процеси обробки. А яка взагалі буває інформація? Темою цієї статті є кодування текстової інформації. Ми приділимо особливу увагу цій задачі, але розберемося і з іншими микротемами.

Інформація може бути текстової, числової, звукової, графічної. Комп'ютер повинен запустити процеси, що забезпечують кодування текстової інформації, щоб вивести на екран те, що ми, наприклад, друкуємо на клавіатурі. Ми будемо бачити символи і букви, це зрозуміло. А що бачить машина? Вона сприймає абсолютно всю інформацію – і мова зараз йде не тільки про текст – в якості певної послідовності нулів та одиниць. Вони складають основу так званого двійкового коду. Відповідно, процес, який перетворює надходить на пристрій інформацію в зрозумілу йому, має назву "двійкове кодування текстової інформації".

Короткий принцип дії двійкового коду

Чому найбільше поширення в електронних машинах отримало саме кодування інформації двійковим кодом? Текстовою основою, яка кодується за допомогою нулів і одиниць, може бути абсолютно будь-яка послідовність символів і знаків. Однак це не єдина перевага, яку має двійкове текстове кодування інформації. Вся справа в тому, що принцип, на якому влаштований такий спосіб кодування, дуже простий, але в той же час досить функціональний. Коли є електричний імпульс, його маркують (умовно, звичайно) одиницею. Немає імпульсу – маркують нулем. Тобто текстове кодування інформації базується на принципі побудови послідовності електричних імпульсів. Логічна послідовність, складена з символів двійкового коду, називається машинним мовою. У той же час кодування і обробка текстової інформації за допомогою двійкового коду дозволяють здійснювати операції за досить короткий проміжок часу.

Біти і байти

Цифра, що сприймається машиною, криє в собі певну кількість інформації. Воно дорівнює одному біту. Це стосується кожної одиниці і кожного нуля, які становлять ту чи іншу послідовність зашифрованої інформації. Відповідно, кількість інформації в будь-якому випадку можна визначити, просто знаючи кількість символів в послідовності двійкового коду. Вони будуть чисельно рівні між собою. 2 цифри в коді несуть в собі інформацію обсягом в 2 біта, 10 цифр – 10 біт і так далі. Принцип визначення інформаційного обсягу, який криється в тому чи іншому фрагменті двійкового коду, досить простий, як ви бачите.

Кодування текстової інформації в комп'ютері

Ось зараз ви читаєте статтю, яка складається з послідовності, як ми вважаємо, букв алфавіту російської мови. А комп'ютер, як говорилося раніше, сприймає всю інформацію (і в даному випадку теж) як послідовності не букв, а нулів і одиниць, що позначають відсутність і наявність електричного імпульсу. Вся справа в тому, що закодувати один символ, який ми бачимо на екрані, можна за допомогою умовної одиниці вимірювання, що називається байтом. Як написано вище, у двійкового коду є так звана інформаційна навантаження. Нагадаємо, що чисельно вона дорівнює сумарною кількістю нулів і одиниць у вибраному фрагменті коду. Так от, 8 біт становлять 1 байт. Комбінації сигналів при цьому можуть бути самими різними, як це легко можна помітити, намалювавши на папері прямокутник, що складається з 8 елементів однакового розміру. Виходить, що закодувати текстову інформацію можна за допомогою алфавіту, який має потужність 256 символів. У чому полягає суть? Сенс криється в тому, що кожен символ буде володіти своїм двійковим кодом. Комбінації, "привязиваемие" до певних символів, починаються від 00000000 і закінчуються 11111111. Якщо переходити від двійкової до десятковій системі числення, то кодувати інформацію в такій системі можна від 0 до 255. Не варто забувати про те, що зараз є різні таблиці, які використовують кодування букв російського алфавіту. Це, наприклад, ISO і КОІ-8 Mac і CP у двох варіаціях: 1251 і 866. Легко переконатися в тому, що текст, закодований в одній з таких таблиць не відображається коректно у відмінній від даної кодуванні. Це відбувається з-за того, що в різних таблиць до одного і того ж двійковому коду відповідають різні символи. Спочатку це було проблемою. Проте в даний час в програмах вже вбудовані спеціальні алгоритми, які конвертують текст, приводячи його до коректному вигляді. 1997 рік ознаменувався створенням кодування під назвою Unicode. В ній кожний символ має у своєму розпорядженні відразу 2 байти. Це дозволяє закодувати текст, який має набагато більшу кількість символів. 256 і 65536: є ж різниця?

Кодування графіки

Кодування текстової і графічної інформації має деякі схожі моменти. Як відомо, для виведення графічної інформації використовується периферійний пристрій комп'ютера під назвою "монітор". Графіка зараз (мова зараз йде саме про комп'ютерну графіку) широко використовується в самих різних сферах. Благо, апаратні можливості персональних комп'ютерів дозволяють вирішувати досить складні графічні завдання. Обробляти відеоінформацію стало можливим в останні роки. Але текст при цьому значно "легше" графіки, що, в принципі, зрозуміло. З-за цього кінцевий розмір файлів графіки необхідно збільшувати. Подолати подібні проблеми можна, знаючи суть, в якій представляється графічна інформація. Давайте для початку розберемося, на які групи поділяється даний вид інформації. По-перше, це растрова. По-друге, векторна. Растрові зображення досить схожі з картатої папером. Кожна клітина на такому папері зафарбовується тим або іншим кольором. Такий принцип чимось нагадує мозаїку. Тобто виходить, що в растровій графіці зображення розбивається на окремі елементарні частини. Їх називають пікселями. У перекладі на російську мову пікселі позначають "точки". Логічно, що пікселі упорядковані щодо рядків. Графічна сітка складається з певної кількості пікселів. Її також називають растром. Беручи до уваги ці два визначення, можна сказати, що растрове зображення є не чим іншим, як набором пікселів, які відображаються на сітці прямокутного типу. Екран монітора і розмір пікселя впливають на якість зображення. Воно буде тим вище, чим більше растр біля монітора. Розміри растра - це дозвіл екрана, про який напевно чув кожен користувач. Однією з найбільш важливих характеристик, які мають екрани комп'ютера, є роздільна здатність, а не тільки дозвіл. Воно показує, скільки пікселів припадає на ту або іншу одиницю довжини. Зазвичай роздільна здатність монітора вимірюється в точках на дюйм. Чим більше пікселів буде припадати на одиницю довжини, тим вищою буде якість, оскільки "зернистість" при цьому знижується.

Обробка звукового потоку

Кодування текстової і звукової інформації, як і інші види кодування, має деякі особливості. Мова зараз піде про останній процесі: кодування звукової інформації. Подання звукового потоку (як і окремого звуку) може бути зроблено за допомогою двох способів.

Аналогова форма подання звукової інформації

При цьому величина може приймати дійсно величезна кількість різних значень. Причому ці самі значення не залишаються постійними: вони дуже швидко змінюються, і цей процес безперервний.

Дискретна форма подання звукової інформації

Якщо ж говорити про дискретному способі, то в цьому випадку величина може приймати лише обмежену кількість значень. При цьому зміна відбувається стрибкоподібно. Закодувати дискретно можна не тільки звукову, але і графічну інформацію. Що стосується і аналогової форми, до речі. Аналогова звукова інформація зберігається на вінілових платівках, наприклад. А ось компакт-диск вже є дискретним способом подання інформації звукового характеру. На самому початку ми говорили про те, що комп'ютер сприймає всю інформацію на машинному мовою. Для цього інформація кодується у формі послідовності електричних імпульсів – нулів і одиниць. Кодування звукової інформації не є винятком з цього правила. Щоб обробити на комп'ютері звук, його для початку потрібно перетворити в ту саму послідовність. Тільки після цього над потоком або одиничним звуком можуть здійснюватися операції. Коли відбувається процес кодування, потік піддається тимчасової дискретизації. Звукова хвиля неперервна, вона розвивається на малі ділянки часу. Значення амплітуди при цьому встановлюється для кожного певного інтервалу окремо.

Висновок

Отже, що ж ми з'ясували в ході даної статті? По-перше, абсолютно вся інформація, яка виводиться на монітор комп'ютера, перш ніж з'явитися, піддається кодуванню. По-друге, це кодування полягає в перекладі інформації на машинний мову. По-третє, машинний мова являє собою не що інше, як послідовність електричних імпульсів – нулів і одиниць. По-четверте, для кодування різних символів існують окремі таблиці. І, по-п'яте, представити графічну та звукову інформацію можна в аналоговому та дискретному вигляді. Ось, мабуть, основні моменти, які ми розібрали. Однією з дисциплін, що вивчає дану область, є інформатика. Кодування текстової інформації і його основи пояснюються ще в школі, оскільки нічого складного в цьому немає.

Схожі добрі поради по темі

Так ось що робить ця кнопка на клавіатурі! Знати б раніше ...

Техніка і технології

Мало хто знає, для чого на клавіатурі потрібна гаряча клавіша Win . А адже її використання значно може спростити повсякденну роботу на комп'ютері. У

Символи "альфа", "бета", "гамма" і "омега" на комп'ютері: способи вставки в текст

Цікаве

Під час друку тексту користувачі можуть вставляти різноманітні символи, яких немає на клавіатурі. У даній статті буде розказано про те, як написати

Чому двійкове кодування є універсальним? Методи програмування

Інтернет

Комп'ютер обробляє велику кількість інформації. Аудіо-файли, картинки, тексти – все це необхідно відтворити або вивести на екран. Чому двійкове

Внутрішній і зовнішній тюнінг мотоцикла

Техніка і технології

Тюнінг - досить складна і цікава робота, якісно виконати яку може тільки досвідчений майстер-електрик, дизайнер і механік. В залежності від того, які

Двійкове кодування інформації

Техніка і технології

Стаття оповідає про найдавніші витоки кодування інформації, а також про її сучасному стані. Розкривається поняття двійкового коду.

як скачати музику з комп'ютера на телефон

Техніка і технології

Сучасні мобільні пристрої зв'язку за своїми тактико-технічними характеристиками стали нагадувати досить жвавий офісний ПК. Тому труднощі деяких