Як можна виміряти кількість інформації
Вірно твердження про те, що відсутність новин само по собі є хорошою звісткою? Кам'яна скрижаль, вага якої дорівнює трьом тоннам, може дати археологам той же обсяг інформації, що і якісна фотографія в хорошому археологічному виданні, чи не так? А коли київська радіостудія повідомляє останні новини, то і киянин і житель Іллічівська дізнаються про все, незалежно від того, що енергія радіохвиль в Києві набагато більше, ніж за сотні кілометрів від нього. Виходить, що ні потужність, ні розмір, ні кількість не можуть грати роль міри інформації. Тоді як же можна оцінити те чи інше кількість даних?
Новизна З шкільного курсу інформатики нам відомо, що кількість інформації, яку обробляють обчислювальні машини, вимірюється в бітах, байтах і кратних їм одиницях. Проте це не пояснює, як можна застосувати подібні знання в побуті. Наприклад, як ви оціните інформацію, отриману в результаті прочитання даної статті? Справедливо буде стверджувати, що чим більше листів, тим більше її вийде? А якщо, прочитавши цю статтю через тиждень, ви отримаєте те ж саме кількість інформації, що і раніше? Відповідь очевидна. Все це наштовхує на думку, що з точки зору новизни її просто неможливо виміряти. Ніякої біт тут не допоможе. Обсяг А ось в техніці кількість інформації можна виміряти число знаків або сигналів, які зберігають, передають і обробляють технічні пристрої. Цей підхід грунтується на підрахунку символів в кожному конкретному повідомленні. Наприклад, слово «світ» в англійському алфавіті записується п'ятьма літерами - peace, російською - трьома, а в КОИ8 на його передачу використовується 24 біта: 111011011110100111110010. Ось тут якраз і знаходять своє застосування мегабайти, кілобайти і терабайт.
Ймовірність Існує ще один підхід, згідно з яким інформація розглядається як зняття невизначеності. З цієї точки зору, чим більше ми отримуємо даних, тим менше наше незнання і більше обізнаність. Кількість інформації тут також визначається в бітах, а за одиницю виміру приймають той чи інший імовірнісний результат з однієї пари равновозможних подій («ні» або «так», «0» або «1»). Наприклад, підкинута монета для жеребкування. Може випасти або орел або решка. Повідомлення про те, що випала решка, зменшує невизначеність вдвічі, а його розмір відповідає одному біту. У разі, коли кількість равновозможних подій більше 2 для оцінки повідомлення використовують рівність Р. Хартлі, який зазвичай записують так: 2 I = N або I = log 2 N , де N - число всіх можливих подій, I - обсяг інформації в байтах. Іноді ця формула записується в модифікованому вигляді: I = log 2 (1/p) = - log 2 p. Символ «p» в цьому випадку означає ймовірність настання кожного з рівноймовірно результатів. Припустимо, наприклад, що підкинута вгору два звичайних гральних кубика. Потрібно визначити, скільки біт несе повідомлення про те, що на одному з них випала п'ятірка, а на іншому - двійка. Неважко порахувати, що ймовірність кожного з цих подій дорівнює одній шостій. Отже, I = 2 * log 2 6 =2 * 2585 = 517 біт. Як бачите, вимірювання інформації багато в чому залежить від сфери її використання обраного підходу. Складно уявити, яке значення вона має в нинішній час. Напевно, після часу це найбільш важливий ресурс, яким може володіти сучасна людина.
Новизна З шкільного курсу інформатики нам відомо, що кількість інформації, яку обробляють обчислювальні машини, вимірюється в бітах, байтах і кратних їм одиницях. Проте це не пояснює, як можна застосувати подібні знання в побуті. Наприклад, як ви оціните інформацію, отриману в результаті прочитання даної статті? Справедливо буде стверджувати, що чим більше листів, тим більше її вийде? А якщо, прочитавши цю статтю через тиждень, ви отримаєте те ж саме кількість інформації, що і раніше? Відповідь очевидна. Все це наштовхує на думку, що з точки зору новизни її просто неможливо виміряти. Ніякої біт тут не допоможе. Обсяг А ось в техніці кількість інформації можна виміряти число знаків або сигналів, які зберігають, передають і обробляють технічні пристрої. Цей підхід грунтується на підрахунку символів в кожному конкретному повідомленні. Наприклад, слово «світ» в англійському алфавіті записується п'ятьма літерами - peace, російською - трьома, а в КОИ8 на його передачу використовується 24 біта: 111011011110100111110010. Ось тут якраз і знаходять своє застосування мегабайти, кілобайти і терабайт.
Ймовірність Існує ще один підхід, згідно з яким інформація розглядається як зняття невизначеності. З цієї точки зору, чим більше ми отримуємо даних, тим менше наше незнання і більше обізнаність. Кількість інформації тут також визначається в бітах, а за одиницю виміру приймають той чи інший імовірнісний результат з однієї пари равновозможних подій («ні» або «так», «0» або «1»). Наприклад, підкинута монета для жеребкування. Може випасти або орел або решка. Повідомлення про те, що випала решка, зменшує невизначеність вдвічі, а його розмір відповідає одному біту. У разі, коли кількість равновозможних подій більше 2 для оцінки повідомлення використовують рівність Р. Хартлі, який зазвичай записують так: 2 I = N або I = log 2 N , де N - число всіх можливих подій, I - обсяг інформації в байтах. Іноді ця формула записується в модифікованому вигляді: I = log 2 (1/p) = - log 2 p. Символ «p» в цьому випадку означає ймовірність настання кожного з рівноймовірно результатів. Припустимо, наприклад, що підкинута вгору два звичайних гральних кубика. Потрібно визначити, скільки біт несе повідомлення про те, що на одному з них випала п'ятірка, а на іншому - двійка. Неважко порахувати, що ймовірність кожного з цих подій дорівнює одній шостій. Отже, I = 2 * log 2 6 =2 * 2585 = 517 біт. Як бачите, вимірювання інформації багато в чому залежить від сфери її використання обраного підходу. Складно уявити, яке значення вона має в нинішній час. Напевно, після часу це найбільш важливий ресурс, яким може володіти сучасна людина.
Схожі добрі поради по темі
Людина та інформація в сучасному суспільстві
Мудреці кажуть: "Хто володіє знанням, той володіє світом!" Цю тезу з таким же успіхом можна застосувати і до отримання інформації в сучасному
IMAP безпека зберігання інформації
Що таке IMAP? Як він працює і захищає інформацію, що передається поштою? Які його переваги?
Які види інформації існують?
Хто володіє інформацією - володіє світом, це загальновідоме вираз. Інше питання - які види та властивості інформації існують. Про це розповідається у
Двійкове кодування інформації
Стаття оповідає про найдавніші витоки кодування інформації, а також про її сучасному стані. Розкривається поняття двійкового коду.
Коли вийде Пам'ятати всі 4 сезон?
Дещо передчасно зраділи фанати проекту «Пам'ятати все», повіривши поширюваної деякими джерелами інформації про те, що четвертий сезон вийде вже