Сайт вчителя інформатики Каляфіцького Сергія: Тема: Кодування символів.

Тема: Кодування символів.

Мета:

навчальна — сформувати уявлення про поняття кодування і декодування, про засоби зберігання повідомлень; пояснити учням особливості кодування даних різного типу (текстових, графічних, числових, звукових), навчити кодувати числові та текстові повідомлення;
розвивальна — розвивати логічне мислення на основі спостережень, порівнянь, усвідомлення отриманого матеріалу; продовжувати розвивати навички роботи з інформаційними технологіями;
виховна — стимулювати інтерес до предмету, пізнавальну активність, акуратність, терпимість та інформаційну культуру учнів.

Обладнання й матеріали: ПК з встановленою ОС, (дана) інструкція.

Структура уроку

1. Організаційний момент.

2. Актуалізація опорних знань.

3. Вивчення нового матеріалу.

4. Закріплення вивченого матеріалу.

5. Підбиття підсумків уроку.

6. Домашнє завдання.

Хід уроку

1. Організаційний момент
Вітання з класом. Перевірка присутності і готовності учнів до уроку.

2. Актуалізація опорних знань

1. Що означає поняття інформація?

2. Які є джерела інформації?

3. Які є види інформації за способом сприйняття?

4. Які є види інформації за формою подання?

5. Які є види інформації за призначенням?

6. Які є інформаційні процеси?

7. Що таке дані?

8. Що таке повідомлення?

Одиниці вимірювання інформації

Біт — порція інформації про вибір між двома станами (подіями) — основна й найменша одиниця вимірювання кількості інформації.

Як наслідок поданого означення і комбінаторного правила множення:

n біт — порція інформації про вибір між 2ⁿ станами (подіями).

Більшого поширення набули такі одиниці вимірювання кількості інформації:
1 байт = 8 бітів;
1 Кбайт (кілобайт) = 1024 байти;
1 Мбайт (мегабайт) = 1024 Кбайти;
1 Гбайт (гігабайт) = 1024 Мбайти;
1 Тбайт (терабайт) = 1024 Гбайти;
1 Пбайт (петабайт) = 1024 Тбайти.
Зауважте: тут префікс «кіло» означає не 1000, а число 1024 = 2¹⁰.

Інформаційні процеси — це процеси пошуку та накопичення, опрацювання та використання, подання, зберігання та захисту інформації.

Опрацювання інформації — це процес її перетворення згідно з певними правилами.

Опрацювання інформації потрібно розрізняти від перетворення, яке не змінює змісту вхідної інформації. Наприклад, підсилення звукових сигналів. Опрацювання інформації залежить від змісту вхідної інформації, але під час самого опрацювання інформацію не осмислюють, а лише перетворюють за розробленими алгоритмами.

3. Вивчення нового матеріалу

Iнформація — це відображення реального (матеріального) світу у вигляді знаків та сигналів.

Інформацію передають за допомогою повідомлень.

Повідомлення — це послідовність сигналів різної природи (звук, текст, зображення, жести, електричні сигнали тощо).

Дані – це повідомлення, зафіксовані на носіях (інформації).

Повідомлення можуть передавати від людини до людини, від людини до пристрою та навпаки, а також між пристроями. Між людьми повідомлення передають в усній чи письмовій формі, а між пристроями — за допомогою електромагнітних сигналів. Інформація залежить від того, як тлумачать повідомлення, за допомогою якого її передають.

Види інформації (повідомлень) за формою подання:

текстова — у літературі або відображена технічними пристроями у вигляді текстів;
графічна — картини, малюнки, рисунки, графіки, діаграми, схеми тощо;
звукова — усне мовлення, музичні композиції, мелодії, шумові ефекти;
числова — набори числових даних;
комбінована або мультимедійна — інформація, утворена комбінацією об'єктів попередніх видів. Наприклад, web-сторінка.

Одна й та сама інформація може мати різні форми подання. Наприклад, відомості про погоду можна висловити українською, польською, угорською, німецькою, французькою або англійською мовою. Мова спілкування — далеко не єдина форма подання інформації. При діях з числами зазвичай використовують різні символьні позначення. Наприклад, у фізичних формулах v — швидкість, m — маса, t — час тощо.

У процесі передавання інформація може спотворюватися або втрачатися в результаті дії зовнішніх факторів. Наприклад дії електромагнітних полів.

Кодування — це процес заміни знаків одного набору знаками іншого набору при збереженні змісту інформації, яку подають за допомогою цих знаків.

Декодування — це процес, обернений до кодування.

Алфавіт — це сукупність (допустимих) символів, з яких утворюють повідомлення (кодів, що їх кодують).

Контрольні запитання

1. Скільки символів у алфавіті світлофора? — 3.

2. Скільки символів у алфавіті української мови? — 33.

Двійкове кодування — це кодування за допомогою двох елементів. Інакше кажучи, алфавіт містить лише 2 символи (+ і –, 0 і 1).

Саме таке двійкове кодування за допомогою символів 0 і 1 використовують у обчислювальній техніці. Ці два символи 0 и 1 називають бітами (від англійського binarydigit — двійкова цифра). Таке подання інформації конструктивно і технічно зручне, бо двом знакам, які для цього використовують, відповідають два різні фізичні стани (напрям намагніченості ділянки на поверхні магнітного диска, напрям електричного поля між обкладинками конденсаторів тощо). Таким чином, у результаті двійкового кодування здійснюють перетворення вхідної інформації у форму, що сприймається комп'ютером.

Дані спочатку перекодовують у коди відповідного пристрою, який їх опрацьовує згідно з алгоритмом розв'язання певного завдання, і у потрібний момент декодують, тобто перетворюють у зрозумілий для людини код.

Способи кодування інформації в комп'ютері, насамперед, залежить від виду інформації, а саме від того, що потрібно кодувати: числа, текст, графічні зображення або звук.

Кодування числової інформації

Двійкові коди цілих чисел будують поданням їх у двійковій системі числення.

Система числення – це сукупність правил запису чисел за допомогою певного набору символів.

Позиційна система числення з основою p
Нехай p > 1 — деяке натуральне число. Цифрами в системі числення з основою p називають символи для позначення цілих чисел у межах від 0 до (p – 1) включно. Для цілих m ≥ 0,n ≥ 0 розглянемо α₀, α₁, …, α_n_–
1, α_n, β₁, β₂, …, β_m_–
1, β_m — послідовності цифр (необов'язково різних) у системі числення з основою p, причому α_n ≠ 0 при n > 0. Вираз (запис)

± (α_n α_n_–
1 … α₁ α₀, β₁ β₂ … β_m_{– 1} β_m)_p

називають скінченним дробом у системі числення з основою p, а його величина дорівнює:

± (α_n pⁿ + α_n_–
1 pⁿ^{– 1}+ ⋯ α₁ p + α₀ + β₁ p^{– 1} β₂ p^–
2 + ⋯ + β_m_{– 1} p^m^–
1 + β_m p^m)

де знаки однакові в обох записах. При p = 10 такий вираз називають скінченним десятковим дробом з m цифрами після коми. За домовленістю, p — основа числення — не вказують при p = 10. У даному разі кома у записі скінченного дробу називається десятковою комою. У більшості країн і в записі чисел різними мовами програмування замість коми використовують (десяткову) крапку.

Для запису натуральних чисел використовують такий запис:

α_n α_n_{– 1} … α₁ α₀ _p = α_n pⁿ + α_n_–
1 pⁿ^{– 1}+ ⋯ α₁ p + α₀.

який називають (n + 1)-цифровим натуральним числом у системі числення з основою p.

Двійкова система числення — це позиційна система числення з основою 2.

Для запам'ятовування цілих чисел виділяють певну кількість байт, які називають машинними словами.

Перший біт машинного слова виділяють для кодування знака числа. Решту бітів використовують для подання числа без знака, яке за потреби доповнюють нулями до потрібної довжини.

Дійсні числа можна подати з фіксованою або рухомою крапкою. При кодуванні дійсних чисел з фіксованою крапкою один перший біт виділяють для запам’ятовування знаку числа, а решта розрядів поділені на дві частини: в одну з них заносять код цілої частини, а в іншу — код дробової.

Перед кодуванням дійсне число у формі з рухомою крапкою зводять до стандартного нормалізованого виглядк m·10^p, де m ∈ [1; 10) — мантиса числа, p — порядок числа. Машинне слово такого числа містить два знакових біти один — для знаку мантиси, а другий — для знаку порядку. Решта бітів поділено на дві частини: в одну частину розташовують код порядку, а в іншу — код мантиси.

Кількість бітів, які виділяють для мантиси та порядку, залежить від програмного засобу і типу змінної, які використовують.

Кодування текстової інформації.

Для кодування одного символу використовують щонайменще 1 байт інформації (8 бітів). 2⁸ = 256, тому за допомогою 1 байта можна закодувати 256 різних символів.

Кодування полягає в тому, що кожному символу ставиться у відповідність унікальний двійковий код від 00000000 до 11111111 (або десятковий код від 0 до 255). Відповідність коду певному символу — це питання домовленості, зафіксованою кодовою таблицею.

Таблиця кодування — це таблиця, в якій всім символам комп'ютерного алфавіту поставлено у відповідність порядкові номери (коди).

ASCII (від AmericanStandartCodeforInformationInterchange — американський стандартний код для обміну інформацією) — таблиця кодування, що фіксує лище першу половину кодів, тобто символи з номерами від 0 (00000000) до 127 (0111111). Таким чином кодують літери латиниці (не розширеної), цифри, розділові знаки, дужки і деякі інші службові символи (наприклад, невидимі ознаки кінця рядка).

ANSI (від AmericanNationalStandardsInstitute — Американський національний інститут стандартів (США)) — це таблиця ASCII з розширенням для кодів з номерами від 128 до 255 (залежно від локалізації), яку ще називають сторінкою кодування.

У таблиці кодування cp1251 (від англійських сodepage — сторінка кодування або кодова сторінка) останні 128 кодів використано для кодування кирилиці: і білоруської, і російської, і української. Причому алфавітний порядок для білоруської та української абеток суперечить порядку зростання кодів відповідних літер.

Юніко́д, (англ. Unicode), УНІфікованеКОДування — це промисловий стандарт, розроблений, щоб забезпечити цифрове представлення символів усіх писемностей світу та спеціальних символів. Удосконалений сумісно з стандартом Універсальний Набір Символів (UniversalCharacterSet — UCS) і опублікований у формі книги Стандарт Юнікод, Юнікод складається з множини символів, методології кодування та комплекту (набору) стандартів кодування символів, комплекту кодових таблиць для посилань на зображення символів, списку властивостей символів таких, наприклад, як верхній і нижній регістр, комплект довідкових даних комп'ютерних файлів, правил нормалізації, декомпозиції, зіставлення і зображення.

Стандарт запропонувала в 1991 році організація Консорціум Юнікоду (англійською UnicodeConsortium), яка об'єднує найбільші ІТ-компанії (корпорації). Консорціум Юнікоду — неприбуткова (некомерційна) організація, яка координує розвиток Юнікоду, має амбітну мету замінити в кінцевому підсумку наявні системи кодування символів Юнікодом і його системою стандартів, бо багато наявних кодування обмежені щодо можливостей і несумісні з багатомовними середовищами. Успіхи Юнікоду в уніфікації наборів символів призвели до його розповсюдження і домінуючого використання в інтернаціоналізації і локалізації програмного забезпечення комп'ютерів. Стандарт використано у багатьох новітніх технологіях, наприклад, у XML, мові програмування JavaScript і сучасних операційних системах.

Юнікод знімає старе обмеження на кодування символів лише одним байтом. Натомість використовують 17 просторів, кожен з яких визначає 65 536 кодів і дає можливість описати максимум 1 114 112 різних символів. BasicMultilingualPlane (BMP) — Основна Багатомовна Площина — містить майже всі символи, які використовують. Юнікод має декілька реалізацій, але найпоширенішими є дві: UTF (UnicodeTransformationFormat) — Формат Перетворення Юнікоду та UCS (UniversalCharacterSet) — Універсальна Таблиця Символів. Число після UTF визначає кількість бітів, виділених під найменщу складову коду (юніт), а число після UCS — кількість байтів. Універсальний набір символів задає однозначну відповідність символів кодам — елементам кодового простору, тобто невід'ємним цілим числам.

UTF–8 — найпоширеніший для інтернаціональних кодувань — реалізує подання Юнікоду, сумісне з 8-бітовим кодуванням тексту. Текст, складений лише з символів з кодом меншим, ніж 128, при записі в UTF–8 перетворюється на звичайний текст ASCII. І навпаки, в тексті UTF–8 будь-який байт із величиною, меншою ніж 128, подає символ ASCII з тим же кодом. Решта символів Юнікоду зображають послідовностями завдовжки від 2 до 6 байтів.

Кодування графічної інформації

Графічні зображення на екранах моніторів формують шляхом підсвічення усіх точок екрану певними кольорами. Елементом такого графічного зображення є точка або піксель (від англійського Picture Element).

Растрова графіка — це сукупність засобів для подання графічних зображень, для кодування яких використовуються точки — пікселі.

Координати, колір і яскравість кожної такої точки можна виразити за допомогою цілих чисел, тому для кодування растрового зображення можна використати двійковий код. При кодуванні кольору за допомогою 4 біт можна передати лише 16 кольорів, а за допомогою 8 біт — 256. При цьому використовують індексний метод кодування кольору: код кольору кожної точки є лише номером (індексом) у деякій таблиці (палітрі) і не відображає фізичні властивості.

Більшість кольорів утворено змішуванням основних кольорів. Спосіб розділення кольорів на складові називають колірною моделлю.

Колірна модель — це система кодування кольорів

Для кодування кольору переважно застосовують принцип розкладення (декомпозиції) довільного кольору на основні складові.

RGB (скорочено від англійських Red, Green, Blue — червоний, зелений, синій) — адитивна колірна модель, згідно з якою червоне, зелене та синє світло змішують у різноманітні кольори.

Червоний	Зелений	Синій	Результат
0	0	0	чорний
0	0	1	синій
0	1	0	зелений
0	1	1	блакитний
1	0	0	червоний
1	0	1	рожевий
1	1	0	коричневий
1	1	1	білий

Цю модель широко застосовують у техніці, що відтворює зображення випромінюванням світла. У ній колір кодуют величиною інтенсивністі складових каналів (Red, Green, Blue). Кількість градацій кожного каналу залежить від кількості бітів, відведених на кодування. Зазвичай використовують 24-х бітну модель, у котрій визначено по 8 біт на кожен канал. Це дозволяє кодувати таку кількість кольорів:

2²⁴ = (2⁸)³ = 256⁸ = 16 777 216.

Кодування 16-розрядним двійковим кодом називають режимом HighColor (65536 різних кольорів), 24-розрядним — повнокольоровим — TrueColor (близько до чутливості людського ока).

Ще до електронного віку модель RGB мала за собою серйозну теорію, засновану на сприйнятті кольорів людиною.

CMYK (скорочено від англійських Cyan, Magenta, Yellow, Keycolor) — субтрактивна колірна модель, яку використовують у поліграфії.

Українською перші три кольори називають так: блакитний, пурпуровий, жовтий. Але професіонали воліють говорити ціан, маджента та жовтий. Ці кольори візуально не збігаються із загальноприйнятими назвами кольорів. За четвертий колір (Keycolor) зазвичай використовують чорний.

Папір і інші друкарські матеріали є поверхнями, що відображають світло. Тому у поліграфії рахують, яку кількість світла відбилося від цієї поверхні, а не скільки поглинуто. Якщо відняти з білого три первинні кольори моделі RGB, ми отримаємо трійку доповнюючих кольорів CMY. Субтрактивна (модель) означає, ми віднімаємо первинні кольори з білого. Модель CMYK забезпечує менше колірне охоплення, ніж адитивна модель RGB.

Кожен колір у моделі CMYK описують сукупністю чотирьох чисел, які називають колірними координатами. Кожне з цих чисел є відсотком фарби даного кольору у складовій колірної комбінації. Наприклад, для отримання темно-помаранчевого кольору потрібно змішати 30% фарби cyan, 45% фарби magenta, 80% фарби yellow і 5% кольори black. Цей колір можна записати таким чином: (30, 45, 80, 5) або C30M45Y80K5.

Існує доволі довгий список широко розповсюджених і використовуваних кольорів, що мають свої назви.

Кодування звукової інформації

Звук, який сприймають органами слуху людини, — це звукові коливання. Діапазон звукових частот, які сприймають люди, — від 17 Гц до 20 КГц. Цей діапазон частот можна розбити на інтервали, у межах кожного з яких частота звуку вважати сталою. Якщо ці інтервали занумерувати, а номери інтервалів назвати числовими кодами відповідних звукових частот, то отримаємо модель кодування звукового повідомлення.

Для подання звуку у вигляді дискретних цифрових сигналів (дискретизації) використовують спеціальні пристрої — аналогово-цифрові перетворювачі. Зворотне перетворення для відтворення звуку, закодованого числовим кодом, виконують цифро-аналогові перетворювачі. Процес перетворення звукового сигналу в цифрову форму називають оцифровуванням.

Збереження миттєвої величини звукового сигналу в цифровій формі в окремий момент часу називають вибіркою. Чим частіше беруть вибірки, тим точніше цифрова копія звуку відповідає оригіналу.

Розрядність звуку — кількість бітів, які використовують для цифрового подання кожної вибірки.

Для запису і відтворення мови достатньо 8-розрядного подання, а для музики потрібно 16 розрядів.

Кодування керівної інформації

Керівна інформація призначена для сприйняття її деяким виконавцем. Якщо виконавцем є технічний пристрій, то він має певну систему вказівок, які він може виконувати. Систему вказівок кожного виконавця можна подати таблицею, де кожній вказівці відповідає свій номер, що називають кодом вказівки. Під час кодування керівної інформації записують послідовність кодів тих вказівок, з яких вона складається.

Вимірювання довжини коду

Щоб виміряти довжину двійкового коду, потрібно полічити кількість символів (розрядів) у ньому. Наприклад, довжина двійкового коду 10000111 становить 8 біт.

Обсяг текстових повідомлень зазвичай вимірюють у байтах шляхом підрахунку кількості символів у них (пропуск — також символ). Повідомлення: «Я люблю інформатику!» містить 20 байт інформації.

Обсяг будь-якого повідомлення (текстового, звукового, графічного чи відео) в електронному вигляді визначають як розмір місця, яке воно займає.

4. Закріплення вивченого матеріалу

1. Що таке кодування?

2. Що таке декодування?

3. Які види кодування ви запам’ятали?

4. Що таке колірна модель?

5. Що таке кодова таблиця?

6. В чому полягає кодування графічної інформації?

Задача. Скільки місця потрібно на диску, щоб зберегти текст деякої книжки обсягом 300 сторінок за умови, що кожна сторінка книжки має 40 рядків тексту, а кожний рядок тексту містить 66 символів?

Розв’язання. 40 ·66 · 300 = 792 000 — кількість символів, які потрібно зберегти. Це і є шуканою кількістю байтів для кодування ANSI.

Відповідь: 792 000 байт = (792 000 / 1024) Кбайт = 773,4 Кбайт для кодування ANSI, удвічі більше для кодування Юнікод.

5. Підбиття підсумків уроку
Виставлення оцінок.

6. Домашнє завдання
Повторити вивчений матеріал. У зошиті закодуйте за допомогою ASCII-кода своє прізвище, ім'я, номер класу.

Сайт вчителя інформатики Каляфіцького Сергія

Сторінки

вівторок, 13 вересня 2016 р.

Тема: Кодування символів.

Немає коментарів:

Дописати коментар

Сторінки

вівторок, 13 вересня 2016 р.

Тема: Кодування символів.

Немає коментарів:

Дописати коментар

вівторок, 13 вересня 2016 р.