Для кодирования сообщения используется таблица – Для кодирования сообщения используется таблица А Б В Г Д 10 11 001 010 011 Найдите все способы декодирования сообщения

Кодирование и декодирование

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Планирование уроков на учебный год (по учебнику К.Ю. Полякова, Е.А. Еремина, сокращенный курс, 2 часа в неделю) | Кодирование и декодирование





Содержание урока

§5. Язык и алфавит
§6. Кодирование

Кодирование

Двоичное кодирование

Вопросы и задания

Задачи

Декодирование

Вопросы и задания

Задачи


§6. Кодирование


Задачи

1. Расшифруйте сообщение, записанное с помощью кода Морзе, которое используется как международный сигнал бедствия:

.

2. Покажите с помощью дерева, что кодовая таблица из примера 2 удовлетворяет «обратному» условию Фано.

3. Для кодирования сообщения используется таблица

Найдите все способы декодирования сообщения 1111001011.

4. Для кодирования сообщения используется таблица

Найдите все способы декодирования сообщения 1111001001100.

5. Для кодирования сообщения используется таблица

Найдите все способы декодирования сообщения 1111001010.

6. Для кодирования сообщения используется таблица

Найдите все способы декодирования сообщения 01110011.

7. Для кодирования сообщения используется таблица

Декодируйте сообщение 0110100011000.

8. Для кодирования сообщения, состоящего только из букв А, В, С, D и Е, используется неравномерный двоичный код:

Какие из сообщений были переданы без ошибок:

1) 110000010011110

2) 110000011011110

3) 110001001001110

4) 110000001011110

*9. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 0, Б = 10, В = 110. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

*10. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 0, Б = 100, В = 101. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

*11. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 01, Б = 1, В = 001. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

*12. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = О, Б = 100, В =110. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

*13. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 00, Б = 11, В = 100 и Г = 10. Определите, допускает ли такой код однозначное декодирование сообщения. Выполняется ли для него условие Фано?

Следующая страница §5. Язык и алфавит

Cкачать материалы урока

xn----7sbbfb7a7aej.xn--p1ai

Практическая работа № 5 «Декодирование»

Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Практические работы для 10 класса (по учебнику К.Ю. Полякова, Е.А. Еремина) | Практическая работа № 5 «Декодирование»




1. Для кодирования сообщения используется таблица1


1 Выберите вариант по указанию учителя.


Вариант 1:

Сообщение: 0101110010110 (Ответы: ГБАДДА, ДДБВДА)

Вариант 2:

Сообщение: 01011100101101 (Ответы: ААВААД, ААВГБА)

Вариант 3:

Сообщение: 0010001001001 (Ответы: БВГББ, ВДГББ)

Вариант 4:

Сообщение: 0100001101000010 (Ответы: БАДГАБ, ГАВГАБ)

Вариант 5:

Сообщение: 1010000011011000 (Ответы: ААГВВГ, АБГДВГ)

Используя средства текстового процессора, изобразите двоичное дерево, соответствующее этому коду.

2. Выполняется ли для этой кодовой таблицы условие Фано? Обратное условие Фано? Почему?

Ответ:

3. Найдите все способы декодирования сообщение, записанное под таблицей:

Ответ:

Проверьте свой ответ с помощью программы decode.

4. Замените код одного символа так, чтобы выполнилось условие Фано (или обратное условие Фано). Выделите зеленым фоном ячейку таблицы с измененным кодом символа.

5. Сократите код одного символа в таблице, полученной в п. 4 так, чтобы условие Фано (или обратное условие Фано) по-прежнему выполнялось. Выделите фиолетовым фоном ячейку таблицы с измененным кодом символа.

xn----7sbbfb7a7aej.xn--p1ai

Информатика ЕГЭ 5 задание разбор и объяснение

Урок посвящен тому, как решать 5 задание ЕГЭ по информатике


Кодирование информации

5-я тема характеризуется, как задания базового уровня сложности, время выполнения – примерно 2 минуты, максимальный балл — 1

  • Кодирование — это представление информации в форме, удобной для её хранения, передачи и обработки. Правило преобразования информации к такому представлению называется кодом.
  • Кодирование бывает равномерным и неравномерным:
  • при равномерном кодировании всем символам соответствуют коды одинаковой длины;
  • при неравномерном кодировании разным символам соответствуют коды разной длины, это затрудняет декодирование.
Пример: Зашифруем буквы А, Б, В, Г при помощи двоичного кодирования равномерным кодом и посчитаем количество возможных сообщений:

Таким образом, мы получили равномерный код, т.к. длина каждого кодового слова одинакова для всех кодов (2).

Кодирование и расшифровка сообщений

Декодирование (расшифровка) — это восстановление сообщения из последовательности кодов.

Для решения задач с декодированием, необходимо знать условие Фано:

Условие Фано: ни одно кодовое слово не должно являться началом другого кодового слова (что обеспечивает однозначное декодирование сообщений с начала)

Префиксный код — это код, в котором ни одно кодовое слово не совпадает с началом другого кодового слова. Сообщения при использовании такого кода декодируются однозначно.

  • если сообщение декодируется с конца, то его можно однозначно декодировать, если выполняется обратное условие Фано:
  • Обратное условие Фано: никакое кодовое слово не является окончанием другого кодового слова

    Постфиксный код — это код, в котором ни одно кодовое слово не совпадает с концом другого кодового слова. Сообщения при использовании такого кода декодируются однозначно и только

    с конца.


  • условие Фано – это достаточное, но не необходимое условие однозначного декодирования.

Однозначное декодирование обеспечивается:

Однозначное декодирование


Декодирование

Егифка ©:

Решение 5 заданий ЕГЭ

ЕГЭ 5.1: Для кодирования букв О, В, Д, П, А решили использовать двоичное представление чисел 0, 1, 2, 3 и 4 соответственно (с сохранением одного незначащего нуля в случае одноразрядного представления).

Закодируйте последовательность букв ВОДОПАД таким способом и результат запишите восьмеричным кодом.


✍ Решение:
  • Переведем числа в двоичные коды и поставим их в соответствие нашим буквам:

О -> 0 -> 00
В -> 1 -> 01
Д -> 2 -> 10
П -> 3 -> 11
А -> 4 -> 100
  • Теперь закодируем последовательность букв из слова ВОДОПАД:
  • 
    010010001110010
    
  • Разобьем результат на группы из трех символов справа налево, чтобы перевести их в восьмеричную систему счисления:
  • 
    010 010 001 110 010
     ↓   ↓   ↓   ↓   ↓
     2   2   1   6   2
    

    Результат: 22162

    Решение ЕГЭ данного задания по информатике, видео:


    Рассмотрим еще разбор 5 задания ЕГЭ:

    ЕГЭ 5.2: Для 5 букв латинского алфавита заданы их двоичные коды (для некоторых букв — из двух бит, для некоторых — из трех). Эти коды представлены в таблице:
    a b c d e
    000 110 01 001 10

    Какой набор букв закодирован двоичной строкой 1100000100110?


    ✍ Решение:
    
    110 000 01 001 10
     ↓   ↓   ↓  ↓  ↓
     b   a  c   d  e 
    

    Результат: b a c d e.

    ✎ 2 вариант решения:

      Этот вариант решения 5 задания ЕГЭ более сложен, но тоже верен.
    • Сделаем дерево, согласно кодам в таблице:
    • Сопоставим закодированное сообщение с кодами в дереве:
    
    110 000 01 001 10

    Результат: b a c d e.

    Кроме того, вы можете посмотреть видео решения этого задания ЕГЭ по информатике:


    Решим следующее 5 задание:

    ЕГЭ 5.3:
    Для передачи чисел по каналу с помехами используется код проверки четности. Каждая его цифра записывается в двоичном представлении, с добавлением ведущих нулей до длины 4, и к получившейся последовательности дописывается сумма её элементов по модулю 2 (например, если передаём 23, то получим последовательность 0010100110).

    Определите, какое число пе­ре­да­ва­лось по ка­на­лу в виде 01100010100100100110.


    ✍ Решение:
    • Рассмотрим пример из условия задачи:
    
    Было 2310
    Стало 00101001102
  • Где сами цифры исходного числа (выделим их красным цветом):
  •  0010100110  (0010 - 2, 0011 - 3)
  • Первая добавленная цифра 1 после двоичной двойки — это проверка четности (1 единица в 0010 — значит нечетное), 0 после двоичной тройки — это также проверка нечетности (2 единицы в 0011, значит — четное).
  • Исходя из разбора примера решаем нашу задачу так: поскольку «нужные» нам цифры образуются из групп по 4 числа в каждой плюс одно число на проверку четности, то разобьем закодированное сообщение на группы по 5, и отбросим из каждой группы последний символ:
  • разбиваем по 5:
  • 01100 01010 01001 00110
  • отбрасываем из каждой группы последний символ:
  • 0110 0101 0100 0011
  • Результат переводим в десятичную систему:
  • 
    0110 0101 0100 0011
     ↓    ↓     ↓    ↓
     6    5     4    3
    

    Ответ: 6 5 4 3

    Вы можете посмотреть видео решения этого задания ЕГЭ по информатике:



    ЕГЭ 5.4:

    Для кодирования некоторой последовательности, состоящей из букв К, Л, М, Н решили использовать неравномерный двоичный код, удовлетворяющий условию Фано. Для буквы Н использовали кодовое слово 0, для буквы К — кодовое слово 10.

    Какова наименьшая возможная суммарная длина всех четырёх кодовых слов?

    Подобные задания для тренировки


    ✍ Решение:1 вариант решения основан на логических умозаключениях:
    • Найдём самые короткие возможные кодовые слова для всех букв.
    • Кодовые слова 01 и 00 использовать нельзя, так как тогда нарушается условие Фано (начинаются с 0, а 0 — это Н).
    • Начнем с двухразрядных кодовых слов. Возьмем для буквы Л кодовое слово 11. Тогда для четвёртой буквы нельзя подобрать кодовое слово, не нарушая условие Фано (если потом взять 110 или 111, то они начинаются с 11).
    • Значит, надо использовать трёхзначные кодовые слова. Закодируем буквы Л и М кодовыми словами 110 и 111. Условие Фано соблюдается.
    • Суммарная длина всех четырёх кодовых слов равна:
    (Н)1 + (К)2 + (Л)3 + (М)3 = 9

    2 вариант решения:

    • Будем использовать дерево. Влево откладываем 0, вправо — 1:
    • Теперь выпишем соответствие каждой буквы ее кодового слова согласно дереву:
    
    (Н) -> 0   -> 1 символ
    (К) -> 10  -> 2 символа
    (Л) -> 110 -> 3 символа
    (М) -> 111 -> 3 символа
    
  • Суммарная длина всех четырёх кодовых слов равна:
  • (Н)1 + (К)2 + (Л)3 + (М)3 = 9

    Ответ: 9



    5.5: ЕГЭ по информатике 5 задание 2017 ФИПИ вариант 2 (под редакцией Крылова С.С., Чуркиной Т.Е.):

    По каналу связи передаются сообщения, содержащие только 4 буквы: А, Б, В, Г; для передачи используется двоичный код, допускающий однозначное декодирование. Для букв А, Б, В используются такие кодовые слова:

    
    А: 101010, 
    Б: 011011, 
    В: 01000
    

    Укажите кратчайшее кодовое слово для буквы Г, при котором код будет допускать однозначное декодирование. Если таких кодов несколько, укажите код с наименьшим числовым значением.

    Подобные задания для тренировки


    ✍ Решение:
    • Наименьшие коды могли бы выглядеть, как 0 и 1 (одноразрядные). Но это не удовлетворяло бы условию Фано (А начинается с единицы — 101010, Б начинается с нуля — 011011).
    • Следующим наименьшим кодом было бы двухбуквенное слово 00. Так как оно не является префиксом ни одного из представленных кодовых слов, то Г = 00.

    Результат: 00



    5.6: ЕГЭ по информатике 5 задание 2017 ФИПИ вариант 16 (под редакцией Крылова С.С., Чуркиной Т.Е.):

    Для кодирования некоторой последовательности, состоящей из букв А, Б, В, Г и Д, решили использовать неравномерный двоичный код, позволяющий однозначно декодировать двоичную последовательность, появляющуюся на приемной стороне канала связи. Использовали код:

    
    А - 01 
    Б - 00
    В - 11
    Г - 100
    

    Укажите, каким кодовым словом должна быть закодирована буква Д. Длина этого кодового слова должна быть наименьшей из всех возможных. Код должен удовлетворять свойству однозначного декодирования. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:
    • Так как необходимо найти кодовое слово наименьшей длины, воспользуемся деревом. Влево будем откладывать нули, а вправо — единицы:
    • Поскольку у нас все ветви завершены листьями, т.е. буквами, кроме одной ветви, то остается единственный вариант, куда можно поставить букву Д:
    • Перепишем сверху вниз получившееся кодовое слово для Д: 101

    Результат: 101

    Подробней разбор урока можно посмотреть на видео ЕГЭ по информатике 2017:


    5.7: 5 задание. Демоверсия ЕГЭ 2018 информатика (ФИПИ):

    По каналу связи передаются шифрованные сообщения, содержащие только десять букв: А, Б, Е, И, К, Л, Р, С, Т, У. Для передачи используется неравномерный двоичный код. Для девяти букв используются кодовые слова.

    Укажите кратчайшее кодовое слово для буквы Б, при котором код будет удовлетворять условию Фано. Если таких кодов несколько, укажите код с наименьшим числовым значением.

    Похожие задания для тренировки


    ✍ Решение:
    • Для решения будем использовать дерево. Ветви, соответствующие нулю, будем откладывать влево, единице — вправо.
    • При рассмотрении дерева видим, что все ветви «закрыты» листьями, кроме одной ветви — 1100:

    Результат: 1100

    Подробное решение данного 5 задания из демоверсии ЕГЭ 2018 года смотрите на видео:



    5.8: Задание 5_9. Типовые экзаменационные варианты 2017. Вариант 4 (Крылов С.С., Чуркина Т.Е.):

    По каналу связи передаются шифрованные сообщения, содержащие только четыре букв: А, Б, В, Г; для передачи используется двоичный код, допускающий однозначное декодирование. Для букв А, Б, В используются кодовые слова:

    
    А: 00011 
    Б: 111 
    В: 1010
    

    Укажите кратчайшее кодовое слово для буквы Г, при котором код будет допускать однозначное декодирование. Если таких кодов несколько, укажите код с наименьшим числовым значением.


    ✍ Решение:
    • Для решения будем использовать дерево. Ветви, соответствующие нулю, будем откладывать влево, единице — вправо.
    • Поскольку в задании явно не указано о том, что код должен удовлетворять условию Фано, то дерево нужно построить как с начала (по условию Фано), так и с конца (обратное условие Фано).
    • Дерево по условию Фано (однозначно декодируется с начала):

    • Получившееся числовое значение кодового слова для буквы Г01.
    • Дерево по обратному условию Фано (однозначно декодируется с конца):

    • Получившееся числовое значение кодового слова для буквы Г00.
    • После сравнения двух кодовых слов (01 и 00), код с наименьшим числовым значением — это 00.

    Результат: 00



    5.9: Тренировочный вариант №3 от 01.10.2018 (ФИПИ):

    По каналу связи передаются сообщения, содержащие только буквы: А, Е, Д, К, М, Р; для передачи используется двоичный код, удовлетворяющий условию Фано. Известно, что используются следующие коды:

    
    Е – 000
    Д – 10
    К – 111
    

    Укажите наименьшую возможную длину закодированного сообщения ДЕДМАКАР.
    В ответе напишите число – количество бит.


    ✍ Решение:
    • С помощью дерева отобразим известные коды для букв:
    • В результирующем слове — ДЕДМАКАР — вде буквы А. Значит, для получения наименьшей длины необходимо для буквы А выбрать наименьший код в дереве. Учтем это и достроим дерево для остальных трех букв А, М и Р:
    • Расположим буквы в порядке их следования в слове и подставим их кодовые слова:
    
    Д   Е   Д   М   А   К   А   Р
    10 000 10  001 01  111 01  110
    
  • Посчитаем количество цифр в итоговом коде и получим 20.
  • Результат: 20

    Смотрите виде решения задания:


    labs-org.ru

    Кодирование и декодирование

    Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Планирование уроков на учебный год (по учебнику К.Ю. Полякова, Е.А. Еремина, полный углубленный курс, 4 часа в неделю) | Кодирование и декодирование





    Содержание урока

    §5. Язык и алфавит
    §6. Кодирование

    Кодирование

    Двоичное кодирование

    Вопросы и задания

    Задачи

    Декодирование

    Вопросы и задания

    Задачи


    §6. Кодирование


    Задачи

    1. Расшифруйте сообщение, записанное с помощью кода Морзе, которое используется как международный сигнал бедствия:

    .

    2. Покажите с помощью дерева, что кодовая таблица из примера 2 удовлетворяет «обратному» условию Фано.

    3. Для кодирования сообщения используется таблица

    Найдите все способы декодирования сообщения 1111001011.

    4. Для кодирования сообщения используется таблица

    Найдите все способы декодирования сообщения 1111001001100.

    5. Для кодирования сообщения используется таблица

    Найдите все способы декодирования сообщения 1111001010.

    6. Для кодирования сообщения используется таблица

    Найдите все способы декодирования сообщения 01110011.

    7. Для кодирования сообщения используется таблица

    Декодируйте сообщение 0110100011000.

    8. Для кодирования сообщения, состоящего только из букв А, В, С, D и Е, используется неравномерный двоичный код:

    Какие из сообщений были переданы без ошибок:

    1) 110000010011110

    2) 110000011011110

    3) 110001001001110

    4) 110000001011110

    *9. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 0, Б = 10, В = 110. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    *10. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 0, Б = 100, В = 101. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    *11. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 01, Б = 1, В = 001. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    *12. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = О, Б = 100, В =110. Как нужно закодировать букву Г, чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    *13. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: А = 00, Б = 11, В = 100 и Г = 10. Определите, допускает ли такой код однозначное декодирование сообщения. Выполняется ли для него условие Фано?

    Следующая страница §5. Язык и алфавит

    Cкачать материалы урока

    xn----7sbbfb7a7aej.xn--p1ai

    Учебная презентация - Сайт ikt1793!

    Кодирование чисел с помощью нулей и единиц впервые применил в своей (механической)вычислительной машине немецкий мыслитель Готфрид Вильгельм Лейбниц в конце XVII века. Затем, уже в середине XX века, двоичное кодирование информации стало повсеместно применяться для электронных компьютеров.

    Чаще всего используется равномерный код, когда все символы исходного сообщения

    кодируются с помощью одинакового количества двоичных знаков. Например,

    используется таблица

    Здесь использовано 4 символа (А…Г), поэтому понадобилось 2 бита (2 разряда в двоичном числе) для кодирования.

    Если бы использовали 8 символов, то нужно было бы 3 бита.

     Сколько бит понадобится для кодирования 32 символов?

    Как ты думаешь, чем отличается равномерный код от неравномерного?

     Например, для кодирования первых 5 букв русского алфавита используется таблица

    А

    Б

    В

    Г

    Д

    000

    10

    01

    110

    001

    Это неравномерный код, поскольку в нем есть двух‐ и трехсимвольные коды.

    Как декодировать сообщение 1100000100110, зная ключ?

    Рассуждаем.

     Букв с кодами 1 и 11 в таблице нет, поэтому сообщение начинается с буквы Г – она имеет код 110:

    Г

    110 0000100110

    Следующий (единственно возможный) код – 000, это буква А:

    Г      А

    110 000 0100110

    Аналогично декодируем все сообщение:

    Г       А  В   Д     Б

    110 000 01 001 10

     

    В общем случае декодировать сообщение удается только перебором вариантов. Например,декодируем сообщение 010100111101, закодированное с помощью кодовой таблицы

    А

    Б

    В

    Г

    Д

    01

    010

    011

    11

    101

    Декодировать сразу, скорее всего, не удастся. На первом месте может быть, буква А или буква Б. Сначала предположим, что это буква А:

    А0100111101

    Тогда второй буквой также может быть буква А:

    АА00111101.

    Дальше декодировать не получается, потому что в таблице нет кодов 0, 00 и 001. Поэтому проверяем второй вариант: вторая буква – Б:

    АБ0111101.

    Третьей буквой может быть А:

    АБА11101,

    Тогда четвертая и пятая буквы определяются однозначно – это буквы Г и Д. Таким образом, один из подходящих вариантов – АБАГД.

     

    Попробуй расшифровать

    1.Для кодирования сообщения используется таблица

    А

    Б

    В

    Г

    Д

    01

    11

    100

    010

    110

    Найдите все способы декодирования сообщения 1111001001100.

    2. Для кодирования сообщения используется таблица

    А

    Б

    В

    Г

    Д

    0

    11

    101

    110

    111

    Найдите все способы декодирования сообщения 1111001010.

    3.Для кодирования сообщения, состоящего только из букв A, B, C, D и E, используется неравномерный двоичный код:

    А

    B

    C

    D

    E

    000

    11

    01

    001

    10

    Какие из этих сообщений были переданы без ошибок:

    1) 110000010011110

    2) 110000011011110

    3) 110001001001110

    4) 110000001011110

    4. Для передачи по каналу связи сообщения, состоящего только из букв А, Б, В, Г, решили использовать неравномерный код: A = 0, Б = 10, В = 110. Как нужно закодировать букву Г,чтобы длина кода была минимальной и допускалось однозначное разбиение кодированного сообщения на буквы?

    www.ikt1793.ru

    Представление нечисловой информации в компьютере

    Главная | Информатика и информационно-коммуникационные технологии | Планирование уроков и материалы к урокам | 10 классы | Планирование уроков на учебный год | Представление текстовой информации в компьютере





    Представление текстовой информации в компьютере

    Изучив эту тему, вы узнаете и повторите:

    - как в компьютере представляется текстовая информация;
    - что такое ASCII и Unicode;
    - как в компьютере представляется графическая информация;
    - какие форматы используются при хранении графических файлов;
    - как в компьютере представляется звуковая информация;
    - какие форматы используются при хранении звуковых файлов.

    Компьютеры не с самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации.

    1. Таблица кодирования ASCII.

    А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.

    Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите — его мощностью.

    Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 в 8 степени равно 256. 8 битов = 1 байт, следовательно:

    Один символ в компьютерном тексте занимает 1 байт памяти.

    Как мы выяснили, традиционно для кодирования одного символа используется 8 бит. И, когда люди определились с количеством бит, им осталось договориться о том, каким кодом кодировать тот или иной символ, чтобы не получилось путаницы, т.е. необходимо было выработать стандарт – все коды символов сохранить в специальной таблице кодов. В первые годы развития вычислительной техники таких стандартов не существовало, а сейчас наоборот, их стало очень много, но они противоречивы. Первыми решили эти проблемы в США, в институте стандартизации. Этот институт ввел в действие таблицу кодов ASCII (AmericanStandardCodeforInformationInterchange – стандартный код информационного обмена США).

    Рассмотрим таблицу кодов ASCII.

    Пояснение: раздать учащимся распечатанную таблицу кодов ASCII.

    Таблица ASCII разделена на две части. Первая – стандартная – содержит коды от 0 до 127. Вторая – расширенная – содержит символы с кодами от 128 до 255.

    Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы.

    Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам.

    Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы.

    Стандартная часть таблицы кодов ASCII

    Если вы внимательно посмотрите на обе части таблицы, то увидите, что все буквы расположены в них по алфавиту, а цифры – по возрастанию. Этот принцип последовательного кодирования позволяет определить код символа, не заглядывая в таблицу.

    Коды цифр берутся из этой таблицы только при вводе и выводе и если они используются в тексте. Если же они участвуют в вычислениях, то переводятся в двоичную систему счисления.

    Коды национального (русского) алфавита расширенной частитаблицы ASCII


    Альтернативные системы кодирования кириллицы.

    Тексты, созданные в одной кодировке, не будут правильно отображаться в другой.В настоящее время для поддержки букв русского алфавита (кириллицы) существует несколько кодовых таблиц (кодировок), которые используются различными операционными системами, что является существенным недостатком и в ряде случаев при-водит к проблемам, связанным с операциями декодирования числовых значений символов.

    Для разных типов ЭВМ используются различные кодировки:

    В настоящее время существует 5 кодовых таблиц для русских букв: Windows (СР(кодовая страница)1251), MS – DOS (СР(кодовая страница)866), KOИ – 8 (Код обмена информацией, 8-битный) (используется в OS UNIX), Mac (Macintosh), ISO (OS UNIX).

    Одним из первых стандартов кодирования кириллицы на компьютерах был стан-дарт КОИ-8.

    Национальная часть кодовой таблицы стандарта КОИ8-Р

    В настоящее время применяется и кодовая таблица, размещенная на странице СР866 стандарта кодирования текстовой информации, которая используется в операционной системе MS DOS или сеансе работы MS DOS для кодирования кириллицы.

    Национальная часть кодовой таблицы СР866

    В настоящее время для кодирования кириллицы наибольшее распространение получила кодовая таблица, размещенная на странице СР1251 соответствующего стандарта, которая используется в операционных системах семейства Windows фирмы Microsoft.

    Национальная часть кодовой таблицы СР1251

    Во всех представленных кодовых таблицах, кроме таблицы стандарта Unicode, для кодирования одного символа отводится 8 двоичных разрядов (8 бит).

    В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).

    
    		N = 2i 
    		2i = 216 = 65536
    		N = 65536 	
    		N – мощность алфавита символов в кодовой таблице Unicode.
    		i – информационный вес символа
    

    Основополагающая таблица использования кодового пространства Unicode

    Использование Unicode значительно упрощает создание многоязычных документов, публикаций и программных приложений.

    Рассмотрим примеры.

    1) Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех пяти кодировках. Воспользуемся компьютерным калькулятором для перевода чисел из десятичной в шестнадцатеричную систему счисления.

    Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц:

    
    	КОИ8-Р:	252 247 237
    	СР1251:	221 194 204
    	СР866:	157 130 140
    	Мас:		157 130 140
    	ISO:		205 178 188
    

    Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:

    
    	КОИ8-Р:    FCF7 ED
    	СР1251:    DDC2 CC
    	СР866:    	9D 82 8C
    	Мас:     	9D 82 8C
    	ISO:    	CDB2 BC
    

    2) Определить числовой код символа в кодировке Unicode с помощью тексто-вого редактора MicrosoftWord.

    1. В операционной системе Windows запустить текстовый редактор MicrosoftWord.

    2. В текстовом редакторе MicrosoftWord ввести команду [Вставка-Символ…]. На экране появится диалоговое окно Символ. Центральную часть диалогового окна занимает фрагмент таблицы символов.

    3. Для определения числового кола знака кириллицы с помощью раскрывающегося списка Набор: выбрать пункт кириллица.

    4. Для определения шестнадцатеричного числового кода символа в кодировке Unicode с помощью раскрывающегося списка из: выбрать тип кодировки Юникод (шестн.).

    5. В таблице символов выбрать символ Э. В текстовом поле кодзнака : появится его шестнадцатеричный числовой код (в данном случае 042D).

    Решите задачи:

    №1. Закодируйте с помощью таблицы ASCII слова: А) Excel; Б) Access; В) Windows; Г) ИНФОРМАЦИЯ.

    №2. Буква «i» в таблице кодов имеет код 105. Не пользуясь таблицей, расшифруйте следующую последовательность кодов: 102, 105, 108, 101.

    №3. Десятичный код буквы «е» в таблице ASCII равен 101. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову help.

    №4. Десятичный код буквы «i» в таблице ASCII равен 105. Не пользуясь таблицей, составьте последовательность кодов, соответствующих слову link.

    №5. Декодируйте следующие тексты, заданные десятичным кодом:

    
    	А) 192 235 227 238 240 232 242 236;
    	Б) 193 235 238 234 45 241 245 229 236 224;
    	В) 115 111 102 116 119 97 114 101.
    

    №6. Во сколько раз увеличится информационный объем страницы текста при его преобразовании из кодировки Windows 1251 (таблица кодировки содержит 256 символов) в кодировку Unicode (таблица кодировки содержит 65536 символов)?

    №7. Каков информационный объем текста, содержащего слово ПРОГРАММИРОВАНИЕ:

    
    	А) в 16-битной кодировке;   
    	Б) в 8-битной кодировке.
    

    №8. Текст занимает ¼ Кбайта. Какое количество символов он содержит?

    №9. Текст занимает полных 6 страниц. На каждой странице размещается 30 строк по 80 символов. Определить объем оперативной памяти, который займет этот текст.

    №10. Свободный объем оперативной памяти компьютера 320 Кбайт. Сколько страниц книги поместится в ней, если на странице:

    
    	А) 32 строки по 32 символа; 
    	Б) 64 строки по 64 символа; 
    	В) 16 строк по 32 символа.
    

    №11. Текст занимает 20 секторов на двусторонней дискете объемом 360 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст?

    image

    xn----7sbbfb7a7aej.xn--p1ai

    Кодирование информации

    Код — это набор условных обозначений (или сигналов) для записи (или передачи) некоторых заранее определенных понятий.

    Кодирование информации – это процесс формирования определенного представления информации. В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

    Обычно каждый образ при кодировании (иногда говорят — шифровке) представлении отдельным знаком.

    Знак - это элемент конечного множества отличных друг от друга элементов.

    В более узком смысле под термином "кодирование" часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

    Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (например, звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью программ для компьютера можно выполнить преобразования полученной информации, например "наложить" друг на друга звуки от разных источников.

    Аналогичным образом на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

    Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми. Ввод чисел в компьютер и вывод их для чтения человеком может осуществляться в привычной десятичной форме, а все необходимые преобразования выполняют программы, работающие на компьютере.

    Способы кодирования информации.

    Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.

    Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

    Кодирование символьной (текстовой) информации.

    Основная операция, производимая над отдельными символами текста - сравнение символов.

    При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.

    Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.

    Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.

    Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.

    Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.

    Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.

    Кодирование числовой информации.

    Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.

    Основной системой счисления для представления чисел в компьютере является двоичная позиционная система счисления.

    Кодирование текстовой информации

    В настоящее время, большая часть пользователей, при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам нужно.

    10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО: 155 символов, что соответствует 8 бит информации.

    Единицы измерения информации.

    1 байт = 8 бит

    1 Кбайт = 1024 байтам

    1 Мбайт = 1024 Кбайтам

    1 Гбайт = 1024 Мбайтам

    1 Тбайт = 1024 Гбайтам

    Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

    Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой

    Основным отображением кодирования символов является код ASCII - American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.

    Кодирование графической информации.

    Важным этапом кодирования графического изображения является разбиение его на дискретные элементы (дискретизация).

    Основными способами представления графики для ее хранения и обработки с помощью компьютера являются растровые и векторные изображения

    Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение этих элементарных отрезков определяется координатами точек и величиной радиуса. Для каждой линии указывается двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.

    Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.

    Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.

    Pixel (picture element - элемент рисунка) - минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.

    В соответствии с матричным принципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.

    Качество изображения будет тем выше, чем "плотнее" расположены пиксели, то есть чем больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.

    Для черно-белого изображения код цвета каждого пикселя задается одним битом.

    Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.

    Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование трех байтов (24 битов) для кодирования цвета одной точки позволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета - так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.

    Кодирование звуковой информации.

    Из курса физики вам известно, что звук - это колебания воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение.

    Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел, а для этого его необходимо дискретизировать и оцифровать.

    Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьютера.

    mirznanii.com

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *