Тест по Общей информатике с ответами по теме ‘Представление информации в ЭВМ’
1. Фундаментальные основы информатики2. История развития и классификация ЭВМ3. Представление информации в ЭВМ4. Основы конструкции ЭВМ5. Операционные системы ЭВМ6. Основы алгоритмизации и языки программирования7. Прикладное программное обеспечение.8. Вычислительные системы и сети1. Информация в ЭВМ кодируется:
- 1. в двоичной системе счисления
- 2. в десятичной системе счисления
- 3. в символах.
2. Система счисления — это:
- 1. представление чисел в экспоненциальной форме
- 2. представление чисел с постоянным положением запятой
- 3. способ представления чисел с помощью символов, имеющих определенные количественные значения.
3. В зависимости от способа изображения чисел системы счисления делятся на:
- 1. арабские и римские
- 2. позиционные и непозиционные
- 3. представленные в виде ряда и в виде разрядной сетки.
4. Двоичная система счисления имеет основание Р.:
- 1. Р = 2
- 2. Р = 0
- 3. Р = 1.
5. Для представления чисел в восьмеричной системе счисления используют цифры:
- 1. 0 — 8
- 2. 0 — 7
- 3. 1 — 8.
6. Для представления чисел в шестнадцатеричной системе счисления используют:
- 1. цифры 0 — 9 и буквы A — F
- 2. буквы A -Q
- 3. числа 0 + 15.
7. В дробных числах целая часть от дробной отделяется:
- 1. запятой
- 2. точкой
- 3. апострофом.
8. Число с плавающей точкой изображается в виде:
- 1. основания системы и мантиссы
- 2. мантиссы и порядка
- 3. определяемого количества разрядов.
9. Минимальная единица информации в двоичном коде — это
- 1. параграф
- 2. байт
- 3. бит.
10. Один бит содержит:
- 1. 0 или 1
- 2. одну цифру
- 3. один символ.
11. Один байт содержит:
- 1. 2 бита
- 2. 8 бит
- 3. 16 бит.
12. Стандартным кодом для обмена информации является:
- 1. код ACCESS
- 2. код WORD
- 3. код ASCII.
13. Для перевода чисел из одной системы счисления в другую существуют:
- 1. таблицы перевода
- 2. правила перевода
- 3. соответствующие стандарты.
geetest.ru
Сколько бит содержит 1 байт, и почему? — журнал «Рутвет»
Оглавление:
- Хранение данных в компьютерной памяти
- Что такое бит?
- Что такое байт?
- Особенности двоичной системы исчисления
- Почему информацию шифруют в двоичном коде?
- Всегда ли байт содержал 8 бит?
- Почему победил именно 8-битный стандарт?
- Где применяются биты с байтами?
Абсолютно любая информация, заложенная в компьютере и на любых его носителях или периферийных устройствах, будь то стартовая программа BIOS или любые текстовые и графические документы, хранятся в его памяти в виде битов и байтов. Поэтому людей, пытающихся понять принцип работы компьютера, очень интересуют вопросы, касающиеся этих мельчайших элементов информации, а также, например, то, сколько бит в 1 байте информации содержится.
Хранение данных в компьютерной памяти
Компьютерная память – это невообразимо большое число ячеек, заполненных лишь единицами и нулями. Ячейкой называется минимальное звено диска, к которому считывающее устройство способно обратиться. В современных компьютерах она физически совпадает с триггером, который настолько мал, что под обычным оптическим микроскопом его увидеть почти невозможно. Каждая ячейка имеет свой уникальный адрес, по нему к ней обращаются любые программы.
Чаще всего ячейка совпадает с одним байтом. Но, поскольку архитектура компьютера может иметь разную разрядность, в ячейке может умещаться 2,4 и 8 байт. Электронные устройства воспринимают байт как мельчайшую единицу информации, хотя на самом деле он ещё делится на более элементарные ячейки – биты. Если в байте может быть закодирован единичный символ – цифра или буква, то в один бит они не «влезут». Хотя технически допустимо оперирование контроллеров единичными битами, но практически это почти не используется. Обычно происходит обращение либо к целым байтам, либо к их группам.Что такое бит?
Чтобы понять, скольким битам равен 1 байт, нужно понять, что представляет собой бит. Часто битом называют мельчайшую единицу информации, но это определение не слишком точное, поскольку достаточно размыто само понятие информации. Более точно выглядит формулировка, определяющая бит, как букву компьютерного алфавита. Сам термин «бит» является сокращением английского словосочетания «binary digit», что в переводе на русский означает двоичная цифра. Компьютерный алфавит до невозможности прост, поскольку включает в себя лишь два символа – 0 и 1, что выражается как отсутствие или наличие сигнала или ложь и истина. С помощью этого простейшего набора логически можно описать абсолютно всё. Не более чем миф третье состояние компьютера – молчание, когда он не передаёт сигналы.
С точки зрения информации сам по себе символ не имеет никакой ценности, поскольку при виде нуля или единицы совершенно невозможно понять, к какого рода информации данное значение может относиться. И независимо от того, 1 байт сколько бит включает, любые программы, тексты и картинки состоят лишь из нулей и единиц. Поэтому в качестве самостоятельной единицы бит оказался не слишком удобен. Поэтому для кодирования удобоваримой информации биты потребовалось объединить в байты.
Что такое байт?
Если бит содержит в себе букву компьютерного алфавита, то байт можно сравнить со словом. В одном байте может содержаться целое число или часть большого числа, текстовый символ, два маленьких числа и прочее. То есть в нём уже присутствует минимальный объём осмысленной информации.Многие любознательные пользователи и начинающие программисты интересуются тем, сколько бит содержит 1 байт.
В современных компьютерах это всегда 8 бит. Но если бит может иметь только 2 значения, то 8 битов байта дают уже 256 различных вариантов (два в восьмой степени даёт число 256).
Например, один бит даёт значения 0 или 1. Два бита уже позволяют комбинации: 00, 01, 10 и 11. Если же используется 8 бит, то в диапазоне между 00000000 и 11111111 помещается именно 256 значений. Не так сложно и запомнить число битов в байте, и сколько значений может принимать каждый байт. В зависимости от кодировки (Юникод, ASCII и прочих) каждое сочетание несёт в себе ту или иную информацию. По этой причине попытка ввести данные на русском языке приводит к их выводу в виде своеобразных символов.
Особенности двоичной системы исчисления
Двоичная система позволяет все те же манипуляции с числами, что и классическая десятичная система: составленные из нулей и единиц числа можно складывать, умножать, делить и вычитать. Но при этом вся математика здесь обходится двумя цифрами, из-за чего она гораздо удобнее для шифрования информации. Любая позиционная система исчисления имеет разряды для чисел: единицы, десятки, сотни и т.д. Но если в десятичной системе максимальная величина одного разряда равна 9, то в бинарной системе это 1. Но поскольку в бинарном разряде есть лишь два значения, то длина бинарных числе очень быстро возрастает. Например, число 9 там выразится как 1001, то есть потребуется 4 символа, при этом каждый двоичный символ будет занимать один бит.
Почему информацию шифруют в двоичном коде?
Десятичная кодировка более удобна для ввода и вывода данных, зато двоичная облегчает процесс её преобразования. Есть ещё и другие системы, основанные на 8 и 16 символах, которые используются для переводов машинных кодов в приемлемую форму. С точки зрения логики двоичная система идеальна. Условно единице присвоено значение «да» или истинности, а ноль в противовес означает «нет» и ложь. Любой прямой вопрос можно разложить на несколько более простых вопросов, имеющих ответы «да» и «нет». А третий вариант («неизвестно») окажется совершенно избыточным. Исследования в области вычислительной техники привели к изобретению трёхразрядных единиц хранения данных, которые получили название тритов.
Диапазон их значений следующий:
- 0 означает пустую ёмкость;
- 1 наполовину заполненная ёмкость;
- 2 полная ёмкость.
Но двоичная система оказалась более гибкой и логичной, поэтому и легла в основу компьютерной логики.
Видео о том, сколько бит в 1 байте информации
Всегда ли байт содержал 8 бит?
Ответ на вопрос, сколько битов содержится в 1 байте, не всегда был одинаковым, а когда-то он и вовсе не имел точного ответа. Под байтом первоначально понималось машинное слово – такое количество бит информации, которое ЭВМ могла обработать за один такт или рабочий цикл. Когда ЭВМ занимали целые залы, её логические схемы оперировали байтами разных размеров: у одних было 6 бит, а в первых моделях компьютеров IBM байт состоял из 9 бит. На данный момент практически победил стандарт байта из 8 бит, поэтому его даже называют единицей информации, включающей 8 бит. Но в некоторых архитектурах по-прежнему используются 32-битные байты, считающиеся за машинное слово. Подобная архитектура используется в сигнальных процессорах и суперкомпьютерах, а во всех широко использующихся ноутбуках, компьютерах и мобильных устройствах только 8-битные.
Почему победил именно 8-битный стандарт?
8-битный стандарт байта стал доминантным из-за победы на рынке платформы IBMPC, которая использовала чрезвычайно популярный процессор Intel 8086. Благодаря её распространённости в 70-х годах прошлого века 8-битный байт стал фактически стандартом. Удобство 8-битного стандарта заключается в том, что в нём точно умещаются две цифры десятичной системы, в то время как 6-битная система способна вместить только один знак, при этом незаполненными останутся 2 бита. В 9-битный байт вписываются 2 знака, но остаётся неиспользованным один бит. К тому же восемь – это два в кубе, что также считается удобным.
Где применяются биты с байтами?
Неопытные пользователи часто путают обозначения бита и байта. Им нужно, в первую очередь, обратить внимание на написание обозначения. Сокращение байта использует заглавную букву «Б» или «B» в английском варианте, а более мелкому биту достались соответственно строчные буквы «б» или «b». Правда есть вероятность, что перепутан регистр, а некоторые программы переводят весь текст автоматически в верхний или нижний регистры. Поэтому лучше просто разделить то, что обычно измеряется в байтах, а что – в битах.
В байтах традиционно выражаются объёмы: флешки, жёсткого диска, дискеты, CD и любого другого носителя информации, причём в более масштабных единицах (килобайтах, мегабайтах, гигабайтах и т.д.).
Битами же измеряют скорость или пропускную способность канала, например, линии Интернета, здесь также господствуют порядковые величины – мегабиты и т.д. Скорость скачивания файлов также отражается в битах, которые при желании можно перевести в байты – просто умножить известную величину на восемь. Наоборот, делением объёма в байтах на восемь можно получить биты, хотя практически это вряд ли кому необходимо.
А Вы часто используете информацию о битах и байтах в жизни, и где Вы её применяете? Расскажите об этом в комментариях.
www.rutvet.ru
Сколько бит содержит один байт. Единицы измерения объема информации
Все разделы сайта сайт
На этой странице мы подробно рассмотрим структуру файла
Вы знаете из чего состоит компьютерный файл? Нет? Тогда вам будет интересно узнать это, а также много забавных вещей:)))
Например, как компьютер определяет эротические фотографии? То есть он может даже определить и сравнить фото, то есть найти одинаковые фотографии, не важно в каком они формате: jpg или gif
Как же такое возможно? Все очень просто. Структура любого изображения состоит всего (!!!) из двух цифр, которые сменяют друг друга в определенной последовательности.
Начнем сначала…
Размер байта
Из чего состоит один байт ? Из каких символов и числовых значений?
1 байт состоит из восьми битов… ниже будет большой видео-урок
а также приведена специальная таблица.
В связи с той неразберихой, которая царит в обозначениях емкости винчестеров (жестких дисков), очень многие пользователи путаются в терминах.
А изготовители компьютерных девайсов и продавцы в магазинах вполне сознательно «путают» понятия «мегабайт» и «гигабайт» с миллионами и миллиардами байтов.
Наверняка вы сами
были удивлены несоответсвием заявленного
количества гигабайтов и мегабайтов в
купленно жестком диске, будь он внутренний
или внешний, с накопителями всегда такая
история:)
Как узнать сколько байт в килобайте или мегабайте ? Вопрос не праздный:) Многие люди, которым за тридцать не учили в школе информатику и теперь пополняют отсутствие знаний в интренете. Вот подсказка:
А для быстрого и точного числового
перевода значений
лучше пользоваться таким конвертером:
В этом уроке мы будем разбирать тип файла bmp. Вначале немного окунемся в школьный курс информатики. Итак, разберем этот файл по байтам.
Для тех кто не имеет представление что такое биты, байты, килобиты, мегабайты и т.п. выше на странице приведена подробная таблица с данными.
Посмотрите отличный большой видеоурок Артема Кашеварова. Эта информация не совсем для новичков (чайников), хотя им тоже будет очень интересно и познавательно посмотреть!
Не забудьте включить колонки
================Что будет в этом видео-уроке? Заглянем
в структуру файла .
Например, возьмем точечный рисунок.
Разберем его на байты.
Для тех кто не знает, в видео-уроке будет рассказано и показано, что такое бит, байт, килобайт, килобит, мегабайт.
А также, обработка по вертикали. Двоичный код байта и как определить насколько сжато изображение
Размер байта, сколько битов в байте и т.п. в десятиричной системе
Как просчитывать данные и работать в программной среде Delphi … поменять разрядность и битность изображения… как оно тогда изменится внешне?
Сколько занимает один байт, как он отображается и как записывыется изображение в байтах …
Как хранятся пиксели по горизонтали и вертикали, последовательность пикселей… как устроено изображение, посмотрим на глубину цвета изображения.
Затем редактируем код обработки изображения, вычислить строки файла, изменение формата изображения, а также обзор структуры файла — из чего состоит файл изображения
Что такое операция «mod», чтение изображение по байтам…
Вы узнаете, что такое информационные байты и палитра изображения, каковы его цветовые составлящие, что такое символьный формат и виды форматов файлов .
Изменение формата изображения
В конце урока вы видите создание программы и азы программирования на Delhi … а также, как изменить размер изображения в пикселах
Думаю, про биты и про байты Вы уже знаете, и про килобайты с мегабитами тоже… но всё ли Вы про них знаете? Давайте проверим, ответьте, пожалуйста, мне на вопрос:
Как Вы думаете, сколько в одном килобайте содержится байт ? Может быть 1024? Или все-таки 1000?
Правильный ответ в этом IT-уроке.
Теперь вспомним (или узнаем) про основные единицы измерения данных.
Бит (bit ) – базовая единица измерения информации, может содержать только одну двоичную цифру. Бит может принимать только два значения: «0» или «1».
Байт (byte ) – также единица количества информации, один байт равен восьми битам (1 Байт = 8 бит).
Это довольно маленькие объемы данных (можно сравнить с измерением веса в «граммах»), поэтому…
Приставки К, М, Г, Т («кило-», «киби-» и т.д.)
…чтобы измерять большие объемы данных, используют кратные приставки (это как «кило грамм»). Привычная же нам приставка «кило -» означает умножение на 1000 (10 3), но в двоичной системе счисления используют два в десятой степени (2 10).
Копирование запрещено
Всё перечисленное в этом уроке в сокращенном виде я занес в .
А мы узнаем, как измеряется скорость передачи данных и как хитрят провайдеры, рекламирующие свои «огромные» скорости подключения к Интернету.
Чтобы не пропустить новый урок, подписывайтесь на новости по вот этой ссылке (а в пришедшем письме подтвердите подписку).
В современном веке высоких технологий большое значение имеет информация. Каждый день человек пропускает через себя и свои гаджеты огромный поток информации, поэтому необходимо разбираться в единицах измерения информации. В частности, для многих особенно остро стоит вопрос о том, сколько мегабайт в гигабайте, поскольку это помогает учитывать необходимый объем трафика, предоставляемого провайдером интернет-подключения. На практике также часто может потребоваться перевести мегабайты в байты или мегабиты в мегабайты.
В современной вычислительной технике (компьютерах) наименьшей единицей информации является бит. Одним битом кодируется один единственный символ в двоичной системе. То есть один бит, позволяет записать в какой-либо из разрядов значение «0» или «1».
Сколько бит в байте
Очевидно, что одним битом, несущим в себе одно лишь число, закодировать какое-либо число невозможно. Поэтому следующ
erfa.ru
сколько бит содержит 1 байт?
Добро пожаловать Валентина Головко 2 (114) сколько бит содержит 1 байт? 8 лет В лидерыОтветы
Эмилия 4 (958)1 байт=8 бит
0 нравится комментировать 8 лет Ответы Mail.Ru Все вопросыКатегории
Избранные
КАТЕГОРИИ
Авто, Мото Автострахование Выбор автомобиля, мотоцикла Оформление авто-мото сделок ГИБДД, Обучение, Права Сервис, Обслуживание, Тюнинг ПДД, Вождение Прочие Авто-темы Автоспорт Бизнес, Финансы Макроэкономика Производственные предприятия Собственный бизнес Страхование Банки и Кредиты Недвижимость, Ипотека Бухгалтерия, Аудит, Налоги Остальные сферы бизнеса Долги, Коллекторы Знакомства, Любовь, Отношения Любовь Знакомства Отношения Расставания Дружба Прочие взаимоотношения Компьютеры, Связь Интернет Железо Программное обеспечение Прочее компьютерное Мобильные устройства Офисная техника Мобильная связь Образование Детские сады Школы ВУЗы, Колледжи Дополнительное образование Образование за рубежом Прочее образование Философия, Непознанное Мистика, Эзотерика Психология Религия, Вера Прочее непознанное Философия Путешествия, Туризм Самостоятельный отдых Документы Отдых в России Отдых за рубежом Прочее туристическое Семья, Дом, Дети Строительство и Ремонт Беременность, Роды Воспитание детей Мебель, Интерьер Домашняя бухгалтерия Домоводство Загородная жизнь Свадьба, Венчание, Брак Организация быта Прочие дела домашние Спорт Футбол Хоккей Экстрим Другие виды спорта Занятия спортом События, результаты Спортсмены Зимние виды спорта Стиль, Мода, Звезды Мода Светская жизнь и Шоубизнес Прочие тенденции стиля жизни Стиль, Имидж Темы для взрослых Другое О проектах Mail.ru Ответы Mail.ru Почта Mail.ru Прочие проекты Новости Mail.ru Агент Mail.ru Мой Мир Mail.ru ICQ Облако Mail.ru Красота и Здоровье Коррекция веса Здоровый образ жизни Врачи, Клиники, Страхование Болезни, Лекарства Косметика, Парфюмерия Баня, Массаж, Фитнес Уход за волосами Маникюр, Педикюр Детское здоровье Салоны красоты и СПА Прочее о здоровье и красоте Животные, Растения Домашние животные Комнатные растения Сад-Огород Дикая природа Прочая живность Города и Страны Вокруг света Карты, Транспорт, GPS Климат, Погода, Часовые пояса Коды, Индексы, Адреса ПМЖ, Недвижимость Прочее о городах и странах Общество, Политика, СМИ Общество Политика Прочие социальные темы Средства массовой информации Еда, Кулинария Закуски и Салаты Первые блюда Вторые блюда Напитки Десерты, Сладости, Выпечка Консервирование Торжество, Праздник Готовим детям Готовим в … Покупка и выбор продуктов На скорую руку Прочее кулинарное Фотография, Видеосъемка Обработка и печать фото Обработка видеозаписей Выбор, покупка аппаратуры Уход за аппаратурой Техника, темы, жанры съемки Прочее фото-видео Товары и Услуги Идеи для подарков Техника для дома Прочие промтовары Сервис, уход и ремонт Прочие услуги Досуг, Развлечения Хобби Концерты, Выставки, Спектакли Охота и Рыбалка Клубы, Дискотеки Рестораны, Кафе, Бары Советы, Идеи Игры без компьютера Прочие развлечения Новый Год День Святого Валентина Восьмое марта Наука, Техника, Языки Гуманитарные науки Естественные науки Лингвистика Техника Работа, Карьера Написание резюме Подработка, временная работа Кадровые агентства Отдел кадров, HR Профессиональный рост Смена и поиск места работы Обстановка на работе Трудоустройство за рубежом Прочие карьерные вопросы Гороскопы, Магия, Гадания Гороскопы Гадания Сны Прочие предсказания Магия Юридическая консультация Административное право Гражданское право Конституционное право Семейное право Трудовое право Уголовное право Финансовое право Жилищное право Право социального обеспечения Военная служба Паспортный режим, регистрация Прочие юридические вопросы Юмор Золотой фонд Искусство и Культура Музыка Литература Кино, Театр Живопись, Графика Архитектура, Скульптура Прочие искусства Компьютерные и Видео игры Прочие Браузерные Клиентские Консольные Мобильные Программирование Другие языки и технологии Java JavaScript jQuery MySQL Perl PHP Python Веб-дизайн Верстка, CSS, HTML, SVG Системное администрирование Домашние задания Другие предметы Литература Математика Алгебра Геометрия Иностранные языки Химия Физика Биология История География Информатика Экономика Русский язык Обществознание Плесский колледж бизнеса и туризма GS LogisticaПроекты
Mail.RuПочтаМой МирИгрыНовостиЗнакомстваПоискВсе проекты Вход в личный кабинет Помощь Обратная связь Полная версия Главная Все проекты© Mail.Ru, 2018
touch.otvet.mail.ru
Существует ли размер меньше бита!?
На пальцах: 1 бит — это объём информации о событии, имеющем два равновероятных, взаимоисключающих исхода. Если эти исходы не равновероятны, то объём информации в таком сообщении меньше одного бита. Предельный случай: вероятность одного из исходов = 1 — тогда кол-во информации в сообщении об исходе = 0…
смотря по химической таблице (нрепомню какой, или физической хД) есть например микробит)))
а х3) наврядли…
Если бит как информация, то нет, а если пофантазировать, то: Бит — это триггер. А триггер состоит из транзисторов. Транзисторы состоят из атомов и т. д.
Бит — по сути логическая единица. Бит может быть равен 1 или 0, что соответсвенно означает «да» или «нет». Это уже программисты сложили биты в байты для того, чтоб код меньше занимал места на бумаге. И, согласись, работать лучше с F, чем с 11111111.
Вообще в теории информации может быть любое нецелое число бит, т. к. по Шеннону (родоначальнику теории информации) количество информации — это двоичный логарифм отношений вероятностей. Ну а логарифм принимает не только целые значения: <a rel=»nofollow» href=»http://ru.wikipedia.org/wiki/Бит» target=»_blank»>http://ru.wikipedia.org/wiki/Бит</a> В прикладной информатике, конечно же, нецелое количество бит никак не применяется, здесь — только целые биты.
Бит это символ одной перемены. А, что может быть меньше одно перемены? Свет можно либо включить, либо выключить, третьего не дано.
То же самое, что спрашивать, существует ли в 10-тичной системе исчисления что-нибудь меньше одной цифры )))
Может быть и меньше бита. И даже не в статистике. Бит имеет два значения. А «факт существования» — только одно, так как «факт несуществования» — общая категория. Любые наборы битов (типа байта) — вообще насыщены скрытой информацией. В том же байте биты, де факто, пронумерованы и отделены от всех остальных битов во вселенной. Эти скрытые данные всеми забыты, но они не просто есть — в них суть. Реальная информация состоит из «фактов существования» и связей между ними, фактически представляя собой ненаправленный граф с идентичными вершинами и рёбрами. Более сложная информация заключается уже в структуре этого графа. Но такого вам тут никто не расскажет, да и не поймёт то, что написано, здесь тоже практически никто…
touch.otvet.mail.ru
Один бит – сколько это?
Все просто, один бит – это количество информации, передаваемое одним бинарным сообщением, то есть одним сообщением из двух возможных. Например, ответ да/нет, 0/1 или влево/вправо.
Но не на столько просто. Важно, чтобы соблюдались два условия: третий варианта ответа невозможен и у вас до этого не было никакой информации о заданном вопросе. То есть, если вы спрашиваете у вашей новой знакомой, замужем ли она, то ее ответ почти никогда не будет содержать ровно один бит инормации. И не только потому, что кроме ответов да/нет она может ответить “не ваше дело” или “раведена”, но еще и потому что вы заранее можете оценить вероятность того, что она замужем: по ее возрасту, по поведению или по кольцу на пальце.
Хорошо, дальше все легко, два бита – это в два раза больше, чем один. Но что именно означает “в два раза больше”?
Во-первых, для простоты давайте абстрагируемся от формы ответа и будем считать, что один из двух возможных ответов всегда 0, а другой – 1: нет – 0, да – 1 или влево – 0, вправо – 1 и т. д.
Итак, двумя битами можно, например, представить информацию о маршруте, на котором есть две развикли, то есть всего четыре маршрута: дважды влево, влево-вправо, вправо-влево и дважды вправо. Нетрудно посчитать, что если маршрутов восемь, то для выбора одного из них, нужно три бита. А в общем случае, для кодирования одного из N состояний (о которых у нас нет предварительной информации), требуется log2 N бит.
На этом все. Теперь вы знаете все о том, как измеряется количество информации.
На самом деле нет. Жизнь была бы слишком простой.
Где-то в этих рассуждениях есть фундаментальная ошибка. В самом деле, посмотрите на следующие два сообщение, где каждый бит закодирован цифрами 0 и 1:
первое: 010010111010001011100100101010011110
,
второе: 010101010101010101010101010101010101
.
Забудьте все, что я вам сказал до этого и, основываясь только на интуиции, ответьте на вопрос, в каком сообщении больше информации.
М-да. Что же делать? Не то, чтобы предыдущее определение было полностью неверным, но оно не соответствует нашему интуитивному пониманию информации.
Интуитивно, в первом сообщении больше информации, потому что оно выглядит более случайным. А еще важнее то, что если вы захотите продиктовать обе последовательности по телефону, то в первом случае трудно придумать что-то более оптимальное, чем просто проговаривание цифр одна за другой, в то время как для передачи второго, можно просто сказать “восемнадцать раз 01”.
Может быть правильно было посчитать сколько информации в сообщении “восемнадцать раз” и добавить два? Это можно попытаться сделать: записать восемнадать в двоичной системе – 10010, а потом закодировать понятие “раз”: запишем 0, если следующие цифры – непосредственно само сообщение, и 1, если используется формулировка “N раз M”, где M – сообщение, которое предполагается повторить N раз. Саму формулировку “N раз M” запишем так: сначала N в двоичной системе, причем каждую цифру запишем дважды (00111100 вместо 0110), затем цифры 01, а затем сообщение M. Цифры числа N будем дублировать, чтобы было понятно, когда заканчивается N и начинается M, 01 будет играть роль разделителя, ведь если его пропутить, то если M начинается с двух одинаковых цифр, то будет непонятно, это окончание N или начало M.
Этот нехитрый трюк позволяет записать исходное сообщение из 18 пар 01 строкой 111000011000101, а это всего 15 бит. Правда сообщения из цифр, в которых нет повторяющихся последовательностей, придется записывать по-прежнему полностью, да еще и в придачу приписывать ко всем 0, чтобы отличить их от закодированных.
Зачем все это? Ах да, мы хотели оценить количество информации в сообщении таким образом, чтобы чтобы это больше соответствовало нашему интуитивному понятию информации. Получается в нашем исходном первом сообщении 19 бит информации, а во втором – 15. Что ж, это уже лучше. Немного смущает тот факт, что в первом сообщении мы теперь считаем один “лишний” бит, но зато наша оценка больше соответствует нашей интуиции: во втором сообщении информации меньше.
Ну как, удалось ли мне вас убедить, то такая оценка лучше, чем простой подсчет цифр?
Сомневаюсь.
Но нельзя сказать, что идея совсем безнадежна. Не будем ее отбрасывать, а вместо этого попробуем ее немного улучшить.
Во-первых, смущает то, что ко всем сообщениям без повторений мы приписывам 0, а во вторых даже если повторения есть, иногда закодировав сообщение вышеописанным способом, цифр становится больше а не меньше.
Но если подумать, первый недостаток не так уж и важен при оценке очень длинных сообщений, а от второго недостатка можно избавиться, если для таких сообщений не использовать кодирование, а записывать их как есть.
Более фундаментальную проблему мы увидим, если попытаемся оценивать количество инофрмации в таких сообщениях, где нет повторений, а вместо этого угадывается другая регулярность. Например, интуиция подсказывае, что во втором сообщении меньше информации:
001001011001010100011000010000010110
101001000100001000001000000100000001
Потому что, опять же, если представить, что мы заходим его продиктовать по телефону, скорее всего мы скажем что-то вроде “восемь единиц, разделенных нулями, причем количество нулей увеличивается каждый раз на один, то есть один, ноль, один, два нуля, один, три нуля и т. д.”
Эта формулировка кажется длинной и запутанной, и возможно на практике некоторые предпочтут проговорить все цифры как есть, но я готов поспорить, что если бы эта последовательность состояла из миллиона цифр, то вы бы поменяли свое мнение.
Тогда можно действовать по старому плану: придумать как закодировать нулями и единицами фразы типа “N единиц, разделенных нулями…” и т. д.
Ну а теперь, я бы хотел спросить как на счет строки 1000000000000000000000000001, но боюсь, что вы начнете в меня кидать тухлыми помидорами, ведь примеров строк с различными регуляностями бесконечно много. И даже если согласиться, что оценка, использующая то или иное кодирование, имеет некоторый смысл, она никогда не будет идиальной, потому что всегда найдется регулярность, для которой мы еще не придумали способ кодирования.
А кроме того, как быть, если одну и ту же строку можно закодировать несколькими способами?
На этот вопрос есть простой ответ, который предложил Рей Соломонофф в 1960 году.
Вместо придумывания разных способов кодирования регулярных (в каком бы то ни было смысле) строк, мы воспользуемся какой-нибудь универсальной алогритмической моделью, например универсальной машиной Тьюринга. То есть, для оценки количества информации в строке, мы выпишем все возможные описания машин Тьюринга вместе с исходными состояниями ленты такие, что при после окончании работы машины, на ленте будет записана наша исходная строка. Из всех этих описаний мы выберем самое короткое. Именно его длинну мы и возьмем за меру количества информации.
Понятно?
Нет? Давайте по-порядку. Универсальная машина Тьюрига – это открытие, которое сделал Тьюринг в 1936 году. Оно описано в статье под названием “О вычислимых числах с приложением к проблеме разрешимости” на 36 страницах.
В статье описывается построение машины Тьюринга, которая является универсальной в том смысле, что она выполняет не заранее заданный алгоритм, а алгоритм, который записан на ленте в качестве входных данных. Причем этот алгоритм записывается в виде описания машины Тьюрига. То есть показывается по крайней мере теоретическая возможность создания машины, которая может выполнять любой алгоритм, неизвестный заранее в момент конструирования машины.
Сегодня этим вряд ли кого-то удивишь. Все современные, и не очень, компьютеры обладают этим свойством. Вы покупаете компьютер не под конкретную задачу, а универсальный. Какую задачу он будет решать, зависит от того, какую программу вы на нем запустите. Но в 1936 году это было фундаментальное открытие. До Тьюрига все создаваемые машины проектировались для выполнения одного конеретного алгоритма.
Если вы заинтересовались, я рекомендую прочитать книгу Пецольда “Annotated Turing”, в которой подробно, абзац за абзацем, разбирается работа Тюринга 1936 года. Ну а самые стойкие могут прочитать оригинальную статью.
В любом случае, какое отношение это имеет к нашей оценке информации? Универсальная машина Тьюрига – это, по просту говоря, компьютер с бесконечной памятью. Он считывает программу, записанную в памяти (в МТ – на ленте), и выполняет ее. Входные данные берутся тоже из памяти (записаны рядом на ленте).
Так вот, для оценки количества информации в сообщении, мы выпишем все возможные программы и их входные данные, такие, что результатом работы этих программ является наше сообщение. Самую короткую их этих программ (и ее иходные данные) мы и будем считать самым лучшим представлением сообщения, а ее длинну, опять включая входные данные, – количеством информации в нем.
Естественно, перебрать все возможные программы, не так-то просто. На самом деле, дела обстоят еще хуже – это сделать в общем случае невозможно. Если вам интересен этот вопрос, я рекомендую книгу Майкла Сипсера, в которой очень понятным языком описываются техники доказательства теорем о вычислительной неразрешимости различных проблем. Но для наших целей это не так уж и важно.
В самом деле, не всегда важно знать точное количество информации в сообщении, если есть возможность ее оценивать прибилизительно или сравнивать различные сообщения “по информативности” между собой.
Но если вы думаете, что такое определение имеет слишком ограниченную сферу применения, вы совершенно правы. Настолько правы, что никто на практике им не пользуется, а вместо этого по-старинке называет количеством информации число нулей и единиц в сообщении, каким бы простым и регулярным оно ни было.
А то, что я описал, называют дискриптивной сложностью, или просто сложностью. В некоторых источниках ее еще называют сложностью Колмогорова-Хайтина, а также алгоритмической энтропией, а также другими очень умными, но мало о чем говорящими, словами.
yarets.posthaven.com
Раздел 1. Основы информатики
I. Единицы измерения информации. Бит. Байт.
Согласно содержательному подходу в измерении информации (по определению К. Шеннона) 1 бит — объем информации такого сообщения, которое уменьшает неопределенность знания в два раза.
Если в результате получения сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет необходимости в дополнительной информации на эту тему. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было (нулевая информация).
Бит – наименьшая единица представления информации. В информатике часто используется величина, называемая байтом (byte) и равная 8 битам.
Байт – наименьшая единица обработки и передачи информации.
Бит позволяет выбрать один вариант из двух возможных; байт, соответственно, 1 из 256 (28).
Наряду с байтами для измерения количества информации используются более крупные единицы:
1 Кбайт (один килобайт) = 210 байт = 1024 байт;
1 Мбайт (один мегабайт) = 210 Кбайт = 1024 Кбайт;
1 Гбайт (один гигабайт) = 210 Мбайт = 1024 Мбайт.
В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:
1 Терабайт (Тб) = 1024 Гбайт = 240 байта,
1 Петабайт (Пб) = 1024 Тбайт = 250 байта.
Пример. Упорядочите по возрастанию следующую последовательность:
1024 Мбайт, 11 Петабайт, 2224 Гбайт, 1 Терабайт.
Решение. Сначала приведем величины измерения количества информации к единой величине, удобной для данной последовательности. В данном случае – это Гбайт.
1024 Мбайт = 1 Гбайт, что меньше 1 Терабайт = 1024 Гбайт, что, в свою очередь меньше 2224 Гбайт и меньше 11 Петабайт,
Следовательно, последовательность, упорядоченная по возрастанию, имеет вид:
1024 Мбайт, 1 Терабайт, 2224 Гбайт, 11 Петабайт
II. Кодирование информации.
Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (тексты, звуки, изображения, показания приборов и т.д.) для обработки на компьютере должна быть преобразована в числовую форму.
Переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки, называется кодированием информации.
Кодирование – это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы.
Как правило, все числа в компьютере представляются с помощью нулей и единиц, т.е. работа производится в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми.
1. Кодирование текста.
При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.
Алфавитный подход основан на том, что всякое сообщение можно закодировать с помощью конечной последовательности символов некоторого алфавита. Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.
Существует двоичный алфавит, который содержит только 2 символа, и его мощность равна двум.
Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т.к. 28 = 256.
8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Традиционно для кодирования одного символа используется количество информации, равное 1 байту (8 битам). Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111.
Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является таблица кодировки ASCII. Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов.
Кроме того, в настоящее время существует еще ряд кодовых таблиц для русских букв. К ним относится таблица кодировки КОИ8, использующая алфавит из 256 символов.
Широкое распространение получил новый международный стандарт UNICODE, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а 216 = 65536 различных символов.
Информативность последовательности символов не зависит от содержания сообщения.
Чтобы определить объем информации в сообщении при алфавитном подходе, нужно последовательно решить задачи:
Определить количество информации (i) в одном символе по формуле 2i = N, где N – мощность алфавита,
Определить количество символов в сообщении, учитывая знаки препинания и пробелы (m),
Вычислить объем информации по формуле: V = i * m.
Пример. Закодировано текстовое сообщение «Десять букв», определить его информационный объем по системе ASCII и UNICODE.
Решение. Сообщение содержит 11 символов. Один символ из алфавита ASCII несет 8 бит информации, поэтому информационный объем по системе ASCII составит 11*8 бит = 88 бита = 11 байт.
Один символ из алфавита UNICODE несет 16 бит информации или 2 байта, поэтому информационный объем по системе UNICODE составит 11*16 бит = 176 бит = 22 байта.
Для двоичного сообщения той же длины информационный объем составляет 11 бит, т.к. N = 2, i = 1 бит, m = 11, V = 11 бит.
studfile.net