6 Мбайт сколько байт и бит
Измерения в байтах | ||||||||
---|---|---|---|---|---|---|---|---|
ГОСТ 8.417—2002 | Приставки СИ | Приставки МЭК | ||||||
Название | Обозначение | Степень | Название | Степень | Название | Символ | Степень | |
байт | Б | 10 0 | — | 10 0 | байт | B | Б | 2 0 |
килобайт | Кбайт | 10 3 | кило- | 10 3 | кибибайт | KiB | КиБ | 2 10 |
мегабайт | Мбайт | 10 6 | мега- | 10 6 | мебибайт | MiB | МиБ | 2 20 |
гигабайт | Гбайт | 10 9 | гига- | 10 9 | гибибайт | GiB | ГиБ | 2 30 |
терабайт | Тбайт | 10 12 | тера- | 10 12 | тебибайт | TiB | ТиБ | 2 40 |
петабайт | Пбайт | 10 15 | пета- | 10 15 | пебибайт | PiB | ПиБ | 2 50 |
эксабайт | Эбайт | 10 18 | экса- | 10 18 | эксбибайт | EiB | ЭиБ | 2 60 |
зеттабайт | Збайт | 10 21 | зетта- | 10 21 | зебибайт | ZiB | ЗиБ | 2 70 |
йоттабайт | Ибайт | 10 24 | йотта- | 10 24 | йобибайт | YiB | ЙиБ | 2 80 |
Мегаба́йт (сокр. Мбайт; международное сокр.: Mbyte, MB) [1] — единица измерения количества информации; может обозначать 10 6 ( 1 000 000 ) или 2 20 ( 1 048 576 ) байт.
Международная система единиц рекомендует использовать приставку «мега-» только для обозначения 10 6 , а для 2 20 байт принято наименование мебибайт. В то же время существует исторически сложившаяся практика, когда термин используется для обозначения 2 20 байт.
История [ править | править код ]
Однажды специалисты по информатике заметили, что величина 2 10 (1024) очень близка к 1000, и для обозначения объёма данных в 1024 байт стали использовать префикс международной системы единиц СИ «кило-». Этот подход хорошо работал в течение одного-двух десятилетий, так как каждый, кто говорил о килобайте, имел ввиду 1024 байт. Но со временем к компьютерам приобщились многие пользователи, не являющиеся профессионалами в этой сфере, и по их представлениям приставка кило- означает 1000 (в одном километре 1000 метров) [2] .
Со временем, хранение гигабайт и терабайт данных стало обычным делом, и по ряду практических соображений двоичная арифметика стала менее удобной, нежели десятичная. Как следствие, люди перестали понимать, что подразумевается под словом мегабайт. Так, производители оперативной памяти обычно рассматривали мегабайт как 2 20 , а производители внешних накопителей (например, жёстких дисков), как правило, считали, что мегабайт эквивалентен 10 6 байтам. Скорость передачи информации мегабайт/сек во время проектирования локальных сетей принималась за 2 20 байт/сек, в то время как в телекоммуникационных системах та же величина считалась как 10 6 байт/сек. Более того, появилась третья интерпретация мегабайта как 1 024 000 , например, для обозначения формата 1.44 дискет. Таким образом, проблема путаницы стала реальной [2] .
Учитывая эти особенности происходящего, комитет Международной электротехнической комиссии (МЭК) принял решение, что приставка мега- должна использоваться в традиционном и всеми известном смысле (10 6 ), за исключением случаев, когда двоичная размерность мегабайта указана явно. Первая версия документа МЭК была опубликована в 1998 году, вторая редакция вышла в 2000-м [2] . Позднее подобное решение отразилось и в Международной системе единиц. Так, в документе «Брошюра СИ» имеется рекомендация не использовать мегабайт для 10 6 , а для 2 20 применять наименование «мебибайт» [3] .
Исторически в ряде сфер обозначение мегабайта в качестве 2 20 осталось в практике. Так, оно может проявляться в отдельном программном обеспечении (например, в операционных системах семейства Windows) и присутствует в стандарте 1999 года JEDEC 100B.01 ( англ. ) [4] .
Согласно российскому «Положению о единицах величин» 2009 года термин «Мегабайт» употребляется в значении 2 20 байт, сама же приставка пишется с большой буквы. При этом допускается применение международного обозначения с приставкой «M» (MB, Mbyte), рекомендованного Международным стандартом МЭК 60027-2 [1] .
Ответ
1)1 мбайт = 1048576 байт
6*1048576= 6 291 456 байт
6мбайт = 6 291 456 байт
2) 1 мб = 1024 кб
6*1024 = 6144
6мбайт = 6144 кб
Конвертировать из Мегабайт в Байт. Введите сумму, которую вы хотите конвертировать и нажмите кнопку конвертировать.
1 Мегабайт = 1048576 Байт | 10 Мегабайт = 10485760 Байт | 2500 Мегабайт = 2621440000 Байт |
2 Мегабайт = 2097152 Байт | 20 Мегабайт = 20971520 Байт | 5000 Мегабайт = 5242880000 Байт |
3 Мегабайт = 3145728 Байт | 30 Мегабайт = 31457280 Байт | 10000 Мегабайт = 10485760000 Байт |
4 Мегабайт = 4194304 Байт | 40 Мегабайт = 41943040 Байт | 25000 Мегабайт = 26214400000 Байт |
5 Мегабайт = 5242880 Байт | 50 Мегабайт = 52428800 Байт | 50000 Мегабайт = 52428800000 Байт |
6 Мегабайт = 6291456 Байт | 100 Мегабайт = 104857600 Байт | 100000 Мегабайт = 104857600000 Байт |
7 Мегабайт = 7340032 Байт | 250 Мегабайт = 262144000 Байт | 250000 Мегабайт = 262144000000 Байт |
8 Мегабайт = 8388608 Байт | 500 Мегабайт = 524288000 Байт | 500000 Мегабайт = 524288000000 Байт |
9 Мегабайт = 9437184 Байт | 1000 Мегабайт = 1048576000 Байт | 1000000 Мегабайт = 1048576000000 Байт |
Встроить этот конвертер вашу страницу или в блог, скопировав следующий код HTML:
Калькулятор цифровых данных | Преобразование единиц хранения цифровых данных
Хранилище данных — компьютерная технология, которая не является количественной величиной СИ. Компьютерная информация представлена в числовых формах «1» и «0» в различных типах хранилищ. Главной единицей хранения цифровых данных является байт, а в байте 8 бит. Виртуальные данные измеряются в таких единицах, как бит, байт, килобайт (КБ), мегабайт (МБ), гигабайт (ГБ), терабайт (ТБ), петабайт или эксабайт.
Конвертер единиц цифрового Хранилища данных.
Переводим из
Переводим в
Основные единицы данных | |
Бит | бит |
Байт | байт |
Эксабит | Эбит |
Эксабайт | ЭБ |
Гигабит | Гбит |
Гигабайт | ГБ |
Килобит | Кбит |
Килобайт | кБ |
Мегабит | Мбит |
Мегабайт | МБ |
Петабит | Пбит |
Петабайт | ПБ |
Терабит | Тбит |
Терабайт | ТБ |
Другие единицы | |
Блок | |
CD (74 Minute) | CD 74 min |
CD (80 Minute) | CD 80 min |
Двойное слово | DW |
DVD (1 слой, 1 сторона) | DVD 1l/1s |
DVD (1 слой, 2 стороны) | DVD 1l/2s |
DVD (2 слоя, 1 сторона) | DVD 2l/1s |
DVD (2 слоя, 2 стороны) | DVD 2l/2s |
Эксабайт (10^18 Байт) | ЭБ |
Дискета (3.12 Bytes) | TB |
Слово | W |
Zip 100 | |
Zip 250 |
Основные единицы данных | |
Бит | бит |
Байт | байт |
Эксабит | Эбит |
Эксабайт | ЭБ |
Гигабит | Гбит |
Гигабайт | ГБ |
Килобит | Кбит |
Килобайт | кБ |
Мегабит | Мбит |
Мегабайт | МБ |
Петабит | Пбит |
Петабайт | ПБ |
Терабит | Тбит |
Терабайт | ТБ |
Другие единицы | |
Блок | |
CD (74 Minute) | CD 74 min |
CD (80 Minute) | CD 80 min |
Двойное слово | DW |
DVD (1 слой, 1 сторона) | DVD 1l/1s |
DVD (1 слой, 2 стороны) | DVD 1l/2s |
DVD (2 слоя, 1 сторона) | DVD 2l/1s |
DVD (2 слоя, 2 стороны) | DVD 2l/2s |
Эксабайт (10^18 Байт) | ЭБ |
Дискета (3.12 Bytes) | TB |
Слово | W |
Zip 100 | |
Zip 250 |
Результат конвертации:
Как находить биты байты килобайты гигабайты мегабайты
Все про Windows, программное обеспечение, информационную безопасность, программирование
Как перевести биты в байты, килобайты, мегабайты и гигабайты
Рассмотрим, как перевести определённое количество битов в байты, килобайты, мегабайты и гигабайты.
1 килобайте — 1024 байт.
1 мегабайте — 1024 килобайт.
1 гигабайте — 1024 мегабайт.
Исходя из выше изложенного, можно сделать расчеты:
Чтобы узнать, сколько бит в байте, необходимо, количество бит разделить на 8.
Далее полученное число (байты) разделить 1024, таким образом, мы получим количество байтов в килобайте.
Для получения количества килобайтов в мегабайтах, необходимо число килобайтов поделить на 1024.
Для гигабайтов, число мегабайтах разделить на 1024.
Для получения обратного результата, например гигабайты перевести в мегабайты необходимо умножить число гигабайтов на 1024.
Для автоматизации перерасчетов, в MS Excel можно создать следующий конвертер (зеленое поле для ввода данных).
Здравствуйте, уважаемые читатели блога Goldbusinessnet.com! В условиях бурного развития информационных технологий недурственно бы получить знания по некоторым фундаментальным аспектам, хотя бы основным. Это может оказать серьезную помощь в дальнейшем.
В интернете, которым мы пользуемся благодаря компьютерам, вся информация хранится или передается в закодированном цифровом формате, а потому должны обязательно существовать способы измерить объем этих данных, ведь от этого зависит системность работы с ними. Такими единицами измерения служат бит и байт.
По аналогии с известными нам физическими единицами измерения, которые при большой их величине для удобства исчисления получают увеличительные приставки (1000 метров = 1 километр, 1000 грамм = 1 килограмм), единица информации байт тоже имеет свои производные (килобайт, мегабайт, гигабайт и т.д.). Однако, в случае бита и байта существуют нюансы, о которых я подробнее и поведаю.
Что представляют из себя единицы информации бит (bit) и байт (byte)
Чтобы было понятнее, придется изложить все поподробнее и начать, так сказать, с истоков. Однако постараюсь донести информацию без заумных математических формул и терминов. Дело в том, что существует несколько позиционных систем счисления. Не буду их перечислять, поскольку в этом нет необходимости.
Двоичная и десятичная системы счисления
Самая известная из них, с которой мы все сталкиваемся ежедневно, это десятичная система. В ней любое число состоит из цифр (от 0 до 9), каждая из которых является разрядом, занимая строго соответствующую ей позицию. Причем разрядность увеличивается справа налево (единицы, десятки, сотни, тысячи и т.д.).
Возьмем для примера число 249, которое можно представить в виде суммы произведений цифр на 10 в степени, соответствующей данному разряду:
Таким образом, нулевой разряд — это единицы (10 0 ), первый — десятки (10 1 ), второй — сотни (10 2 ) и т.д. В компьютере, как и в других электронных устройствах, вся информация распределяется по файлам (здесь о файловой системе подробности) и кодируется соответствующим образом в цифровом формате, причем в силу простоты использования применяется двоичная система счисления, на которой остановлюсь отдельно.
В двоичной системе числа представляются с помощью всего двух цифр: 0 и 1. Попробуем записать уже рассмотренное нами число 249 в двоичной системе, чтобы понять ее суть. Для этого делим его на 2, получив целое частное с остатком 1. Эта единичка и будет самым младшим разрядом, который будет, как и в случае десятичной системы, крайним справа.
Далее продолжаем операцию деления и каждый раз целые числа также делим на 2, получая при этом в остатке 0 или 1. Их последовательно и записываем справа налево, получив в итоге 249 в двоичной системе. Операцию деления следует проводить до тех пор, пока в результате не появится нуль:
Теперь записываем цифры в остатке последовательно справа налево и получаем наше подопытное число в двоичной системе:
Чтобы не осталось темных пятен, проведем обратное действие и попробуем перевести то же самое число из двоичной в десятичную систему, проверив заодно правильность выше изложенных действий. Для этого умножаем опять же по порядку слева направо нуль или единицу на 2 в степени, соответствующей разряду (по аналогии с десятичной системой):
Как видите все получилось, и мы смогли преобразовать число, записанное в двоичной системе, на его запись в десятичной системе счисления.
Сколько бит в байте при использовании двоичной системы в информатике
Я не зря предоставил чуть выше краткий математический экскурс, поскольку именно двоичная система служит основой измерения, используемой в электронных устройствах. Базовой единицей количества информации, равной разряду в двоичной системе, как раз и является бит.
Этот термин происходит от английского словосочетания binary digit (bit), что означает двоичное число. Таким, образом, бит может принимать лишь два возможных значения: 0 или 1. В информатике это означает два совершенно равных с точки зрения вероятности результата («да» или «нет») и не допускает другого толкования.
Это очень важно с точки зрения корректной работы системы. Идем дальше. Количество бит, которое обрабатывается компьютером в один момент, называется байтом (byte). 1 байт равен 8 битам и, соответственно, может принимать одно из 2 8 (256) значений, то есть от 0 до 255:
Итак, нам теперь доподлинно известно, что такое байт, и какую роль он играет в качестве единицы измерения при обработке информации, хранящейся и обрабатываемой в цифровом виде. Кстати, в международном формате байт может обозначаться двумя способами — byte или B.
Перевести числа в десятичном формате на двоичную систему можно с помощью калькулятора. Если у вас ОС Windows 7, то вызвать этот инструмент можно так: Пуск — Все программы — Стандартные — Калькулятор. В меню «Вид» выбираете формат «Программист» и вводите желаемое число (в моем примере это 120):
Теперь включите радиокнопки «Bin» и «1 байт», после чего получаете запись данного числа в двоичной системе:
На что здесь следует обратить внимание? Во-первых, в строке на дисплее представлены лишь семь разрядов (биты со значениями ноль или единица), хотя мы уже знаем, что их должно быть восемь, если значение байта от 0 до 255:
Здесь все просто. Если самый старший разряд (бит), расположенный крайним слева, принимает значение 0, то он просто не записывается. Два или более нулевых бита тоже опускаются (по аналогии с десятичными числами — ведь к сотням мы не прописываем 0 тысяч, например).
Доказательством может служить полная запись полученного числа, которая отображается мелким шрифтом чуть ниже:
Если вы внимательны, то увидите, что здесь во-вторых. Это способ записи в виде двух частей, каждая из которых состоит из четырех бит. В информатике используется еще такое понятие как полубайт, или ниббл (nibble). Это удобно тем, что ниббл можно представить как разряд в шестнадцатеричной системе, которая широко используется в программировании.
Для обработки данных требуется более 1 байта — что тогда?
Выше мы поговорили о том, что байт содержит восемь бит. Это позволяет выразить 256 (два в восьмой степени) различных значений. Однако на практике в основном этого далеко не достаточно и во многих случаях приходится использовать не один, а несколько byte. В качестве примера воспользуемся еще раз калькулятором Windows и переведем число 1000 в двоичную систему:
Как видите, для этого пришлось отщипнуть пару разрядов из второго байта. На практике в компьютерах для обработки достаточно объемной информации применяется такое понятие как машинное слово, которое может содержать 16, 32, 64 bit.
С их помощью можно выразить соответственно 2 16 , 2 32 и 2 64 различных значений. Но в этом случае нельзя говорить о 2, 4 или 8 байтах, это немного разные вещи. Отсюда растут ноги из упоминания, например, 32-, 64-разрядных (-битных) процессоров или других устройств.
Сколько байт в килобайте, мегабайте, гигабайте, терабайте
Ну а теперь самое время перейти к производным байта и представить, какие приставки увеличения здесь используются. Ведь байт как единица очень маленькая величина, и для удобства очень даже полезно использовать аналоги, которые бы обозначали 1000 B, 1 000 000 B и т.д. Здесь тоже есть свои нюансы, о которых и поговорим ниже.
Строго говоря, для представления величин корректно использовать приставки для двоичной системы счисления, которые кратны 2 10 (1024). Это кибибайт, мебибайт, гебибайт и т.д.
Но данные словосочетания не прижились в широком использовании. Возможно, одной из причин стала их неблагозвучность. Поэтому пользователи (и не только) повсеместно употребляют вместо двоичных десятеричные приставки (килобайты, мегабайты, гигабайты, терабайты), что является не совсем корректным, поскольку по сути (в соответствии с правилами десятичной системы счисления) это означает следующее:
Но раз уж так сложилось, ничего не поделаешь. Важно лишь помнить, что на практике часто используются килобайт (Кбайт), мегабайт (Мбайт), гигабайт (Гбайт), терабайт (Тбайт) именно в качестве производных от байта как единицы измерения количества информации в двоичной системе. И в этом случае употребляют, например, термин «килобайт», имея ввиду именно 1024 байта и не что иное.
Однако, очень часто производители накопителей (включая жесткие диски, флэшки, DVD- и CD-диски) при указании объема для хранения информации применяют именно десятичные приставки по прямому назначению (1 Кбайт = 1000 байт), в то время как тот же Виндовс, например, рассчитывает их размер в двоичной системе.
Отсюда и выходит некоторое несоответствие, которое может запутать простого пользователя. Скажем, в документации указана емкость диска 500 Гб, в то время как Windows показывает его объем равным 466,65 Гбайт.
По сути никакого расхождения нет, просто размер накопителя присутствует в разных системах счисления (тот же пень, только сбоку). Для неопытных юзеров это крайне неудобно, но, как я уже сказал, приходится с этим мириться.
Резюмируя, отмечу следующее. Скажем, вам зададут вопрос: сколько байт в килобайте? Теоретически корректным будет ответ: 1 килобайт равен 1000 байтам. Просто надо помнить, что на практике по большей части десятичные приставки используются в качестве двоичных, которые кратны 1024, хотя иногда они применяются по прямому назначению и кратны именно 1000.
Вот такая арифметика, надеюсь, что вы не запутались. В публикации я упомянул килобайт, мегабайт, гигабайт и терабайт, а что дальше? Какие еще более крупные единицы количества информации возможны? На этот вопрос ответит таблица, где указаны не только соотношение единиц в обеих системах, но и их обозначения в международном и российском форматах:
Переводим байты в биты, килобайты, мегабайты, гигабайты, терабайты в онлайн конвертере Публикация была бы неполной, если бы я не привел инструмент, с помощью которого можно осуществить перевод byte в различные производные. В сети много разнообразных конвертеров, посредством которых можно произвести эти нехитрые операции. Вот один из них, который мне приглянулся. Этот конвертер удобен тем, что введя количество byte, можно сразу получить результат во всех возможных измерениях (в том числе перевести биты в байты): Из данного примера следует, что 3072 байта равно 24576 битам, 3,0720 килобайтам или 3 кибибайтам. Кроме этого, чуть ниже расположены ссылки на миникалькуляторы, где вы сможете быстро произвести конкретный перевод из одной системы единиц в другую. Заполняем пробелы – расширяем горизонты!
Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения. Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички. Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»). Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 2 8 ). Таким образом, один байт равен одному символу, то есть 8 битам: 1 символ = 8 битам = 1 байту. Буква, цифра, знак препинания – это символы. Одна буква – один символ. Одна цифра – тоже один символ. Один знак препинания (либо точка, либо запятая, либо вопросительный знак и т.п.) – снова один символ. Один пробел также является одним символом. Изучение компьютерной грамотности предполагает рассмотрение и других, более крупных единиц измерения информации. Таблица байтов:1 Кб (1 Килобайт) = 2 10 байт = 2*2*2*2*2*2*2*2*2*2 байт = 1 Мб (1 Мегабайт) = 2 20 байт = 1024 килобайт (примерно 1 миллион байт – 10 6 байт) 1 Гб (1 Гигабайт) = 2 30 байт = 1024 мегабайт (примерно 1 миллиард байт – 10 9 байт) 1 Тб (1 Терабайт) = 2 40 байт = 1024 гигабайт (примерно 10 12 байт). Терабайт иногда называют тонна. 1 Пб (1 Петабайт) = 2 50 байт = 1024 терабайт (примерно 10 15 байт). 1 Эксабайт = 2 60 байт = 1024 петабайт (примерно 10 18 байт). 1 Зеттабайт = 2 70 байт = 1024 эксабайт (примерно 10 21 байт). 1 Йоттабайт = 2 80 байт = 1024 зеттабайт (примерно 10 24 байт). В приведенной выше таблице степени двойки (2 10 , 2 20 , 2 30 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 10 3 , 10 6 , 10 9 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 2 10 = 1024 байта представляет точное значение килобайта, а 10 3 = 1000 байт является приблизительным значением килобайта. Такое приближение (или округление) вполне допустимо и является общепринятым. Ниже приводится таблица байтов с английскими сокращениями (в левой колонке): 10 3 b = 10*10*10 b= 1000 b – килобайт 10 6 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт 10 9 b – гигабайт 10 12 b – терабайт 10 15 b – петабайт 10 18 b – эксабайт 10 21 b – зеттабайт 10 24 b – йоттабайт Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт, также как в случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм. Продолжение следует…Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞. Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 10 27 , 10 30 , 10 33 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта. Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации. Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало. Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб , 64 Гб и даже 1 терабайт. CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб. DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб. Упражнения по компьютерной грамотности Статья закончилась, но можно еще прочитать: «> Оценка статьи: Загрузка…Поделиться с друзьями: Adblock detector |
---|
Единицы измерения объема информации
Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения.
Бит и байт – минимальные единицы измерения информации
Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички.
Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»).
Бит – это только 0 («ноль») или только 1 («единичка»). С помощью одного бита можно записать два состояния: 0 (ноль) или 1 (один). Бит – это минимальная ячейка памяти, меньше не бывает. В этой ячейке может храниться либо нолик, либо единичка.
Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 28). Таким образом, один байт равен одному символу, то есть 8 битам:
1 символ = 8 битам = 1 байту.
Буква, цифра, знак препинания – это символы. Одна буква – один символ. Одна цифра – тоже один символ. Один знак препинания (либо точка, либо запятая, либо вопросительный знак и т.п.) – снова один символ. Один пробел также является одним символом.
Кроме бита и байта, конечно же, есть и другие, более крупные единицы измерения информации.
Таблица байтов:
1 байт = 8 бит
1 Кб (1 Килобайт) = 210 байт = 2*2*2*2*2*2*2*2*2*2 байт =
= 1024 байт (примерно 1 тысяча байт – 103 байт)
1 Мб (1 Мегабайт) = 220 байт = 1024 килобайт (примерно 1 миллион байт – 106 байт)
1 Гб (1 Гигабайт) = 230 байт = 1024 мегабайт (примерно 1 миллиард байт – 109 байт)
1 Тб (1 Терабайт) = 240 байт = 1024 гигабайт (примерно 1012 байт). Терабайт иногда называют тонна.
1 Пб (1 Петабайт) = 250 байт = 1024 терабайт (примерно 1015 байт).
1 Эксабайт = 260 байт = 1024 петабайт (примерно 1018 байт).
1 Зеттабайт = 270 байт = 1024 эксабайт (примерно 1021 байт).
1 Йоттабайт = 280 байт = 1024 зеттабайт (примерно 1024 байт).
В приведенной выше таблице степени двойки (210, 220, 230 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 103, 106, 109 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 210 = 1024 байта представляет точное значение килобайта, а 103 = 1000 байт является приблизительным значением килобайта.
Такое приближение (или округление) вполне допустимо и является общепринятым.
Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):
1 Kb ~ 103 b = 10*10*10 b= 1000 b – килобайт
1 Mb ~ 106 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт
1 Gb ~ 109 b – гигабайт
1 Tb ~ 1012 b – терабайт
1 Pb ~ 1015 b – петабайт
1 Eb ~ 1018 b – эксабайт
1 Zb ~ 1021 b – зеттабайт
1 Yb ~ 1024 b – йоттабайт
Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт. В случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.
Продолжение следует…
Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞.
Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 1027, 1030, 1033 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта.
Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации.
Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.
Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб , 64 Гб и даже 1 терабайт.
CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.
DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.
Упражнения по компьютерной грамотности
описаны в статье “Байт, килобайт, мегабайт…”
Статья закончилась, но можно еще прочитать:
Кодирование текстовой информации
Проверяем, кодирует ли компьютер текст
Кодирование цветовой информации
Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков
Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.
Автор: Надежда Широбокова
6 июля 2010
существительные — Правильное сокращение «байт» и «бит»
В области компьютерных единиц измерения остается много подобных несоответствий, поскольку это инженерная дисциплина, а не научная. Поэтому номенклатура исторически создавалась похожей на научную, но с научной точки зрения развивалась «неправильно».
В последнее время есть последовательные шаги в сторону стандартизации номенклатуры (например новые названия «кибибиты» и «кибибайты» вместо с научной точки зрения неправильных «килобитов» и «килобайт»), но не все внимательно за этим следят. В целом русские обозначения ориентируются на английские, т.к. именно английский язык является законодателем мод в области IT.
Что же касается блогов и прочих «самописных» ресурсов, то ожидать 100% грамотности и точности в употреблении терминов ожидать не приходится, ведь текст не проходит через руки корректоров, редакторов и научных редакторов перед публикацией.
Если же обратиться к документации, то например действующий ГОСТ 8.417-2002 не приводит однобуквенного сокращения для слова «бит», оно должно писаться как «Кбит»:
А ниже приводится такое примечание (обратите внимание что слово «байт» указано целиком):
Исторически сложилась такая ситуация, что с наименованием „байт“ некорректно (вместо 1000 = 103 принято 1024 = 210) использовали (и используют) приставки СИ: 1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт и т.д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы „к“ для обозначения множителя 103.
Так что согласно ГОСТу для байт нужно писать Кбайт или КБ, а для бит — только Кбит.
Солидарна с ГОСТом и Википедия: КБ — «килобайт», Кбит — «килобит».
Впрочем, внимательный читатель обратит внимание что приложение «А» ГОСТа не обязательное, а рекомендованное, что, конечно, не позволяет сказать что нужно писать только так, а не иначе.
Очень хорошая статья описывающая историю путаницы с байтами и битами есть на сайте Артемия Лебедева. Он достаточно обоснованно утверждает что путаница в обозначениях активно используется в рекламных целях (попробуйте «пораскачивать» в рекламных целях систему СИ). В конце статьи приводятся «правильные аббревиатуры» для единиц измерения информации: для Кбайта — КБ, для Кбита — Кб. Там же можно увидеть и такие аббревиатуры как кБ (десятичный килобайт = 1000 байт) и кб (килобит — 1000 бит).
Впрочем, хотя мнение Лебедева является достаточно влиятельным, вряд ли можно ссылаться на него как на официальный источник. Очевидно также что Лебедев за основу правильных аббревиатур взял англо-американский стандарт.
Вот в этом учебнике информатики биты и байты вообще не сокращаются: Кбайт и Кбит: Информатика 7-9 кл. А. Г. Кушниренко и др.. К сожалению не удалось найти что по этому поводу думают составители ЕГЭ, но похоже что их мнение тоже может не совпадать с ГОСТом.
Раз уж не удалось найти рекомендации в авторитетных источниках, обратимся к словарям. Вот подборка статей про значение слова мегабайт:
Научно-технический энциклопедический словарь:
МЕГАБАЙТ (обозначается Мб), в вычислительной технике — единица объема информации, равная 1024 килобайт. Часто используется для выражения объема компьютерной памяти или запоминающего устройства. Иногда мегабайт округляют до 1 млн. БАЙТ.
Яндекс.Словари › Издательский словарь. — 2003:
МЕГАБАЙТ — единица емкости памяти или длины записи, равная 1024 килобайтам. Упрощенно под М. понимается также значение 103 килобайтов или 106 байтов. Сокращенная форма М. — Мбайт.
Энциклопедия Кольера
КОМПЬЮТЕР устройство, выполняющее математические и логические операции над символами и другими формами информации и выдающее результаты в форме, воспринимаемой человеком или машиной. ОЗУ работают быстро: микропроцессор может получать доступ к ним за 10-20 нс. Обычные коммерческие модули ОЗУ хранят до 256 Мб (1 Мб равен 1 048 576 байт).
Финансовый словарь
Мегабайт Мегабайт — единица измерения объема передаваемой или хранимой информации. 1 Мбайт = 1024 Кбайт.
По-английски: Megabyte
Синонимы: Мбайт, Мб
Синонимы английские: MB
Как видим сокращение Мб используется чаще чем Мбайт (а МБ вообще не удалось встретить). Некоторые словари (в частности полиграфический) утверждают что мегабайт можно сократить до М, а килобайт до К (например «объемом 64К»). Так что единства нет и среди словарей, но вариант Мб в технических словарях явно более предпочтительный.
Не знаю, можно ли считать его авторитетным источником, но справочник В. П. Леонтьева (2004) автора многочисленных книг на компьютерную тематику также использует строчную «б» для байт:
Что же касается сокращения бит — все словари единодушны — «бит» не сокращается, а пишется целиком — Кбит, Мбит, Гбит. Так что несмотря на статью Лебедева, все авторитетные источники не позволяют сокращать бит до одной строчной «б». Что же касается байт, то ГОСТ предписывает сокращать его до прописной Б (КБ, МБ, ГБ), а словари приводят то же сокращение со строчной б (Кб, Мб, Гб).
Сколько символов в 1 байте
Информационный объем текста складывается из информационных весов составляющих его символов.
Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется всего два символа 0 и 1. Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1).
Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц – машинным языком.
Какой длины должен быть двоичный код, чтобы с его помощью можно было закодировать васе символы клавиатуры компьютера?
Достаточный алфавит
В алфавит мощностью 256 символов можно поместить практически все символы, которые есть на клавиатуре. Такой алфавит называется достаточным.
Т.к. 256 = 2 8 , то вес 1 символа – 8 бит.
Единице в 8 бит присвоили свое название – байт.
1 байт = 8 бит.
Таким образом, информационный вес одного символа достаточного алфавита равен 1 байту.
Для измерения больших информационных объемов используются более крупные единицы измерения информации:
Единицы измерения количества информации:
1 килобайт = 1 Кб = 1024 байта
1 мегабайт = 1 Мб = 1024 Кб
1 гигабайт = 1 Гб = 1024 Гб
Информационный объем текста
Книга содержит 150 страниц.
На каждой странице – 40 строк.
В каждой строке 60 символов (включая пробелы).
Найти информационный объем текста.
1. Количество символов в книге:
60 * 40 * 150 = 360 000 символов.
2. Т.к. 1 символ весит 1 байт, информационный объем книги равен
3. Переведем байты в более крупные единицы:
360 000 / 1024 = 351,56 Кб
351,56 / 1024 = 0,34 Мб
Ответ: Информационный объем текста 0,34 Мб.
Задача:
Информационный объем текста, подготовленного с помощью компьютера, равен 3,5 Кб. Сколько символов содержит этот текст?
Информационный объем текста 3,5 Мб. Найти количество символов в тексте.
1. Переведем объем из Мб в байты:
3,5 Мб * 1024 = 3584 Кб
3584 Кб * 1024 = 3 670 016 байт
2. Т.к. 1 символ весит 1 байт, количество символов в тексте равно
На основании одной ячейки информационной ёмкостью 1 бит можно закодировать только 2 различных состояния. Для того чтобы каждый символ, который можно ввести с клавиатуры в латинском регистре, получил свой уникальный двоичный код, требуется 7 бит. На основании последовательности из 7 бит, в соответствии с формулой Хартли, может быть получено N =2 7 =128 различных комбинаций из нулей и единиц, т.е. двоичных кодов. Поставив в соответствие каждому символу его двоичный код, мы получим кодировочную таблицу. Человек оперирует символами, компьютер – их двоичными кодами.
Для латинской раскладки клавиатуры такая кодировочная таблица одна на весь мир, поэтому текст, набранный с использованием латинской раскладки, будет адекватно отображен на любом компьютере. Эта таблица носит название ASCII (American Standard Code of Information Interchange) по-английски произносится [э́ски], по-русски произносится [а́ски]. Ниже приводится вся таблица ASCII, коды в которой указаны в десятичном виде. По ней можно определить, что когда вы вводите с клавиатуры, скажем, символ “*”, компьютер его воспринимает как код 42(10), в свою очередь 42(10)=101010(2) – это и есть двоичный код символа “*”. Коды с 0 по 31 в этой таблице не задействованы.
Это первая часть перевода статьи What Every Programmer Absolutely, Positively Needs To Know About Encodings And Character Sets To Work With Text
Если вы работаете с текстом в компьютере, вам обязательно нужно знать про кодировки. Даже если вы посылаете электронные письма. Даже если вы их только получаете. Необязательно понимать каждую деталь, но надо хотя бы знать, что из себя представляют кодировки. И вот первая хорошая новость: статья может быть немного запутанной, но основная идея очень и очень простая.
Эта статья о кодировках и наборах символов.
Статья Джоеэля Спольски под названием «Абсолютный минимум о Unicode и наборе символов для каждого разработчика(без исключений!)» будет хорошей вводной и мне доставляет большое удовольствие перечитывать ее время от времени. Я стесняюсь отсылать к ней тех людей, которые испытывают трудности с пониманием проблем с кодировкам, хотя она довольно легкая в плане технических деталей. Я надеюсь, эта статья прольет немного света на то, чем именно являются кодировки, и почему все ваши тексты оказываются испорченными в самый ненужный момент. Статья предназначена для разработчиков(главным образом, на PHP), но пользу от нее может получить любой пользователь компьютера.
Основы
Все более или менее слышали об этом, но каким-то образом знание испаряется, когда дело доходит до обсуждения, так что вот вам: компьютер не может хранить буквы, числа, картинки или что-либо еще. Он может запомнить только биты. Бит имеет только два значения: ДА или НЕТ, ПРАВДА или ЛОЖЬ, 1 или 0 или любую другую пару, которую вы можете вообразить. Раз уж компьютер работает с электричеством, бит представлен электрическим зарядом: он либо есть, либо его нет. Людям проще представлять это в виде 1 и 0, так что я буду придерживаться этих обозначений.
Чтобы с помощью битов представлять нечно полезное, нам нужны правила. Надо сконвертировать последовательность бит в что-то похожее на буквы, числа и изображения, используя схему кодирования, или, коротко, кодировку. Вот так, например:
01100010 01101001 01110100 01110011
b i t s
В этой кодировке, 01100010 представляет из себя ‘b’, 01101001 — ‘i’, 01110100 — ‘t’, 01110011 — ‘s’. Конкретная последовательность бит соответствует букве, а буква – конкретной последовательности битов. Если вы можете запомнить последовательности для 26 букв или умеете действительно быстро находить нужное соответствие, то вы сможете читать биты, как книги.
Упомянутая схема носит название ASCII. Строка с нолями и единицами разбивается на части по 8 бит(по байтам). Кодировка ASCII определяет таблицу перевода байтов в человеческие буквы. Вот небольшой кусочек этой таблицы:
01000001 A
01000010 B
01000011 C
01000100 D
01000101 E
01000110 F
В ней 95 символов, включая буквы от A до Z, в нижнем и верхнем регистре, цифры от 0 до 9, с десяток знаков препинания, амперсанд, знак доллара и прочие. В нее также включены 33 значения, такие как пробел, табуляция, перевод строки, возврат символа и прочие. Это непечатаемые символы, хотя они видимы человеку и используются им. Некоторые значения полезны только компьютеру, такие как коды начала и конца текста. Всего в кодировку ASCII включены 128 символов — прекрасное ровное число для тех, кто смыслит в компьютерах, так как оно использует все комбинации 7ми битов (от 0000000 до 1111111).
Вот вам способ представить человеческую строку, используя только единицы и нули:
01001000 01100101 01101100 01101100 01101111 00100000
01010111 01101111 01110010 01101100 01100100
Важные термины
Для кодирования чего-либо в ASCII двигайтесь справа налево, подменяя буквы на биты. Для декодирования битов в символы, следуйте по таблице слева направо, подменяя биты на буквы.
encode |enˈkōd|
verb [ with obj. ]
convert into a coded form
code |kōd|
noun
a system of words, letters, figures, or other symbols substituted for other words, letters, etc.
Кодирование – это представление чего-либо чем-нибудь другим. Кодировка – это набор правил, описывающий способ перевода одного представления в другое.
Прочие термины, заслуживающие прояснения:
Набор символов, чарсет, charset – Набор символов, который может быть закодирован. «Кодировка ASCII включает набор из 128 символов». Синоним к кодировке.
Кодовая страница – страница кодов, закрепляюшая за символом набор битов. Таблица. Синоним к кодировке.
Строка – пачка чего-нибудь, объединенных вместе. Битовая строка – это пачка бит, такая как 00011011. Символьная строка – это пачка символов, например «Вот эта». Синоним к последовательности.
Двоичный, восьмеричный, десятичный, шестнадцатеричный
Существует множество способов записывать числа. 10011111 – это бинарная запись для 237 в восьмеричной, 159 в десятичной и 9F в шестнадцатиричной системах. Значения у всех этих чисел одинаково, но шестнадцатиричная система короче и проще для понимания, чем двоичная. Я буду придерживаться двоичной системы в этой статье, чтобы улучшить понимание и убрать лишний уровень абстракции. Не пугайтесь, встречая коды символов в других нотациях, все значения эквиваленты.
Excusez-Moi?
Раз уж мы теперь знаем, о чем говорим, заметим: 95 символов – это совсем немного, когда речь идет о языках. Этот набор покрывает базовый английский, но как насчет французских символов? А вот это Straßen¬übergangs¬änderungs¬gesetz из немецкого языка? А приглашение на smörgåsbord в шведском? В-общем, не получится. Не в ASCII. Спецификация на представление é, ß, ü, ä, ö просто отсутствует.
“Постойте-ка”, скажут европейцы, “в обычных компьютерах с 8 битами в байте, ASCII никак не использует бит, который всегда равен 0! Мы можем использовать его, чтобы расширить таблицу еще на 128 значений”. И было так. Но способов обозначить звучание гласных еще слишком много. Не все сочетания букв и значений, используемые в европейских языках, влезают в таблицу из 256 записей. Так мир пришел к изобилию кодировок, стандартов, стандартов де-факто и недостандартов, которые покрывают все субнаборы символов. Кому-то понадобилось написать документ на шведском или чешском, и, не найдя нужной кодировки, просто изобрел еще одну. Или я думаю, что все так и произошло.
Не забывайте о русском, хинди, арабском, корейском и множестве других живых языков планеты. Про мертвые уж молчим. Как только вы найдете способ писать документ, использующий несколько языков, попробуйте добавить китайский. Или японский. Оба содержат тысячи символов. И у вас всего 256 значений. Вперед!
Многобайтные кодировки
Для создания таблиц, которые содержат более 256 символов, одного байта просто недостаточно. Двух байтов (16 бит) хватит для кодировки 65536 различных значений. Big-5 например, кодировка двухбайтная. Вместо разбиения последовательности битов в блоки по 8, она использует блоки по 16 битов и содержит большую(я имею ввиду БОЛЬШУЮ) таблицу с соответствием. Big-5 в своем основном виде покрывает большинство символов традиционного китайского. GB18030 – это похожая кодировка, но она включает как традиционный, так и упрощенный китайский. И, прежде чем вы спросите, да, есть кодировки только для упрощенного китайского. А разве одной недостаточно?
Вот кусок таблицы GB18030:
bits character
10000001 01000000 丂
10000001 01000001 丄
10000001 01000010 丅
10000001 01000011 丆
10000001 01000100 丏
GB18030 покрывает довольно большой диапазон символов, включая большую часть латинских символов, но в конце концов, это всего лишь еще одна кодировка среди многих других.
Путаница с Unicode
В итоге тем, кому больше всех надоела эта каша, пришла в голову идея разработать единый стандарт, объединяющий все кодировки. Этим стандартом стал Unicode. Он определяет невероятную таблицу из 1 114 112 пунктов, используемую для всех вариантов букв и символов. Этого хватит для кодирования всех европейских, средне-азиатских, дальневосточных, южных, северных, западных, доисторических и будущих символов, о которых человечеству известно. Unicode позволяет создать документ на любом языке любыми символами, которые можно ввести в компьютер. Это было невозможно, или очень затруднительно до эры Unicode. В стандарте есть даже неофициальная секция под клингонский. Вы поняли, Unicode настолько большой, чтобы допускает неофициальные секции.
Итак, и сколько же байт использует Unicode для кодирования? Нисколько. Потому что Unicode – это не кодировка.
Смущены? Не вы одни. Unicode в первую и главную очередь определяет таблицу пунктов для символов. Это такой способ сказать «65 – A, 66 – B, 9731 – »(я не шучу, так и есть). Как эти пункты кодируются в байты является предметом другого разговора. Для представления 1 114 112 значений двух байт недостаточно. Трех достаточно, но 3 – странное число, так что 4 является комфортным минимумом. Но, пока вы не используете китайский, или другой язык со множеством символов, которые требуют большого количества битов для кодирования, вам никогда не придет в голову использовать толстую колбасу из 4х байт. Если “A” всегда кодируется в 00000000 00000000 00000000 01000001, а “B” – в 00000000 00000000 00000000 01000010, то документ, использующий такую кодировку, распухнет в 4 раза.
Существует несколько способов решения этой проблемы. UTF-32 – это кодировка, которая переводит все символы в наборы из 32 бит. Это простой алгоритм, но изводящий много места впустую. UTF-16 и UTF-8 являются кодировками с переменной длиной кодирования. Если символ может быть закодирован одним байтом(потому что номер пункта символа очень маленький), UTF-8 закодирует его одним байтом. Если нужно 2 байта, то используется 2 байта. Кодировка сообщает старшими битами, сколькими битами кодируется текущий символ. Такой способ экономит место, но так же и тратит его в случае, если эти сигнальные биты часто используются. UTF-16 является компромиссом: все символы как минимум двухбайтные, но их размер может увеличиваться до 4 байт, если нужно.
character encoding bits
A UTF-8 01000001
A UTF-16 00000000 01000001
A UTF-32 00000000 00000000 00000000 01000001
あ UTF-8 11100011 10000001 10000010
あ UTF-16 00110000 01000010
あ UTF-32 00000000 00000000 00110000 01000010
И все. Unicode – это огромная таблица соответствия символов и чисел, а различные UTF кодировки определяют, как эти числа переводятся в биты. В-общем, Unicode – это просто еще одна схема. Ничего особенного, она просто пытается покрыть все, что можно, оставаясь эффективной. И это хорошо.
Пункты
Символы определяются по их Unicode-пунктам. Эти пункты записаны в шестнадцатеричной системе и предварены “ U+” (просто для удобство, не значит ничего, кроме “Это пункт Unicode”). Символ Ḁ имеет пункт U+1E00. Иными(десятичными) словами, это 7680й символ таблицы Unicode. Он официально называется “ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА А С КОЛЬЦОМ СНИЗУ”.
Ниасилил
Суть вышесказанного: любой символ может быть закодирован множеством разных последовательностей бит, и любая последовательность бит может представлять разные символы, в зависимости от используемой кодировки. Причина в том, что разные кодировки используют разное число бит на символ и разные значения для кодирования разных символов.
11000100 01000010 Windows Latin 1 ÄB
11000100 01000010 Mac Roman ƒB
11000100 01000010 GB18030 腂
characters encoding bits
Føö Windows Latin 1 01000110 11111000 11110110
Føö Mac Roman 01000110 10111111 10011010
Føö UTF-8 01000110 11000011 10111000 11000011 10110110
Заблуждения, смущения и проблемы
Имея все вышесказанное, мы приходим к насущным проблемам, которые испытывают множество пользователей и разработчиков каждый день, как они соотносятся с указанным выше, и каковы пути решения. Сама большая проблема – это
Какого черта мой текст нечитаем?
Если вы откроете документ, и он выглядит так, как текст выше, то причина у этого одна: ваша программа ошиблась с кодировкой. И все. Документ не испорчен(по крайней мере, пока), и не нужно никакое волшебство. Вместо него надо просто выбрать правильную кодировку для отображения текста. Предполагаемый документ выше содержит биты:
10000011 01000111 10000011 10010011 10000011 01010010 10000001 01011011
10000011 01100110 10000011 01000010 10000011 10010011 10000011 01001111
10000010 11001101 10010011 11101111 10000010 10110101 10000010 10101101
10000010 11001000 10000010 10100010
Так, быстренько угадали кодировку? Если вы пожали плечами, то вы правы. Да кто знает?
Попробуем с ASCII. Большая часть этих байтов начинается с 1. Если вы правильно помните, ASCII вообще-то не использует этот бит. Так что ASCII не вариант. Как насчет UTF-8? Большая часть байт не является валидными значениями в этой кодировке. Как насчет Mac Roman(еще одна европейская кодировка)? Хм, для нее эти байты являются правильными значениями. 10000011 декодируетися в ”É”, в “G” и так далее. Так что в Mac Roman текст будет выглядеть так: ÉGÉìÉRÅ[ÉfÉBÉìÉOÇÕìÔǵÇ≠ǻǢ. Правильно? Нет? Может быть? А компьютер-то откуда знает? Может кто-то хотел написать именно это. Насколько я знаю, это может быть последовательностью ДНК! Так и порешим: это Mac Roman, и это ДНК.
Конечно, это полный бред. Правильный ответ таков: текст закодирован в Japanes Shift-JIS и должен выглядеть как エンコーディングは難しくない. Кто бы мог подумать?
Первая причина нечитаемости текста в том, что кто-то пытается прочитать последовательность байт в неверной кодировке. Компьютеру всегда нужно подсказывать. Сам он не догадается. Некоторые типы документов определяют кодировку своего содержимого, но последовательность байт всегда остается черным ящиком.
Большинство браузеров предоставляют возможность указать кодировку страницы с помощью специального пункта меню. Иные программы тоже имеют аналогичные пункты.
У автора нет разбиения на части, но статья и так длинна. Продолжение будет через пару дней.
KiB, Kib, KB, Kb / Хабр
Вот в
этом постетоварищ призывает следовать стандартам. Не всё так с ними просто, со стандартами. Я хочу показать насколько сложна ситуация с обозначениями единиц измерения информации. Не буду объяснять важность темы — кому интересно, прошу под кат.
История вопроса
Ярким примером путаницы с приставками является «мегабайт» производителей CD, DVD и дискет. Он равен 1024х1000 байт. Дискета на «1,44 Мб» на самом деле имеет ёмкость в 1,44х1024х1000 байт = 1440 Кб или 1,38 Мб (где 1 Мб = 1024х1024 байт). А ёмкость одностороннего однослойного DVD вместо 4,7 «ГБ» составляет 4,37 ГБ = 4,37х1024х1024х1024 байт.
В 1998 году Международное бюро мер и весов заявило, что приставки СИ относятся только к степеням десяти и не должны использоваться для обозначения степеней двойки.
В 1999 году МЭК ввела стандарт IEC 60027-2 с новыми приставками для обозначения количества информации. В 2008 году вышел аналогичный стандарт IEEE 1541 (различие только в том, что IEC предлагает писать «bit» полностью вместо «b» у IEEE). Использование этих приставок одобрено Международным комитетом мер и весов. Для обозначения степеней двойки в ближайшей приставке СИ второй слог заменяется на «bi» от binary (двоичный): kibibyte — KiB, mebibyte — MiB, gibibyte — GiB.
ГОСТ 8.417-2002, приложение А: «В соответствии с международным стандартом МЭК 60027-2 единицы «бит» и «байт» применяют с приставками СИ» (заглавные буквы К, М, Г,… обозначающие степени 10).
Также в стандарте сказано: «Исторически сложилась такая ситуация, что с наименованием «байт» некорректно (вместо 1000 = 103 принято 1024 = 210) использовали (и используют) приставки СИ: 1Кбайт = 1024 байт, 1Мбайт = 1024 Кбайт, 1Гбайт = 1024 Мбайт и т.д. При этом обозначение Кбайт начинают с прописной буквы в отличие от строчной буквы «к» для обозначения множителя 103.»
31 октября 2009 года Правительство РФ утвердило «Положение о единицах величин, допускаемых к применению в Российской Федерации», которое гласит: «Наименование и обозначение единицы количества информации «байт» (1 байт = 8 бит) применяются с двоичными приставками «Кило», «Мега», «Гига», которые соответствуют множителям «210», «220» и «230» (1 Кбайт = 1024 байт, 1 Мбайт = 1024 Кбайт, 1 Гбайт = 1024 Мбайт). Данные приставки пишутся с большой буквы. Допускается применение международного обозначения единицы информации с приставками «K» «M» «G», рекомендованного Международным стандартом Международной электротехнической комиссии МЭК 60027-2 (KB, MB, GB, Kbyte, Mbyte, Gbyte).»
Т.е. для байт приставки СИ теперь обозначают степени двойки, а для бит всё остаётся по ГОСТ — приставки СИ обозначают степени 10.
1 Мбайт = 1 MiB = 1024х1024 байт, 1 Мбит = 1 Mb = 1000х1000 бит.
Сводная таблица приставок
IEEE 1541/IEC 60027-2 |
ГОСТ 8.417-2002, «Положение…» |
||||
kibibyte |
KiB |
1024 byte |
килобайт |
КБ |
1024 байт |
mebibyte |
MiB |
1024 KiB |
мегабайт |
МБ |
1024 КБ |
gibibyte |
GiB |
1024 MiB |
гигабайт |
ГБ |
1024 МБ |
tebibyte |
TiB |
1024 GiB |
терабайт |
ТБ |
1024 ГБ |
kibibit, kibit |
Kib |
1024 bit | Для этих величин в РФ утверждённых обозначений нет |
||
mebibit, mibit |
Mib |
1024 Kib |
|||
gibibit, gibit |
Gib |
1024 Mib |
|||
tebibit, tibit |
Tib |
1024 Gib |
|||
kilobyte |
KB |
1000 byte |
|||
megabyte |
MB |
1000 KB |
|||
gigabyte |
GB |
1000 MB |
|||
terabyte |
TB |
1000 GB |
|||
kilobit |
Kb |
1000 bit |
килобит |
Кб |
1000 бит |
megabit |
Mb |
1000 Kb |
мегабит |
Мб |
1000 Кб |
gigabit |
Gb |
1000 Mb |
гигабит |
Гб |
1000 Мб |
terabit |
Tb |
1000 Gb |
терабит |
Тб |
1000 Гб |
Мы видим, что Постановление Правительства от 2009 г. ввело обозначения для KiB, MiB, GiB,… лишив обозначения KB, MB, GB. Эта перестановка не решает главной проблемы: в России в 2 раза меньше утверждённых обозначений приставок для единиц количества информации, чем в международном стандарте МЭК 60027-2. Принятые обозначения не покрывают всех возможных вариантов. К тому же похожие по написанию и произношению (мегабайт) приставки обозначают разные множители!!!
Неофициальная практика, упомянутая в ГОСТ, покрывает все варианты: Б — байт, б — бит, 1 КБ = 1024 байт, 1кБ = 1000 байт.
Что делать?
Есть разные варианты. Например, скопировать международный стандарт. Или ввести ещё 2 группы приставок. Или узаконить неофициальную практику (см. выше). Лично я склоняюсь к первому варианту — не хотелось бы, чтобы наша страна (когда-то весьма прогрессивная в этом отношении) вступила в ряды любителей местных традиций в виде ярдов/унций/галлонов (путаница при совмещении которых с системой СИ уже была причиной серьёзных аварий).
Спасибо malan за указанные ошибки
Мегабайт в байты Средство преобразования
Armazenamento De DadosBit
Bit — это базовая единица вооружения цифровой информации. É um acrônimo para dígito binário. Cada bit registra uma das duas respostas Possíveis a uma única pergunta: 0 ou 1, sim ou não, ligado ou desligado. Quando um dado является представителем como binário (base 2) números, cada dígito binário é um único bit. (Em 1946, palavra «bit» foi изобретательский pelo estatístico americano e cientista da computação John Tukey.)
Byte
Byte — это единая информация, используемая для обработки вычислений. Refere-se uma unidade de memória endereçável. Seu tamanho pode Variar dependendo da máquina или linguagem de computação. На главном уровне контекста um byte é igual — 8 бит (или 1 октет). (Em 1956, unidade foi nomeado pelo engenheiro da IBM, Werner Buchholz.)
Caráter
Нет информации в цифровом формате, но не имеет значения, равного 8 битам.
Gibibyte
Гибибайт — это многократный байт, единое целое с цифровой информацией, prefixados pelas normas base multiplicador gibi (símbolo Gi).O símbolo da unidade de gibibyte é GiB.
Gigabit
Gigabit — это единое целое для цифровой информации или передачи. Размер 1024 мегабит, 1048576 килобит или 1073741824 бит
Gigabyte
Gigabyte — это единое хранилище цифровых данных. Размер 1024 мегабайта, 1.048.576 килобайт, или 1073741824 байта
Kibibyte
O Kibibyte (символ KiB, сокращение двоичного байта в килобайтах) является одним из основных средств массовой информации электронного обмена сообщениями, установленного IEC 2000 года. ) como: 1 кибибайт = 1.024 байта
Килобит
Килобит — это единая единица хранения цифровой информации или передачи. É igual a 1024 бит.
Килобайт
Килобайт — это единая броня цифровых данных. Размер 1024 байта.
Mebibyte
О mebibyte é um múltiplo do byte, uma unidade de armazenamento de informação digital, prefixado pelo multipliermebi padrões de base (símbolo Mi). Символы унидад де мебибайт é MiB.
Мегабит
Мегабит — это единое целое для цифровой информации или передачи.Значение 1024 или 1.048.576 бит.
Мегабайт
Мегабайт — это единая упаковка цифровых данных. Размер составляет 1024 или 1,048,576 байта.
Mword
Нет информации в цифровом формате, Mword имеет 4 байта или 32 бита.
Полубайт
Полубайт — Sucessão de quatro cifras binárias (биты) [1]. Полубайт = 4 бита, 2 полубайта = 1 байт = 8 битов, 4 полубайта = 1 слово = 2 байта = 16 бит
Петабит
Петабит — это однозначное обозначение цифровой информации или передачи.É igual 1024 терабайт, 1048576 гигабит, 1073741824 мегабит.
Петабайт
Петабайт — это единая упаковка цифровых данных. Размер 1024 терабайта, 1.048.576 гигабайт, 1073741824 мегабайт.
Qword
Нет цифровой информации, Qword имеет 8 или 64 бита.
Tebibyte
O tebibyte — um múltiplo do byte, uma unidade de armazenamento de informação digital, prefixados pelas normas base multiplicador Tebi (símbolo Ti).О символах унидаде тебибите TiB.
Терабит
Терабит — это единое целое для цифровой информации или передачи. É igual a 1024 гигабайта, 1048576 мегабит, 1073741824 килобит.
Терабайт
Терабайт — это единое целое с цифровыми данными. Размер составляет 1024 гигабайта, 1.048.576 мегабайт, килобайт 1073741824.
Палавра
Нет цифрового информационного наполнения, это может быть 2 байта или 16 бит.
6 МБ в ГБ | мегабайты в гигабайтах
Вот ответ на такие вопросы, как: Конвертер единиц данных.Что такое 6 мегабайт в гигабайтах? Сколько мегабайт в 6 гигабайтах?
Используйте указанные выше единицы данных или конвертер хранилища не только для преобразования из МБ в ГБ, но и для преобразования из / во многие единицы данных, используемые в памяти компьютера.
Таблица преобразования байт для двоичного и десятичного преобразования
Приведенная ниже диаграмма пытается объяснить сценарий 2016 года. Эти определения не являются консенсусом. Использование таких единиц, как кибибайт, мебибайт и т. Д. (IEC), широко не известно.
Двоичная система (традиционная)
В хранилище данных традиционно при описании цифровых схем килобайт составляет 2 10 или 1024 байта.Это происходит из-за двоичного возведения в степень, общего для этих схем. Это так называемая ДВОИЧНАЯ система, в которой кратность байтов всегда является некоторой степенью двойки.
Двоичный префикс киби (старый k) означает 2 10 или 1024, следовательно, 1 кибибайт равен 1024 байтам. Единицы (Kib, MiB и т. Д.) Были установлены Международной электротехнической комиссией (IEC) в 1998 году. Эти единицы используются для емкости оперативной памяти (RAM), такой как размер основной памяти и кеш-памяти ЦП, из-за двоичной адресации. памяти.40 байт = 1 099 511 627 776 байт и так далее …
Десятичная система (СИ)
В последнее время большинство производителей жестких дисков используют десятичные мегабайты (10 6 ), которые немного отличаются от десятичной системы для малых значений и значительно отличаются для значений порядка терабайт, что сбивает с толку. Это так называемая система DECIMAL, в которой кратность байтов всегда равна некоторой степени десяти, как показано ниже:
- 1 байт (B) = 8 бит (b) (один байт всегда 8 бит)
- 1 килобайт (кБ) = 10 3 байт = 1000 байт
- 1 мегабайт (МБ) = 10 6 байт = 1000000 байтов
- 1 гигабайт (ГБ) = 10 9 байт = 1000000000 байт
- 1 терабайт (ТБ) = 10 12 байт = 1 000 000 000 000 байтов и так далее…
Пожалуйста, проверьте таблицы ниже, чтобы узнать больше единиц.
Кратное значение бит
Единица | Символ | В битах | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Бит | бит | 1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Килобит | Кбит | 1000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
90ib167 | 90ib168 1 = 1024 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Мегабит | Мбит | 1000 2 = 1000000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Мебибит | Мибит | 1024 2 = 10485716 | = 1000000000||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Гибибит | Гибит | 1024 3 = 1073741824 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Терабит | Тбит | 1000 4 | 4 = 1099511627776 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Петабит | Пбит | 1000 5 = 1000000000000000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Pebibit | Pibit | 1024 5 = 1125899 | 2620||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 | Exbibit | Eibit | 1024 6 = 1152921504606850000 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zettabit | Zbit | 1000 7 = 1000000000000000000000 = 1000000000000000000 | | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Yottabit | Ybit | 1000 8 = 1000000000000000000000000 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Yobibit | Yibit | 1024 8 66 = 12089250000Число, кратное байту
|