UTF-8 є системою кодування з змінною довжиною кодування символів, це означає що для кодування символів у UTF-8 використовується від одного до чотирьох байт на символ.7 лист. 2012 р.
Також може зустрічатися розмірність, у якій 1 кілобайт дорівнює 210 стандартним (8-бітним) байтам або 1024 байтам.
Тоді один символ – це один байт. Для кодування книги знадобиться 1000000 байт. 1 Кб =1024 байт, тоді для того, щоб взнати скільки кілобайт знадобиться треба 100000 поділити на 1024.
Байт мав довжину 8 біт, щоб зберігати символи в кодуванні EBCDIC та дві цифри в кодуванні BCD.
Гігабайт — кратна одиниця вимірювання кількості інформації, що дорівнює 1 073 741 824 (230) стандартним (8-бітним) байтам або 1024 мегабайтам.
Мегабайт (megabyte) — одиниця вимірювання обсягу даних. Рівна 1 048 576 (220) байт або 1024 кілобайт.
UTF-8 (від англ. Unicode Transformation Format — формат перетворення Юнікоду) — кодування, що реалізовує представлення Юнікоду, сумісне з 8-бітовим кодуванням тексту. Текст, що складається тільки з символів, коди яких менші ніж 128, при записі в UTF-8 перетворюється на звичайний текст ASCII. І навпаки, в тек…