Универсальная система кодирования юникод представляет собой набор графических символов и их кодирования для компьютерной обработки текстовых данных. в юникоде определено 1,114,112 кодовых позиций, кодируемых номерами от 0 до 10. кодовые позиции обозначаются u+num, где num - номер кодовой позиции, например u + 0030 - символ '0'. одной из кодировок, используемых для хранения данных в юникод является кодировка utf-8. в зависимости от значения кодовой позиции она кодируется переменным числом байт, как показано на примере: u+007f 0; u+07ff 110 10; u+ 1110 10 10; кодовая позиция u+20ac кодируется тремя байтами e2 82 ac. буквы (кроме ё) занимают позиции u+0410 - u+42f (заглавные) и u+0430 - u+044f (строчные) и по алфавиту. предположим, что в файле в кодировке utf-8 хранится текст, содержащий только заглавные буквы (без буквы ё) длина текста 9000 байт. какой размер файла в байтах? какова избыточность кодирования такого текста в кодировке utf-8 в предположении, что все буквы имеют одинаковые частоты?

сема10 сема10    2   13.03.2019 20:43    74

Другие вопросы по теме Информатика