Частотный словарь языка — словарь вероятностей (частот) появления букв в произвольном тексте – ниже. определите, какое количество информации несет каждая буква этого словаря. символ частота символ частота символ частота символ частота о 0.090 в 0.035 я 0.018 ж 0.007 е, е 0.072 к 0.028 ы, 3 0.016 ю, ш 0.006 а, и 0.062 м 0.026 ь, ъ, б 0.014 ц, щ, э 0.003 т, н 0.053 д 0.025 ч 0.013 ф 0.002 с 0.045 п 0.023 й 0.012 р 0.040 у 0.021 x 0.009 2. используя результат решения предыдущей , определите количество информации в слове “компьютер”.
I = -log2(P)
где I - количество информации, P - вероятность появления символа.
Мы можем использовать эту формулу для каждой буквы в словаре и вычислить количество информации для каждой из них. Давайте начнем:
1. Символ: "о"
Вероятность: 0.090
I = -log2(0.090) ≈ 3.169
2. Символ: "в"
Вероятность: 0.035
I = -log2(0.035) ≈ 4.809
3. Символ: "я"
Вероятность: 0.018
I = -log2(0.018) ≈ 5.221
4. Символ: "ж"
Вероятность: 0.007
I = -log2(0.007) ≈ 6.807
И так далее для всех символов в словаре. Выполним все вычисления:
символ | вероятность | количество информации
---------------------------------------------------
о | 0.090 | 3.169
в | 0.035 | 4.809
я | 0.018 | 5.221
ж | 0.007 | 6.807
е, е | 0.072 | 3.845
к | 0.028 | 5.176
ы, 3 | 0.016 | 5.684
ю, ш | 0.006 | 7.169
а, и | 0.062 | 3.976
м | 0.026 | 5.400
ь, ъ, б | 0.014 | 5.893
ц, щ, э | 0.003 | 8.742
т, н | 0.053 | 4.154
д | 0.025 | 5.472
ч | 0.013 | 5.985
ф | 0.002 | 9.965
с | 0.045 | 4.307
п | 0.023 | 5.662
й | 0.012 | 6.140
р | 0.040 | 4.754
у | 0.021 | 5.862
x | 0.009 | 6.878
Теперь, чтобы найти количество информации в слове "компьютер", нужно просуммировать количество информации для каждой буквы в слове:
I(компьютер) = I(к) + I(о) + I(м) + I(п) + I(ю) + I(т) + I(е) + I(р)
≈ 5.176 + 3.169 + 5.400 + 5.662 + 7.169 + 4.154 + 3.845 + 4.754
≈ 39.329
Таким образом, количество информации в слове "компьютер" составляет примерно 39.329 бит.