2. Энтропия
•Энтропия источника информации с независимыми и равновероятными сообщениями есть среднее арифметическое количеств информации сообщений •H = - sum Pk*log2 Pk где k=1..N, a Pk - вероятность появления k-го сообщения.
•Другими словами, энтропия есть мера неопределенности ожидаемой информации.
Пример
•Пусть имеем два источника информации, один передает двоичный код с равновероятным появлением в нем 1 и О, другой имеет вероятность 1, равную 2-10, и вероятность 0, равную 1-2-10.
•Очевидно, что неопределенность в получении в очередном такте символа 1 или 0 от первого источника выше, чем от второго. Это подтверждается количественно оценкой энтропии: у первого источника Н = 1, у второго приблизительно Н = -2-10*1од22-10 , т.е. значительно меньше.
3. Коэффициент избыточности сообщения
•Коэффициент избыточности сообщения А определяется по формуле
•г = (Imax - l)/lmax,
•где I - количество информации в сообщении А, Imax - максимально возможное количество информации в сообщении той же длины, что и А.
•Пример избыточности дают сообщения на естественных языках, так, у русского языка г находится в пределах 0,3...0,5.
•Наличие избыточности позволяет ставить вопрос о сжатии информации без ее потери в передаваемых сообщениях.
4. Основные используемые коды
• Широко используются двоичные коды: •EBCDIC (Extended Binary Coded Decimal Interchange Code) - символы кодируются восемью битами; популярен благодаря его использованию в IBM;
•ASCII (American Standards Committee for Information Interchange) - семибитовый двоичный код.
•Оба этих кода включают битовые комбинации для печатаемых символов и некоторых распространенных командных слов типа NUL, CR, АСК, NAK и др.
Русский текст
•Для кодировки русского текста нужно вводить дополнительные битовые комбинации. Семибитовая кодировка здесь уже недостаточна. В восьмибитовой кодировке нужно под русские символы отводить двоичные комбинации, не занятые в общепринятом коде, чтобы сохранять неизменной кодировку латинских букв и других символов.
•Так возникли кодировка КОИ-8, затем при появлении персональных ЭВМ - альтернативная кодировка и при переходе к Windows - кодировка 1251. Множество используемых кодировок существенно усложняет проблему согласования почтовых программ в глобальных сетях.
- 1. Основные определения
- 1600...2000 Гц, а также автоматическое предварительное согласование способов модуляции в вызывающем и вызывном модемах. В протоколе v34.Bis скорости могут достигать 33,6 кбит/с.
- 5,725...5,85 ГГц пока лицензирования не требует.
- 400...512 Или 820...960 мГц, ширина радиоканала 25...200 кГц.
- 2. Энтропия
- 5. Асинхронное и синхронное кодирование
- 6. Манчестерское кодирование
- 7. Способы контроля правильности передачи данных
- 8. Код Хемминга
- 9. Циклические коды
- 11. Алгоритмы сжатия
- 2. Протоколы лвс
- 4. Аппаратные средства лвс
- 3. Сеть Fast Ethernet
- 1. Транспортные и сетевые
- 2. Управление потоками данных в сетях
- 3. Мостовые соединения
- 4. Маршрутизация
- 5. Транспортный протокол tcp в стеке протоколов tcp/ip
- 6. Коммутационное оборудование
- 7. Сетевой протокол ip в стеке протоколов tcp/ip
- 8. Другие протоколы в стеке
- 10. Протоколы управления в стеке
- 11. Протоколы spx/ipx
- 12. Сети передачи данных с коммутацией пакетов х.25
- 13. Сети Frame Relay (fr)
- 14. Причины появления сетей atm
- 15. Сетевое коммуникационное оборудование (по состоянию на конец 1997 г.)
- 18. Функции и характеристики сетевых операционных систем (ос)
- 19. Информационная безопасность
- 20. Распределенные вычисления
- 21. Технологии распределенных вычислений
- 22. Распределенные базы данных
- 23. Рекомендации по проектированию корпоративных сетей
- 1. Структура территориальных сетей
- 4. Электронная почта
- 5. Файловый обмен
- 9. Телеконференции и "доски объявлений"
- 10. Видеоконференции
- 11. Стандарты конференц-связи
- 12. Доступ к распределенным базам данных
- 13. Информационная система
- 14. Информационная система www
- 15. Язык html
- 16. Языки и средства создания Web-приложений
- 17. Разделяемые виртуальные миры (Sharing Virtual Worlds)
- 18. Примеры
- 19. Способы доступа к Internet