11.3.1. Общая характеристика www
В течение последних лет предпринималось немало попыток разработать концепцию универсальной информационной базы данных, в которой можно было бы не только получать информацию из любой точки земного шара, но и иметь удобный способ связи информационных сегментов друг с другом, так чтобы наиболее важные данные быстро могли быть найдены. В 60-е годы исследования в этой области породили понятие <информационной Вселенной> (docuverse = documentation + universe), которая преобразила бы всю информационную деятельность, в частности в области образования. Но только в настоящее время появилась технология, воплотившая эту идею и предоставляющая возможности ее реализации в масштабах планеты.
WWW - это аббревиатура от <World Wide Web> (<Всемирная паутина>). Официальное определение World Wide Web звучит как мировая виртуальная файловая система - <широкомасштабная гипермедиа-среда, ориентированная на предоставление универсального доступа к документам>.
Проект WWW возник в начале 1989 г. в Европейской Лаборатории физики элементарных частиц (European Laboratory for Particle Physics (CERN) in Geneva, Switzerland). Основное назначение проекта - предоставить пользователям не профессионалам <on-line> доступ к информационным ресурсам. Результатом проекта World Wide Web (WWW, W3) является предоставление пользователям сетевых компьютеров достаточно простого доступа к самой разнообразной информации.
Используя популярный программный интерфейс, проект WWW изменил процесс просмотра и создания информации. Идея заключается в том, что по всему миру хаотично разбросаны тысячи информационных серверов и любую машину, подключенную к Internet в режиме on-line, можно преобразовать в сервер и начинить его информацией. С любого компьютера, подключенного к Internet, можно свободно установить сетевое соединение с таким сервером и получать от него информацию.
Первый такой сервер был организован в CERN'e, там же с целью развития и поддержки стандартов WWW-технологий создан The World Wide Web Consortium (или W3C). WWW-сервер The W3C's Web site является интегрирующим сервером по поддержке WEB-технологий Internet.
Позднее к проекту подключились и многие другие организации. Большой вклад в развитие WWW-технологий внес Национальный центр суперкомпьютерных приложений (National Centre for Supercomputing Applications - NCSA).
Информационный WWW-сервер использует гипертекстовую технологию. Для записи документов в гипертексте используется специальный, но очень простой язык HTML (Hypertext Markup Language),
Представление о гипертексте. Внешне гипертекст отличается от обычного текста тем, что часть слов или целые строки в нем, будучи выделены особым шрифтом или цветом, оказываются чувствительными к появлению на них указателя манипулятора <мышь>. При попадании на такую область текста указатель (часто стрелочка) изменяет первоначальный вид, становясь, например, ладошкой. Щелчок <мыши> в таком положении приводит к инициированию какого-либо события,
Прежде всего к загрузке в программу просмотра нового документа, приписанного так называемой гипертекстовой ссылкой к выделенной строкой текста. В результате у пользователя появляется возможность самому выбирать порядок просмотра тех или иных страниц, двигаясь по перемежающимся между собой нитям -паутинкам ссылок. Если при этом компьютер подключен к глобальной сети Internet, то в сценарий просмотра могут входить ресурсы всего мира, доступ к которым происходит по протоколу работы с гипертекстом, или HTTP (Hyper Text Transmit Protocol). После сказанного становится понятным представление об таких ресурсах как о Всемирной паутине.
Поскольку нетривиальный характер взаимодействия клиента и сервера по протоколу HTTP с удаленными ресурсами Сети скрыт от конечного пользователя за интерфейсом дружественной программы-просмотра гипертекстовых страниц (броузером, от англ. browse просматривать), начало работы в Web не представляет больших проблем.
Итак, гипертекст не может корректно отображаться обычным текстовым редактором, хотя последний вполне пригоден для его приготовления. Специально разработанный язык гипертекстовой разметки HTML позволяет превращать нужные элементы документа, включая не только текстовые поля, но и графику, в области <мыше-чувствительности>, или в гипертекстовые ссылки. Существует ряд причин, по которым необходимо остановиться на этом языке ниже чуть более подробно.
Для удобства ввода информации предусмотрены специальные формы, меню. Программы просмотра позволяют получать доступ не только к WWW-серверам, но и к другим службам Internet. С их помощью можно путешествовать по Gopher-серверам, искать информацию в WAIS-базах, получать файлы с файловых серверов по протоколу FTP. Поддерживается протокол обмена сетевыми новостями Usenet NNTP.
Вся польза WWW состоит в создании гипертекстовых документов, и если вас заинтересовал какой-либо пункт в таком документе, то достаточно <ткнуть> в него курсором для получения нужной информации. Также в одном документе возможно делать ссылки на другие, написанные другими авторами или даже расположенные на другом сервере. Одно из главных преимуществ WWW над другими средствами поиска и передачи информации - <многосредность>. В WWW можно увидеть на одной странице одновременно текст и изображение, звук и анимацию.
WWW - это в настоящее время самый популярный и самый интересный сервис Internet, самое популярное и удобное средство работы с информацией. Самое распространенное имя для компьютера в Internet сегодня - www, больше половины потока данных Internet приходится на долю WWW. Количество серверов WWW сегодня нельзя оценить сколько-либо точно, но по некоторым оценкам их более 300 тысяч. Скорость роста WWW даже выше, чем у самой сети Internet.
WWW работает по принципу клиент-сервер, точнее, клиент-серверы: существует множество серверов, которые по запросу клиент та возвращают ему гипермедийный документ - документ, состоящий из частей с разнообразным представлением информации, в котором каждый элемент может являться ссылкой на другой документ или его часть. Ссылки эти в документах WWW организованы таким
образом, что каждый информационный ресурс в глобальной сети Internet однозначно адресуется, и документ, который вы читаете в данный момент, способен ссылаться как на другие документы на этом же сервере, так и на документы (и вообще на ресурсы Internet) на других компьютерах Internet. Причем пользователь не замечает этого и работает со всем информационным пространством Internet как с единым целым. Ссылки WWW указывают не только на документы, специфичные для самой WWW, но и на прочие сервисы и информационные ресурсы Internet. Более того, большинство программ-клиентов WWW (browsers, навигаторы) не просто понимают такие ссылки, но и являются программами-клиентами соответствующих сервисов: ftp, gopher, сетевых новостей Usenet, электронной почты и т.д. Таким образом, программные средства WWW являются универсальными для различных сервисов Internet, а сама информационная система WWW играет интегрирующую роль.
Тип соединения с Internet. Подключение к Internet производится посредством сетевого адаптера или другого сетевого устройства, например модема или платы ISDN (Integrated Services Digital Network, Цифровая сеть с интеграцией сервиса). Скорость передачи информации в Internet выражается в битах в секунду.
Скорость передачи узла Internet определяет, насколько быстро проходят через него данные и сколько запросов такой узел сможет обслужить одновременно. Если число одновременных запросов превышает допустимое, то возможно возникновение задержек и срывов.
Скорости передачи арендуемых линий находятся в пределах от 56 000 bps (Frame Relay) до 45 000 000 bps (соединение ТЗ). Коммутируемая линия ISDN обеспечивает скорость вплоть до 128 000 bps.
Распространенные типы соединений в Internet представлены в табл. 11.1:
Таблица 11.1
Тип соединения | Максимальная скорость передачи | Приблизительное число пользователей |
Выделенный PPP/SLIP | Скорость модема | 2-3 |
56К (Frame Relay) | 56000 bps | 10-20 |
ISDN (использует РРР) | 128000 bps | 10-50 |
T1 | 1540000bps | 10&-500 |
Дробная T1 | По необходимости | По необходимости |
Т3 | 45000000 | 5000 и выше |
Мало загруженный сервер может использовать соединение 56К или ISDN. На сервер со средней загрузкой лучше установить линию или ее часть. Крупные организации, которые предполагают высокую загрузку своего узла Internet, могут нуждаться в дробной или множественной линии Т3, чтобы обслуживать тысячи пользователей.
Соединение с Internet при помощи модема обычно используется для индивидуальных клиентов и не рекомендуется для серверов. Такое соединение не в состоянии обслуживать более трех пользователей одновременно. Модемные соединения часто называют <медленными каналами>, так как скорость передачи через них обычно составляет от 9600 до 28800 bps. Это значительно меньше того, в чем нуждается, к примеру, сервер World Wide Web.
Аппаратное обеспечение. Существенное влияние на производительность сервера оказывают объем его оперативной памяти (RAM) и тип его процессора. Число пользователей, которых сервер может обслуживать одновременно, меняется в зависимости от типа открываемых ими сеансов и других факторов. Сервер может обслуживать в большем количестве тех пользователей, чьи сеансы меньше загружают его процессор. К числу таких сеансов относятся сеансы электронной почты.
Количество оперативной памяти, необходимое для сервера, зависит от ряда факторов, включающих:
число пользователей, обслуживаемых одновременно;
соотношение между числом пользователей HTTP (требуют много
памяти) и пользователей Gopher и FTP (требуют меньше памяти);
объем памяти, используемой под кэш;
размер файла подкачки (swap file);
объем свободного дискового пространства;
объем видеопамяти;
число запущенных сервисов;
тип процессора;
поиск в базах данных SQL.
Выбор ISP. Для подключения к Internetу необходим ISP (Internet Service Provider - Поставщик услуг Internetа). ISP предоставляет клиентам доступ к Internetу по телефонным линиям. Кроме того, ISP предоставляет услуги, такие, как аренда пространства на сервере и создание Web-страниц.
Очень важна территориальная близость ISP: независимо от типа используемого соединения цена растет с увеличением расстояния.
Также имеют значение надежность обслуживания, набор предлагаемых сервисов, наличие у ISP лишних каналов, скорость связи, цена, доступность обслуживающего персонала и сервисной службы.
Обращаясь к ISP, необходимо указать сервисы и потребность в полосе пропускания. После заключения контракта ISP сообщит ваш адрес IP, маску подсети, имена серверов DNS, проинструктирует о подключении его к сети и порекомендует любое необходимое дополнительное оборудование.
При выборе ISP основные критерии - местоположение, цена, надежность и набор предоставляемых сервисов.
Регистрация имени домена. Домены в Internetе различаются по уровням иерархии, например в iae.lt iae -домен второго уровня, а it - верхнего. Создавая домен, необходимо зарегистрировать его в руководящей организации, тогда имя домена будет включено в имя ее домена. Домены верхнего уровня классифицируют организации по типам (используется в США): gov (government - государственные), edu (educational - образовательные), org (organization - организации), net (главные центры поддержки сети), mil (военные группы), int ( международные), com (commercial - коммерческие), <country code> любая страна, географическая единица).
Чтобы присоединиться ко всем, кроме последнего, необходимо иметь аргументы, соответствующие предъявляемым строгим требованиям. Включение в домен com гораздо проще, однако все-таки нужно правильно определить, к какому из доменов верхнего уровня относится организация. Имя домена должно иметь смысл, легко запоминаться и вводиться с клавиатуры, а также не использоваться другой организацией на Internet.
Выбранное подходящее имя регистрируется. Обычно для этого из области Registration Web-страницы InterNIC получают текстовый бланк и заполняют его в любом редакторе или текстовом процессоре пни заполняют форму WWW, используя программу просмотра Web.
Необходимо сообщить InterNIC о себе некоторые данные. Во-первых, кто будет контактировать с ней по административным, техническим или финансовым вопросам, касающимся домена. Во-вторых, имена и IP-адреса серверов DNS, поддерживающих домен.
Заполненная форма отсылается электронной почтой в InterNIC. Через некоторое время поступают два ответа: первый -подтверждение получения запроса, второй - разрешение на использование имени домена.
Файловая система. Windows NT Server поддерживает две файловые системы для жестких дисков: NTFS (Windows NT File System) и FAT (File Allocation Table). Файловая система определяет формат жесткого диска и способ его взаимодействия с операционной системой.
FAT (таблица размещения файлов) - файловая система, совместимость с которой сохранили все файловые системы ПК. FAT обеспечивает доступ к файлам из MS DOS и OS/2. Однако при использовании FAT вы не сможете пользоваться возможностями Windows NT в сфере безопасности данных. Кроме того, FAT не может работать с файлами, превышающими определенные размеры, и не обладает мощностью NTFS. Например, FAT не позволяет автоматически восстанавливать поврежденные в результате сбоя данные.
NTFS (файловая система Windows NT) - позволяет использовать все возможности, которыми обладает Windows NT. Возможно даже указать для каждого пользователя определенные права доступа к каждому файлу или каталогу. Кроме того, эта файловая система ведет журнал операций, так что в случае внезапного сбоя питания (или другой аварийной ситуации) можно без потерь восстановить данные, находящиеся на диске. В отличие от FAT, NTFS позволяет использовать длинные имена файлов и поддерживает расширенный перечет файловых атрибутов. NTFS автоматически генерирует имена файлов, корректные для MS DOS, что обеспечивает совместимость с DOS приложениями. Эта система позволяет приложениям, написанным для других операционных систем (например, MS DOS), получат доступ к файлам NTFS при работе под управлением Windows NT.
NTFS разработана специально для максимального использования возможностей современных ПК, в которых может находиться несколько мощных процессоров и несколько жестких дисков большого объема.
Организация информации. Документы, предназначенные для экрана компьютера, могут содержать большое количество различных средств отображения информации, включая текст, числа, иллюстрации или фотографии, мультипликацию и цифровой аудиовизуальны материал, поэтому хорошо спроектированный интерфейс - основ проектирования WWW-документов и систем.
Разработка WWW-страниц требует, по крайней мере, базового представления о принципах проектирования интерфейса пользователя. Вопреки новизне компьютерных средств отображения информации и концептуальным трудностям объединения большого количества форм отображения информации в связное представление, существуют пока еще не слишком широко распространенные стандарты организации электронных документов.
Большинство современных концепций относительно структурирования информации относятся к организации книг, периодических изданий и индексации библиотек и систем каталогов, которые росли вокруг печатной информации. Разработка WWW-документов и гипертекстовых документов также должна подвергнуться подобному развитию и стандартизации, чтобы сделаться столь же легко доступной и в электронной форме.
Самая лучшая стратегия при разработке гипертекстового документа - последовательно применять хотя бы некоторые основные принципы построения документа к каждой создаваемой WWW-странице.
Хотя компьютерные гипертекстовые документы предоставляют множество новых возможностей проектировщикам информационных систем, основные принципы проектирования, создания, редактирования и организации электронных информационных систем почти не отличаются от текущей практики создания печатных средств информации.
Диапазон способов организации узлов Web весьма широк: от узлов, имеющих строгую линейную структуру, до узлов, у которых вообще нет четкой структуры. Обычно страницы располагаются в иерархическом или линейном порядке, а также в виде паутины.
Иерархическая организация. Узлы Web, которые следуют иерархической, или древовидной, организации, имеют единственную точку входа в узел, остальные страницы располагаются на исходящих из нее ответвлениях. Данный подход удобен, если информация легко разбивается на категории и подкатегории. При иерархической организации узла Web к странице самого нижнего уровня ведет один и только один путь.
Такая строгая структура узла может вызвать проблемы у пользователей. Например, если пользователь прошел на несколько уровней вниз по одному из путей, а потом решил попасть в другую часть дерева, то ему придется возвращаться обратно.
Линейная организация. Если необходимо, чтобы пользователи читали содержимое узла как книгу или журнал, или чтобы они прошли по заданному пути от начала и до конца узла, выбирается линейная организация.
Какая-то страница может иметь несколько связей с примечаниями и дополнениями, но для продвижения дальше пользователь должен вернуться на нее снова. Продвижение по документу осуществляется кнопкой Next, а возврат к началу узла-кнопкой Prev.
Организация в виде паутины. Организация информации в виде паутины, вероятно, наилучшим образом подходит для большинства случаев. В такой структуре страницы связаны друг с с другом общим контекстом. К одной странице может вести необходимо столько связей, и у каждого документа есть по крайней мере два входа связи иногда образуют круг.
Для просмотра Web эта организация узла наиболее удобна. Быстрый проход по узлу и большая свобода перемещения. Недостаток такой структуры в том, что пользователь может что-нибудь пропустить, пройдя по всем связям.
- Глава 4 информационные ресурсы и информатизация общества 64
- Раздел II прикладная информатика 82
- Глава 5. Общая характеристика процессов сбора, передачи, обработки и хранения информации 82
- Глава 6. Технические средства реализации информационных процессов 105
- Глава 11 глобальная информационная сеть internet 222
- Глава 12 искусственный интеллект 270
- Глава 13 экспертные системы 297
- Острейковский в.А. Информатика
- Введение
- Раздел I теоретическая информатика глава 1 основные понятия и определения информатики
- 1.1. Терминология информатики
- 1.2. Объект информатики
- 1.3. Предметная область информатики как науки
- 1.4. Краткая история развития информатики
- Контрольные вопросы
- Глава 2 информатика как наука
- 2.1. Категории информатики
- 2.2. Аксиоматика информатики
- 2.3. Виды и свойства информации
- Контрольные вопросы
- Глава 3. Математические основы информатики
- 3.1. Методы и модели оценки количества информации
- 3.2. Основные понятия теории алгоритмов
- 3.3. Системы счисления
- 3.3.1. Позиционные системы счисления
- 3.3.2. Двоичная система счисления
- 3.3.3. Другие позиционные системы счисления
- 3.3.4. Смешанные системы счисления
- 3.3.5. Перевод чисел из одной системы счисления в другую
- 3.4. Формы представления и преобразования информации
- 3.4.1. Числовая система эвм. Представление целых чисел без знака и со знаком
- 3.4.2. Индикаторы переноса и переполнения
- 3.4.3. Представление символьной информации в эвм
- 3.4.4. Форматы данных
- Контрольные вопросы, упражнения и задачи
- Глава 4 информационные ресурсы и информатизация общества
- 4.1. Особенности информационного ресурса
- 4.2. Формы и виды информационных ресурсов
- 4.3. Информатизация общества
- 4.3.1. Сущность и цели информатизации
- 4.3.2. Создание информационных структур
- 4.3.3. Формирование индустрии информатики
- 4.3.4. Развитие интеллектуального и информационного рынков
- 4.4. Перспективы перехода к информационному обществу
- Контрольные вопросы
- Раздел II прикладная информатика глава 5. Общая характеристика процессов сбора, передачи, обработки и хранения информации
- 5.1. Восприятие информации
- 5.2. Сбор информации
- 5.3. Передача информации
- 5.4. Обработка информации
- Контрольные вопросы
- Глава 6. Технические средства реализации информационных процессов
- 6.1. Определение и принципы организации информационных процессов в вычислительных устройствах
- 6.2. Функционирование эвм с шинной организацией
- 6.3. Функционирование эвм с канальной организацией
- 6.4. Информационная модель эвм
- 6.5. Основные команды эвм
- 6.6. Персональные эвм
- 6.6.1. Общие сведения о пэвм и их классификация
- 6.6.2. Структурная схема пэвм
- 6.6.3. Внешние устройства пэвм
- 6.6.4. Внешние запоминающие устройства пэвм
- 6.6.5. Печатающие устройства пэвм
- 6.6.6. Перспективы развития пэвм
- 6.7. Вычислительные системы
- 6.8. Поколения вычислительных средств
- Контрольные вопросы, упражнения и задачи
- Глава 7 алгоритмизация и программирование
- 7.1. Определение алгоритма
- 7.2. Методы разработки алгоритма
- 7.2.1. Метод частных целей
- 7.2.2. Метод подъема
- 7.3. Программирование с отходом назад
- 7.4. Алгоритмы ветвей и границ
- 7.5. Жизненный цикл программного обеспечения
- Контрольные вопросы, упражнения и задачи
- Раздел III элементы информационных технологий глава 8 базы и банки данных
- 8.1. Автоматизированные банки данных
- 8.2. Модели данных
- 8.3. Схема функционирования субд
- 8.4. Организация поиска данных
- 8.5. Администратор базы данных
- Контрольные вопросы
- Глава 9 пакеты прикладных программ
- 9.1. Классификация ппп
- 9.2. Проблемно-ориентированные ппп
- 9.4. Интегрированные ппп
- 9.4. Пакеты прикладных программ для решения научно-технических задач
- 9.5. Библиотеки стандартных программ
- Контрольные вопросы
- Глава 10 вычислительные сети
- 10.1. Принципы построения и классификация вычислительных сетей
- 10.2. Способы коммутации и передачи данных
- 10.3. Программное обеспечение вычислительных сетей
- 10.4. Локальные вычислительные сети
- 10.4.1. Классификация лвс
- 10.4.2. Организация обмена информацией в лвс
- 10.4.3. Методы доступа в лвс
- 10.4.4. Модели взаимодействия в лвс
- 10.5. Обеспечение безопасности информации в вычислительных сетях
- Контрольные вопросы
- Глава 11 глобальная информационная сеть internet
- 11.1. Краткая характеристика основных информационных ресурсов internet
- 11.2. Принципы функционирования internet
- 11.2.1. Иерархия протоколов internet
- 11.2.3. Спецификация универсального адреса информационного ресурса в internet
- 11.3. Технология world wide web (www)
- 11.3.1. Общая характеристика www
- 11.3.2. Программы-клиенты www
- 11.3.3. Стратегия поиска информации в сети
- 11.3.4. Язык гипертекстовой разметки web-документов html
- 11.3.5. Поисковые машины www
- 11.4. Электронная почта в internet
- 11.5. Технологии доступа к ресурсам internet, отличные от www
- 11.5.1. Удаленный доступ к ресурсам сети telnet
- 11.5.2. Обмен файлами по протоколу ftp. Служба архивов ftp
- Контрольные вопросы
- Глава 12 искусственный интеллект
- 12.1. Направление исследований в области искусственного интеллекта
- 12.2. Машинный интеллект и робототехника
- 12.3. Интеллектуальные роботы
- 12.4. Моделирование биологических систем
- 12.5. Эвристическое программирование и моделирование
- 12.6. Система знаний
- 12.7. Модели представления знаний
- 12.7.1. Логическая модель представления знаний
- 12.7.2. Сетевая модель представления знаний
- 12.7.3. Фреймовая модель представления знаний
- 12.7.4. Продукционная модель представления знаний
- Контрольные вопросы
- Глава 13 экспертные системы
- 13.1. Общая характеристика эс
- 13.2. Структура и режимы использования эс
- 13.3. Классификация инструментальных средств эс
- 13.4. Организация знаний в эс
- 13.5. Отличие эс от традиционных программ
- 13.6. Виды эс
- 13.7. Типы задач, решаемых эс
- Контрольные вопросы
- Приложение 3 глоссарий экспертных систем