logo
Теор

5.3. Основные ресурсы Интернет [30, 33]

Информационные ресурсы Интернет – это вся совокупность информационных технологий и баз данных, доступных при помощи этих технологий и существующих в режиме постоянного обновления. Все связанные с представлением ресурса сервисы Интернет основаны на протоколах прикладного уровня, которые описывают взаимодействие между программой-клиентом и программой-сервером определенного сервиса (службы) Интернет. Поэтому понятие ресурса Сети неотрывно связано с протоколами прикладного уровня, используемыми для его организации.

FTP – система файловых архивов – это огромное распределенное, т. е. расположенное на машинах сети, в том числе и функционирующих на разных платформах, хранилище в виде файлов всевозможной накопленной информации. Любой пользователь может воспользоваться услугами анонимного доступа к этому хранилищу и скопировать интересующие его материалы. Объем программного обеспечения в архивах FTP составляет терабайты информации, и ни один пользователь или администратор сети не может просто физически обозреть эту информацию. Кроме программ в FTP-архивах можно найти стандарты Интернет-RFC (Request for Comments), пресс-релизы, книги по различным отраслям знаний, главным образом по компьютерной проблематике, и многое другое. Практически любой архив строится как иерархия директорий. Многие архивы дублируют информацию из других архивов (так называемые «зеркала» – mirrots). Для того чтобы получить нужную информацию, вовсе не обязательно ждать, когда информация будет передана из Австралии или Южной Африки, можно поискать «зеркало» где-нибудь ближе, например в Финляндии или Швеции. Для этой цели существует специальная программа Archie, которая позволяет просканировать FTP-архивы и найти тот, который устраивает пользователя по составу программного обеспечения и коммуникационным условиям.

Обеспечивающим протоколом является FTP (File Transfer Protocol) – протокол передачи файлов, который работает на 20 и 21 порту и предназначен для копирования файлов между компьютерами. Он полностью занимает канал, пока не будет получен файл, и сохраняет информацию о соединении. При сбое возможна «докачка» с того места, где произошел сбой.

Электронная почта (E-Mail). Ее обеспечением в Интернете занимаются специальные почтовые серверы. Почтовые серверы получают сообщения от клиентов и пересылают их по цепочке к почтовым серверам адресатов, где эти сообщения накапливаются. При установлении соединения между адресатом и его почтовым сервером происходит автоматическая передача поступивших сообщений на компьютер адресата.

Почтовая служба (электронная почта) основана на прикладных протоколах: SMTP, РОРЗ и IMAP-4 [41]. SMTP – 25 порт, IМАР-4 – 143 порт, РОРЗ – 110 порт. SMTP-протокол рассчитан на доставку почты до конкретного получателя, РОРЗ- и IMAP-4 – протоколы взаимодействия пользователя со своим почтовым ящиком на сервере. При использовании SMTP предполагается, что почтовый адрес указывает на компьютер конечного получателя и на этом компьютере запущена специальная программа, которая принимает и обрабатывает почту. Однако чаще всего бывает, что почта не доставляется на компьютер каждого отдельного пользователя, а обрабатывается централизованно, на отдельном почтовом сервере. В таком случае каждый пользователь имеет на почтовом сервере свой почтовый ящик. Почта доставляется до сервера по протоколу SMTP (конечный получатель – сервер) и помещается в почтовые ящики пользователей, затем пользователи подключаются к своим почтовым ящикам по протоколу РОРЗ или IMAP-4 и забирают почту.

Протокол РОРЗ требует полностью забрать всю почту, а затем принять решение о необходимости ее дальнейшего хранения.

Протокол IMAP-4 позволяет просматривать на сервере заголовки писем (указывается статус письма – новое, ответ и т. п.) и скачивать с сервера только необходимые письма или даже часть некоторого письма. Также можно на стороне сервера проводить поиск по сообщениям, создавать иерархию каталогов для хранения полученных писем (копии скачанных писем остаются на сервере, пока вы их не удалите). Фактически IMAP-4 дублирует функции почтовых программ пользователя (например, Microsoft Outlook), однако существенной разницей здесь является то, что если Micrsoft Outlook работает на компьютере пользователя, то команды протокола IMAP-4 выполняются на сервере, а значит, каталоги с письмами хранятся в одном месте (на сервере), что очень удобно, если подключение к серверу происходит с разных компьютеров и не надо на каждом компьютере иметь полную копию всех писем.

Наиболее распространенный вариант работы с почтой для обычного пользователя: отправка почты – по протоколу SMTP (на почтовый сервер получателя), получение почты – по протоколу РОРЗ или IMAP-4 (скачивание почты из почтового ящика на своем почтовом сервере).

Существует большое разнообразие клиентских почтовых программ. К ним относится, например, программа Microsoft Outlook Express, входящая в состав операционной системы Windows как стандартная. Из специализированных почтовых программ хорошую популярность получили программы The Bat!, Eudora, Pegasus mail.

Служба базируется на почтовом адресе пользователя, состоящего из имени пользователя, доменного имени почтового сервера, разделяемых символом @, например: IUP@TUT.BY.

Служба удаленного управления компьютером TELNET. Протокол TELNET работает на 23 порту и используется для подключения и управления удаленным компьютером. После подключения каждый символ, введенный на локальной машине, обрабатывается так, как если бы он был введен на удаленной машине. Либо может использоваться командный режим – управление удаленной машиной при помощи специальных команд. Такое управление еще называют консольным или терминальным. В прошлом эту службу широко использовали для проведения сложных расчетов на удаленных вычислительных центрах. Так, например, если для очень сложных вычислений на персональном компьютере требовались недели непрерывной работы, а на удаленной суперЭВМ всего несколько минут, то персональный компьютер применяли для удаленного ввода данных в ЭВМ и для приема полученных результатов.

Часто протоколы Telnet применяют для дистанционного управления техническими объектами, например телескопами, видеокамерами, промышленными роботами, автоматизированными складами и даже торговыми автоматами.

Приложение Telnet состоит из двух компонент:

– программы-клиента, обеспечивающей соединения с сервером, прием от абонента входных данных, преобразование их к стандартному формату и отсылку серверу, а также прием от сервера результатов запроса в стандартном формате и переформатирование их в вид, удобный клиенту;

– программы-сервера, обеспечивающей ожидание и обслуживание запроса, а также отсылку результатов программе-клиенту.

Каждый сервер, предоставляющий Telnet-услуги, обычно предлагает свое клиентское приложение. Его надо получить по Сети (например, по протоколу FTP), установить на своем компьютере, подключиться к серверу и работать с удаленным оборудованием. Простейший клиент Telnet входит в состав операционной системы Windows 98 (файл telnet.exe).

Служба ICQ. Эта служба предназначена для поиска сетевого IP-адреса компьютера, подключенного в данный момент к Интернету. Необходимость в подобной услуге связана с тем, что большинство пользователей не имеют постоянного IP-адреса. Название службы происходит от выражения I seek you – я тебя ищу. Для пользования этой службой надо зарегистрироваться на ее центральном сервере (http://www.icq.com) и получить персональный идентификационный номер UIN (Universal Internet Number). Данный номер можно сообщить партнерам по контактам, и тогда служба ICQ приобретает характер Интернет-пейджера. Зная номер UIN партнера, но не зная его текущий IР-адрес, можно через центральный сервер службы отправить ему сообщение с предложением установить соединение.

Как было указано выше, каждый компьютер, подключенный к Интернету, должен иметь четырехзначный IР-адрес. Этот адрес может быть постоянным или динамическим (временным). Те компьютеры, которые включены в Интернет на постоянной основе, имеют постоянные IP-адреса. Большинство же пользователей подключаются к Интернету лишь на время сеанса. Им выдается динамический IР-адрес, действующий только в течение данного сеанса. Этот адрес выдает тот сервер, через который происходит подключение. В разных сеансах динамический IР-адрес может быть различным, причем заранее не известно каким.

При каждом подключении к Интернету программа ICQ, установленная на нашем компьютере, определяет текущий IР-адрес и сообщает его центральной службе, которая, в свою очередь, оповещает наших партнеров по контактам. Далее наши партнеры (если они тоже являются клиентами данной службы) могут установить с нами прямую связь. Программа предоставляет возможность выбора режима связи («готов к контакту»; «прошу не беспокоить, но готов принять срочное сообщение»; «закрыт для контакта» и т. п.). После установления контакта связь происходит в режиме, аналогичном сервису IRC.

Служба IRC (Internet Relay Chat). IRC предназначена для прямого общения нескольких человек в режиме реального времени. Иногда службу IRC называют чат-конференциями, или просто чатом. В отличие от системы телеконференций, в которой общение между участниками обсуждения темы открыто всему миру, в системе IRC общение происходит только в пределах одного канала, в работе которого принимают участие обычно лишь несколько человек. Каждый пользователь может создать собственный канал и пригласить в него участников «беседы» или присоединиться к одному из открытых в данный момент каналов.

Службу IRC поддерживают броузеры WWW, а также существует несколько популярных клиентских программ для работы с серверами и сетями, поддерживающими сервис IRC.

Списки рассылки (Mailing List). Обычная электронная почта предполагает наличие двух партнеров по переписке. Если же партнеров нет, то достаточно большой поток почтовой информации в свой адрес можно обеспечить, подписавшись на списки рассылки – это специальные тематические серверы, собирающие информацию по определенным темам и переправляющие ее подписчикам в виде сообщений электронной почты.

Темой списков рассылки может быть что угодно, например вопросы, связанные с изучением иностранных языков, коммерческие и финансовые обзоры, презентация новых программных и аппаратных средств вычислительной техники. Большинство телекомпаний создают списки рассылки на своих узлах, через которые рассылают клиентам аннотированные обзоры телепрограмм. Списки рассылки позволяют эффективно решать вопросы регулярной доставки данных.

Служба телеконференций (Usenet). Служба телеконференций похожа на циркулярную рассылку электронной почты, в ходе которой одно сообщение отправляется не одному корреспонденту, а большой группе (такие группы называются телеконференциями, или группами новостей).

Обычное сообщение электронной почты пересылается по узкой цепочке серверов от отправителя к получателю. При этом не предполагается его хранение на промежуточных серверах. Сообщения, направленные на сервер группы новостей, отправляются с него на все серверы, с которыми он связан, если на них данного сообщения еще нет. Далее процесс повторяется. Характер распространения каждого отдельного сообщения напоминает лесной пожар.

На каждом из серверов поступившее сообщение хранится ограниченное время (обычно неделю), и все желающие могут в течение этого времени с ним ознакомиться. Распространяясь во все стороны менее чем за сутки, сообщения охватывают весь земной шар. Далее распространение затухает, поскольку на сервер, который уже имеет данное сообщение, повторная передача производиться не может.

Ежедневно в мире создается порядка миллиона сообщений для групп новостей. Выбрать в этом массиве действительно полезную информацию практически невозможно, поэтому вся система телеконференций разбита на тематические группы. Сегодня в мире насчитывают порядка 50 000 тематических групп новостей, они охватывают большинство тем, интересующих массы. Особой популярностью пользуются группы, посвященные вычислительной технике.

Базы данных Gopher. Протокол Gopher разработан в университете Миннесоты для доступа клиентов к файлам и каталогам в сети Интернет. Клиент Gopher может искать и считывать информацию на серверах Gopher. Протокол Gopher предоставляет чисто текстовую информацию и хорошо подходит для передачи больших документов, не содержащих форматирования или иллюстраций.

В основу интерфейсов Gopher положена идея иерархических каталогов. Внешне Gopher выглядит как огромная файловая система, которая расположена на машинах сети. Первоначально Gopher задумывался как информационная система университета с информационными ресурсами факультетов, кафедр, общежития и т. п. До сих пор основные информационные ресурсы Gopher сосредоточены в университетах. Gopher считается простой системой, легкой в установке, администрировании, достаточно надежной и защищенной. В странах СНГ, куда Интернет пришел позже, Gopher-серверы не получили широкого распространения, так как внедрение Интернет совпало с бурным развитием World Wide Web.

Базы данных WAIS это распределенная информационно-поисковая система Интернет. WAIS как перспективная разработка четырех ведущих американских компаний первое время была коммерческим продуктом, пока не появилась ее свободно распространяемая версия free WAIS. В основу системы положен принцип поиска информации с использованием логических запросов, основанных на применении ключевых слов. Клиент «обшаривает» все серверы WAIS на предмет наличия в них документов, удовлетворяющих запросу. WAIS широко применяется как поисковая машина в других информационных серверах Интернет, например WWW и Gopher. Наиболее известным проектом, где была применена WAIS, является электронная версия энциклопедии «Британика».

Информационный ресурс LISTSERV – это система почтовых списков сети BIT-NET (сеть образовательных учреждений). Однако это очень популярный ресурс в глобальных компьютерных сетях, и в Интернет существуют шлюзы для доступа к нему. LISTSERV специально ориентирован на применение в качестве транспорта электронной почты. Доступ к нему в интерактивном режиме затруднен. В мире насчитываются многие сотни списков LISTSERV, которые организованы по группам интересов, например существуют группы разработчиков программ ядерно-физи-ческих расчетов EGS-4 или группы любителей научной фантастики.

LISTSERV довольно сильно пересекается с Usenet, однако это не мешает существованию как одной, так и другой системы.

Информационная служба WHOIS – служба содержит информацию о пользователях сети, их электронные и обычные адреса, идентификаторы и реальные имена. В последнем случае дается краткое описание основных направлений их деятельности. WHOIS – распределенная система, это значит, что запросы отправляются по всему множеству серверов WHOIS в Интернет, если только не указан адрес конкретного сервера.

TRICKLE – это доступ по почте к архивам FTR, который организован через специальный шлюз. Этот шлюз имеет специальные навигационные средства для поиска нужной информации в Сети, пользователь может вести с ним своеобразный диалог по почте, вы­бирая нужную информацию путем ввода специальных команд TRICKLE.

Поисковые машины AltaVista, Google, MSN, Yahoo, Rambler, Апорт и другие представляют собой мощные информационно-поисковые системы, размещенные на серверах свободного доступа, специальные программы которых непрерывно в автоматическом режиме сканируют информацию Сети на основе заданных алгоритмов, проводя индексацию документов. В последующем поисковые машины предоставляют пользователю на основе созданных баз данных доступ к распределенной на узлах Сети информации через выполнение поискового запроса в рамках собственного интерфейса.