Для использования сетевого ресурса необходимо получить доступ к нему. Существуют три метода доступа:
- множественный доступ с контролем несущей,
- доступ с передачей маркера,
- доступ по приоритету запроса.
Метод доступа — это набор правил, которые определяют, как компьютер должен отправлять и принимать данные по сетевому кабелю.
Компьютеры получают доступ к сети поочередно на короткое время. Обычно несколько компьютеров в сети имеют совместный доступ к кабелю. Однако если два компьютера попытаются передавать данные одновременно, их пакеты столкнутся и будут испорчены. Возникает так называемая коллизия. Все компьютеры в сети должны использовать один и тот же метод доступа, иначе произойдет сбой в работе сети, когда отдельные компьютеры, чьи методы доминируют, не позволят остальным осуществлять передачу.
Множественный доступ сконтролем несущей подразделяется на:
- множественный доступ с обнаружением коллизий;
- множественный доступ с предотвращением коллизий.
Рассмотрим особенности каждого метода доступа.
Множественный доступ с контролем несущей и обнаружением коллизий (CSMA/CD). Все компьютеры в сети ? и клиенты, и серверы — прослушивают кабель, стремясь обнаружить передаваемые данные, т.е. трафик. Компьютер может начать передачу только тогда, когда убедится, что кабель свободен — трафик отсутствует. Пока кабель занят, ни один из компьютеров не может вести передачу. Если возникает коллизия, то эти компьютеры приостанавливают передачу на случайный интервал времени, а затем вновь стараются наладить связь. Причем периоды ожидания у них разные, что снижает вероятность одновременного возобновления передачи.
Название метода раскрывает его суть: компьютеры как бы прослушивают кабель, отсюда — контроль несущей. Чаще всего сразу несколько компьютеров в сети хотят передать данные, отсюда множественный доступ. Прослушивание кабеля дает возможность обнаружить коллизии, отсюда обнаружение коллизий.
Способность обнаруживать коллизии ограничивает область действия самого CSMA/CD. При длине кабеля2,5 км механизм обнаружения коллизий становится неэффективным — некоторые компьютеры могут не услышать сигнал и начнут передачу, что приведет к коллизии и разрушению данных.
CSMA/CD является состязательным методом, так как компьютеры конкурируют между собой за право передавать данные. Он является громоздким, но современные реализации настолько быстры, что пользователи не замечают, что сеть работает, используя состязательный метод. Однако чем больше компьютеров в сети, тем интенсивнее сетевой трафик, и число коллизий возрастает, а это приводит к уменьшению пропускной способности сети. Поэтому в некоторых случаях метод CSMA/CD все же оказывается недостаточно быстрым. Так, лавинообразное нарастание повторных передач способно парализовать работу всей сети. Вероятность возникновения подобной ситуации зависит от числа пользователей, работающих в сети, и приложений, с которыми они работают. Например, БД используют сеть интенсивнее, чем ТП.
Множественный доступ с контролем несущей и предотвращением коллизий (CSMA/CA). Этот метод самый непопулярный среди всех методов доступа. Каждый компьютер перед передачей данных в сеть сигнализирует о своем намерении, поэтому остальные компьютеры «узнают» о готовящейся передаче и могут избежать коллизий. Однако широковещательное оповещение увеличивает общий трафик и уменьшает пропускную способность сети. Поэтому CSMA/CA работает медленнее, чем CSMA/CD.
Доступ с передачей маркера. Суть метода заключается в следующем: пакет особого типа, маркер (token), циркулирует от компьютера к компьютеру. Чтобы послать данные в сеть, любой компьютер должен сначала «дождаться» прихода свободного маркера и «захватить» его. Захватив маркер, компьютер может передавать данные. Когда какой-либо компьютер наполнит маркер своей информацией и пошлет его по сетевому кабелю, другие компьютеры уже не смогут передавать данные, так как в каждый момент времени только один компьютер использует маркер. В сети не возникает ни состязания, ни коллизий, ни временных задержек.
Доступ по приоритету запроса (demand priority). Относительно новый метод доступа, разработанный для сети Ethernet со скоростью передачи 100 Мбит/с ? 100VG-AnyLan. Этот метод учитывает своеобразную конфигурацию сетей 100VG-AnyLan, которые состоят только из концентраторов и оконечных узлов. Концентраторы управляют доступом к кабелю, последовательно опрашивая каждый узел в сети и выявляя запросы на передачу. Концентратор должен знать все адреса связи и узлы и проверять их работоспособность. Оконечным узлом в соответствии со спецификацией 100VG-AnyLan может быть компьютер, мост, маршрутизатор или коммутатор.
При доступе по приоритету запроса, как и при CSMA/CD, два компьютера могут конкурировать за право передать данные. Однако в этом методе реализуется принцип, по которому определенные типы данных, если возникло состязание, имеют соответствующий приоритет. Получив одновременно два запроса, концентратор вначале отдает предпочтение запросу с более высоким приоритетом. Если запросы имеют одинаковый приоритет, они будут выполнены в произвольном порядке.
Для сетей с использованием доступа по приоритету запроса разработана специальная схема кабеля, поэтому каждый компьютер может одновременно передавать и принимать данные. Применяется восьмипроводный кабель, по каждой паре проводов которого сигнал передается с частотой 25 Мгц.
Передача данных по сети
Данные, состоящие из нулей и единиц, обычно содержатся в больших по размерам файлах. Однако сети не будут нормально работать, если компьютер будет посылать такой блок данных целиком. В это время другие компьютеры вынуждены долго ждать своей очереди. Такая ситуация похожа на монопольное использование сети. При этом, кроме монопольного использования сети, возникновение ошибок может привести к необходимости повторной передачи всего большого блока данных.
Чтобы быстро, не тратя времени на ожидание, передавать информацию по сети, данные разбиваются на маленькие управляемые блоки, содержащие все необходимые сведения для их передачи. Эти блоки называются пакетами. Под термином «пакет» подразумевается единица информации, передаваемая между устройствами сети как единое целое.
При разбиении данных на пакеты сетевая ОС добавляет к каждому пакету специальную управляющую информацию, которая обеспечивает передачу исходных данных небольшими блоками, сбор данных в определенном порядке (при их получении), проверку данных на наличие ошибок (после сборки).
Компоненты пакета группируются по трем разделам: заголовок, данные и трейлер.
Заголовок включает:
- сигнал о том, что передается пакет,
- адрес источника,
- адрес получателя,
- информацию, синхронизирующую передачу.
Для большинства сетей размер пакета составляет от 512 байт до 4 Кбайт.
Содержимое трейлера зависит от протокола связи (протокол ? это набор правил или стандартов для осуществления связи и обмена информацией между компьютерами). Чаще всего трейлер содержит информацию для проверки ошибок, называемую избыточным циклическим кодом (CRC). CRC ? это число, получаемое в результате математических преобразований данных пакета и исходной информации. Когда пакет достигает места назначения, эти преобразования повторяются. Если результат совпадает с CRC ? пакет принимается без ошибок. В противном случае передача пакета повторяется.
Формат и размер пакета зависят от типа сети. Максимальный размер пакета определяет количество пакетов, которое будет создано сетевой ОС для передачи большого блока данных.
Сети Ethernet
Ethernet — самая популярная сейчас архитектура. Используется в сетях любого размера. Ethernet — это промышленный стандарт, нашедший широкую поддержку среди производителей сетевого оборудования. Поэтому проблем, связанных с использованием устройств разных производителей, почти не существует.
В конце 60-х гг. Гавайский университет разработал ГВС под названием ALOHA. Университет, расположенный на обширной территории, решил объединить в сеть все компьютеры. Одной из ключевых характеристик созданной сети стал метод доступа CSMA/CD. Эта сеть послужила основой для современных сетей Ethernet. В 1972 г. в исследовательском центре Пало Альто фирмы Xerox разработали кабельную систему и схему передачи сигналов, а в 1975 г. — первый продукт Ethernet. Первоначальная версия Ethernet представляла собой систему со скоростью передачи 2,94 Мбит/с и объединяла более 100 компьютеров с помощью кабеля длиной 1 км. Сеть Ethernet фирмы Xerox имела такой успех, что компании Xerox, Intel Corporation и Digital Equipment Corporation разработали стандарт Ethernet со скоростью передачи 10 Мбит/с. Сегодня его рассматривают как спецификацию, описывающую метод совместного использования среды передачи компьютерами и системами обработки данных. Спецификация Ethernet выполняет те же функции, что Физический и Канальный уровни модели OSI.
Ethernet использует немодулированную передачу, топологию шина и метод доступа CSMA/CD. Другие используемые топологии ? звезда-шина. Скорость передачи данных — 10 или 100 Мбит/с. Кабельная система — толстый и тонкий коаксиальный кабель, неэкранированная витая пара (UTP).
Ethernet разбивает данные на пакеты (кадры), формат которых отличается от формата пакетов в других сетях. Длина 64—1518 байтов, но сама структура использует 18 байтов, поэтому остается 46?1500 байтов.
Максимальная общая длина сети 925 м. Общее число компьютеров в сети достигает 1024.
Сети Token Ring
Версия сети Token Ring была представлена IBM в 1984 г. как часть предложенного фирмой способа объединения в сеть всего ряда выпускаемых IBM компьютеров и компьютерных систем. В 1985 г. Token Ring стала стандартом.
От других сетей Token Ring отличает не только наличие уникальной кабельной системы, но и использование метода доступа с передачей маркера. Топология типичной сети ? звезда/кольцо. Соединение выполняется через концентратор в виде звезды, а физическое кольцо реализуется в концентраторе. Кабельная система ? неэкранированная и экранированная витая пара (UTP, STP). Скорость передачи — 4 и 16 Мбит/с.
Когда в сети начинает работать первый компьютер, он генерирует маркер. Маркер проходит по кольцу от компьютера к компьютеру (направление движения маркера зависит от оборудования), пока один из них не сообщит о готовности передать данные и не возьмет управление маркером на себя. Маркер — это предопределенная последовательность бит, которая позволяет компьютеру отправить данные по кабелю. Когда маркер захвачен каким-либо компьютером, другие передавать данные не могут. Захватив маркер, компьютер отправляет кадр данных в сеть. Кадр проходит по кольцу, пока не достигнет узла с адресом, соответствующим адресу приемника в кадре. Компьютер-приемник копирует кадр в буфер приема и делает пометку в поле статуса кадра о получении информации. Кадр продолжает передаваться по кольцу, пока не достигнет отправившего его компьютера, который и удостоверяется, что передача прошла успешно. Компьютер изымает кадр из кольца и возвращает туда маркер. В сети одномоментно может передаваться только один маркер, причем только в одном направлении.
Передача маркера — детерминистический процесс. Это значит, что самостоятельно начать работу в сети (как при методе доступа CSMA/CD) компьютер не может. Он может передавать данные только после получения маркера. Каждый компьютер действует как однонаправленный повторитель, регенерируя маркер и посылая его дальше по кольцу.
Основным компонентом сетей Token Ring является концентратор, реализующий физическое кольцо. В сети с передачей маркера вышедший из строя компьютер или соединение останавливают движение маркера, что ведет к прекращению работы всей сети. Концентраторы разработаны таким образом, чтобы обнаруживать вышедшую из строя плату СА и вовремя отключать ее. Эта процедура позволяет обойти отказавший компьютер, поэтому маркер продолжает циркулировать по сети.
СетеВые протоколы
Протоколы ? это набор правил и процедур, регулирующих порядок осуществления некоторой связи. Протоколы реализуются во всех областях деятельности человека, например, дипломатических. В сетевой среде — это правила и технические процедуры, позволяющие нескольким компьютерам общаться друг с другом.
Различают три определяющих свойства протоколов:
- Каждый протокол предназначен для различных задач иимеет свои преимущества и недостатки.
- Протоколы работают на разных уровнях модели OSI.Функции протокола определяются уровнем, на котором он работает.
- Несколько протоколов могутработать совместно. В этом случае они образуют так называемый стек,или набор протоколов. Как сетевые функции распределяются повсем уровням модели OSI, так и протоколы совместноработают на различных уровнях стека. Например, Прикладной уровеньпротокола TCP/IP соответствует уровнюПредставления модели OSI. В совокупности протоколыопределяют полный набор функций и возможностей стека.
Передача данных по сети должна быть разбита на ряд последовательных шагов, каждому из которых соответствует свой протокол. Эти шаги должны выполняться на каждом сетевом компьютере в одной и той же последовательности. На компьютере-отправителе они выполняются сверху вниз, а на компьютере-получателе — снизу вверх.
Компьютер-отправитель в соответствии с протоколом выполняет следующие действия: разбивает данные на небольшие блоки ? пакеты, с которыми может работать протокол; добавляет к пакетам адресную информацию, чтобы компьютер-получатель мог определить, что эти данные предназначены именно ему; подготавливает данные к передаче через плату СА по сетевому кабелю.
Компьютер-получатель в соответствии с протоколом выполняет те же действия, но в обратном порядке. Он принимает пакеты данных из сетевого кабеля и через плату СА передает пакеты в компьютер. Затем он удаляет из пакета всю служебную информацию, добавленную компьютером-отправителем; копирует данные из пакета в буфер для их объединения в исходный блок данных; передает приложению собранный из пакетов блок данных в том формате, который использует это приложение.
И компьютеру-отправителю, и компьютеру-получателю необходимо выполнять каждое действие одинаковым способом, чтобы отправленные данные совпали с полученными.
До середины 80-х гг. большинство ЛВС были изолированными. С развитием ЛВС и увеличением объема передаваемой ими информации они стали компонентами больших сетей. Данные, передаваемые из одной локальной сети в другую по одному из возможных маршрутов, называются маршрутизированными, а протоколы, поддерживающие передачу данных между сетями по нескольким маршрутам, — маршрутизируемыми. Такие протоколы служат для объединения локальных сетей, поэтому их роль постоянно возрастает.
Модель OSI помогает определить, какие протоколы нужно использовать на каждом ее уровне. Продукты разных производителей, которые соответствуют этой модели, способны вполне корректно взаимодействовать друг с другом. ISO, IEEE, ANSI, ITU и другие организации по стандартизации разработали протоколы, соответствующие некоторым уровням модели OSI.
TCP/IP — стандартный промышленный набор протоколов, обеспечивающий связь в неоднородной среде, т.е. между компьютерами разных типов. Совместимость — одно из основных преимуществ TCP/IP, поэтому его поддерживают большинство ЛВС. Кроме того, TCP/IP предоставляет маршрутизируемый протокол для корпоративных сетей и доступ в Интернет. Из-за своей популярности TCP/IP стал стандартом де-факто для межсетевого взаимодействия. У TCP/IP есть два главных недостатка: большой размер и недостаточная скорость работы. Но для современных ОС это не является проблемой (проблема только у DOS-клиентов), а скорость работы сравнима со скоростью работы протокола IPX.
Стек TCP/IP включает и другие протоколы:
- SMTP (Simple Mail Transfer Protocol) ? для обмена E-mail;
- FPT (File Transfer Protocol) — для обмена файлами;
- SNMP (Simple Network Management Protocol) — для управления сетью.
TCP/IP разрабатывался специалистами МО США как маршрутизируемый, надежный и функциональный протокол. Он также представляет собой набор протоколов для ГВС. Его назначение — обеспечивать взаимодействие между узлами даже в случае ядерной войны. Сейчас ответственность за разработку TCP/IP возложена на сообщество Интернет в целом. Установка и настройка TCP/IP требует знаний и опыта со стороны пользователя, однако применение TCP/IP предоставляет ряд существенных преимуществ.
Протокол TCP/IP в точности не соответствует модели OSI. Вместо семи уровней в нем используется только четыре:
- Уровень сетевого интерфейса.
- Межсетевой уровень.
- Транспортный уровень.
- Прикладной уровень.
Каждый из них соответствует одному или нескольким уровням модели OSI.
Уровень сетевого интерфейса, относящийся к Физическому и Канальному уровням модели OSI, напрямую взаимодействует с сетью. Он реализует интерфейс между сетевой архитектурой (Ethernet или Token Ring) и Межсетевым уровнем.
Межсетевой уровень, относящийся к Сетевому уровню модели OSI, использует несколько протоколов для маршрутизации и доставки пакетов. Для этого используются маршрутизаторы, которые работают на Сетевом уровне и могут переадресовывать и маршрутизировать пакеты через множество сетей, обмениваясь информацией между отдельными сетями.
Транспортный уровень, соответствующий Транспортному уровню модели OSI, отвечает за установку и поддержание соединения между двумя хостами. Транспортный уровень отвечает также за отправку уведомлений о получении данных, управление потоком, упорядочение пакетов и их повторную передачу. Transmission Control Protocol (TCP) отвечает за надежную передачу данных между узлами. Это ориентированный на соединение протокол, поэтому он устанавливает сеанс связи между двумя компьютерами прежде, чем начать передачу.
Прикладной уровень, соответствующий Сеансовому, Представительскому и Прикладному уровням модели OSI, соединяет в сети приложения.
Среда клиент-серВер
Раньше сетевые системы основывались на модели централизованных вычислений, в которой один мощный сервер — мейнфрейм выполнял основную работу в сети, а пользователи получали доступ к нему при помощи недорогих и низкопроизводительных компьютеров — терминалов. В результате развития персональных компьютеров централизованную модель заменила модель клиент-сервер, предоставляющая при той же производительности возможности сетевой обработки данных.
В настоящее время большинство сетей использует модель клиент-сервер. Сеть архитектуры клиент-сервер ? это сетевая среда, в которой компьютер-клиент инициирует запрос компьютеру-серверу, выполняющему этот запрос. Рассмотрим работу модели на примере системы управления БД — приложения, часто используемого в среде клиент-сервер. В модели клиент-сервер ПО клиента использует язык структурированных запросов SQL (Structured Query Language), который переводит запрос с языка, понятного пользователю, на язык, понятный машине. SQL близок к естественному английскому.
Клиент (пользователь) генерирует запрос с помощью интерфейсного приложения, которое обеспечивает интерфейс пользователя, формирует запросы и отображает данные, полученные с сервера. В клиент-серверной среде сервер не наделяется пользовательским интерфейсом. Представлением данных в удобной форме занимается сам клиент. Компьютер-клиент получает инструкции от пользователя, готовит их для сервера, а затем по сети посылает ему запрос. Сервер обрабатывает запрос, проводит поиск необходимых данных и отсылает их клиенту. Клиент в удобной для пользователя форме отображает полученную информацию. В клиент-серверной среде пользователь компьютера-клиента имеет дело с экранной формой. В ней он задает необходимые параметры информации. Интерфейсная часть одну и ту же информацию может представлять в различном виде.
Сервер в клиент-серверной среде обычно предназначен для хранения данных и управления ими. Именно сервер выполняет большинство операций с данными. Сервер называют также прикладной частью модели клиент-сервер, так как именно он выполняет запросы клиентов. Обработка данных на сервере состоит из их сортировки, извлечения затребованной информации и отправки ее по адресу пользователя. ПО предусматривает также обновление, удаление, добавление и защиту информации.
Технология клиент-сервер создает мощную среду, обладающую множеством реальных преимуществ. В частности, хорошо спланированная клиент-серверная система обеспечивает относительно недорогую платформу, которая обладает в то же время вычислительными возможностями мэйнфрейма и легко настраивается на выполнение конкретных задач. Кроме того, в среде клиент-сервер резко уменьшается сетевой трафик, так как по сети пересылаются только результаты запросов. Файловые операции выполняются в основном более мощным сервером, поэтому запросы лучше обслуживаются. Это означает, что нагрузка на сеть распределяется более равномерно, чем в традиционных сетях на основе файл-сервера. Уменьшается потребность компьютеров-клиентов в ОЗУ, так как вся работа с файлами выполняется на сервере. По этой же причине на компьютерах-клиентах уменьшается потребность в дисковом пространстве. Упрощается управление системой, контроль ее безопасности становится проще, так как все файлы и данные размещаются на сервере. Упрощается резервное копирование.
7.9. internet: как иерархия сетей
Слово Internet происходит от выражения interconnected networks (связанные сети). Это глобальное сообщество малых и больших сетей. В широком смысле — это глобальное информационное пространство, хранящее огромное количество информации на миллионах компьютеров, которые обмениваются данными.
К концу 1969 г. в США был завершен проект ARPAnet подключением в одну компьютерную сеть 4 исследовательских центров. Проект также предусматривал проведение экспериментов в области компьютерных коммуникаций, изучение способов поддержания связи в условиях ядерного нападения и разработку концепции децентрализованного управления военными и гражданскими объектами в период ведения войн. В 1972 г. Минобороны США начало разработку новой программы Internetting Project; с целью изучения методов соединения сетей между собой. Выдвигались требования максимальной надежности передачи данных при заведомо низком качестве коммуникаций, средств связи и оборудования и возможности передачи больших объемов информации. В 1974 г. была поставлена задача разработки универсального протокола передачи данных, которая была решена созданием протокола передачи данных и объединения сетей ? Transmission Control Protocol/Internet Protocol (ТСР/IР). В 1983 г. был осуществлен перевод ARPAnet на ТСР/IР. В 1989 г. в Европейской лаборатории физики элементарных частиц (Швейцария, Женева) Тим Бернерс-Ли разработал технологию гипертекстовых документов — World Wide Web, позволяющую пользователям иметь доступ к любой информации, находящейся в сети Интернет на компьютерах по всему миру. К 1995 г. темпы роста сети показали, что регулирование вопросов подключения и финансирования не может находиться в руках одного Национального научного фонда США, и в этом же году произошла передача региональным сетям оплаты за подсоединение многочисленных частных сетей к национальной магистрали.
Рассмотрим схему подключения компьютера к Интернет и проследим, по каким каналам передается информация, посылаемая в Сеть и принимаемая из Сети. Подключение к Интернету домашнего компьютера выполняется, как правило, с помощью модема (рис.). При этом чаще всего осуществляется так называемое сеансовое соединение с провайдером по телефонной линии. Набирается один из телефонных номеров, предоставленных провайдером, для соединения с одним из его модемов. У провайдера имеется набор модемов, так называемый модемный пул. После того, как вы соединились с ISP (Internet Service Provider), ваш компьютер становится частью сети данного ISP. Каждый провайдер имеет свою магистральную линию.
ISP-провайдеры имеют так называемые точки присутствия РОР (Point of Presence), где происходит подключение локальных пользователей. Провайдер может иметь точки присутствия РОР в нескольких городах. В каждом городе находятся аналогичные модемные пулы, на которые звонят локальные клиенты этого провайдера в данном городе. Провайдер обычно арендует волоконно-оптические линии у телефонной компании для соединения всех своих точек присутствия. Крупные коммуникационные компании имеют собственные высокопропускные каналы.
Пусть имеются опорные сети двух Интернет-провайдеров. Очевидно, что все клиенты провайдера А могут взаимодействовать между собой по собственной сети, а все клиенты провайдера В ? по своей, но при отсутствии связи между сетями А и В клиенты разных провайдеров не могут связаться друг с другом. Для реализации такой услуги провайдеры А и В подключаются к так называемым точкам доступа NАР (Network Access Points) в разных городах, и трафик между двумя сетями течет через NАР. Аналогично организуется подключение к другим магистральным сетям, в результате чего образуется объединение множества сетей высокого уровня. В Интернете действуют сотни крупных провайдеров, их магистральные сети связаны через NАР в различных городах, и миллиарды байтов данных текут по разным сетям через NAР-узлы.
В офисе компьютеры, скорее всего, подключены к локальной сети. В этом случае рассмотренная схема видоизменяется. Варианты подключения к провайдеру могут быть различными, хотя чаще всего это выделенная линия.
На сегодняшний день существует множество компаний, имеющих собственные опорные сети, которые связываются с помощью NАР с сетями других компаний по всему миру. Благодаря этому каждый, кто находится в Интернете, имеет доступ к любому его узлу, независимо от того, где он расположен территориально.
Скорость передачи информации на различных участках Интернета существенно различается. Магистральные линии ? это высокоскоростные каналы, построенные на основе волоконно-оптических кабелей. Кабели обозначаются ОС (optical carrier), например ОС-3, ОС-12 или ОС-48. Так, линия ОС-3 может передавать 155 Мбит/с, а ОС-48 — 2488 Мбит/с (2,488 Гбит/с). Но максимальная скорость получения информации на домашний компьютер с модемным подключением, как правило, не превышает 56 Кбит/с.
Как же происходит передача информации по всем этим многочисленным каналам? Доставка информации по нужному адресу выполняется с помощью маршрутизаторов, определяющих, по какому маршруту передавать информацию. Маршрутизатор — это устройство, которое работает с несколькими каналами, направляя в выбранный канал очередной блок данных. Выбор канала осуществляется по адресу, указанному в заголовке поступившего сообщения.
Таким образом, маршрутизатор выполняет две взаимосвязанные функции. Во-первых, он направляет информацию по свободным каналам, предотвращая закупорку узких мест в Сети; во-вторых, проверяет, что информация следует в нужном направлении. При объединении двух сетей маршрутизатор включается в обе сети, пропуская информацию из одной в другую. В некоторых случаях он осуществляет перевод данных из одного протокола в другой, при этом защищая сети от лишнего трафика.
Протоколы internet
Различают два типа протоколов: базовые и прикладные. Базовые протоколы отвечают за физическую пересылку сообщений между компьютерами в сети Internet. Это протоколы IР и ТСР. Прикладными называют протоколы более высокого уровня, они отвечают за функционирование специализированных служб. Например:
- протокол НТТР служит для передачи гипертекстовых сообщений,
- протокол FТР — для передачи файлов,
- SМТР — для передачи электронной почты.
Набор протоколов разных уровней, работающих одновременно, называют стеком протоколов. Каждый нижележащий уровень стека протоколов имеет свою систему правил и предоставляет сервис вышележащим. Аналогично каждый протокол в стеке протоколов выполняет свою функцию, не заботясь о функциях протокола другого уровня.
На нижнем уровне используются два основных протокола: IP и ТСР. Архитектура протоколов ТСР/IР предназначена для объединения сетей. В их качестве могут выступать разные ЛВС, различные национальные, региональные и глобальные сети. К этим сетям могут подключаться машины разных типов. Каждая из сетей работает в соответствии со своими принципами и типом связи. При этом каждая сеть может принять пакет информации и доставить его по указанному адресу. Таким образом, требуется, чтобы каждая сеть имела некий сквозной протокол для передачи сообщений между двумя внешними сетями.
Предположим, имеется некое послание, отправляемое по электронной почте. Передача почты осуществляется по прикладному протоколу SMTP, который опирается на протоколы ТСР/IР. Согласно протоколу ТСР, отправляемые данные разбиваются на небольшие пакеты фиксированной структуры и длины, маркируются таким образом, чтобы при получении данные можно было бы собрать в правильной последовательности.
Обычно длина одного пакета не превышает 1500 байт. Поэтому одно электронное письмо может состоять из нескольких сотен таких пакетов. Малая длина пакета не приводит к блокировке линий связи и не позволяет отдельным пользователям надолго захватывать канал связи.
К каждому полученному ТСР-пакету протокол IР добавляет информацию, по которой можно определить адреса отправителя и получателя. Это аналогично помещению адреса на конверт. Для каждого поступающего пакета маршрутизатор, через который проходит пакет, по данным IР-адреса определяет, кому из ближайших соседей необходимо переслать данный пакет, чтобы он быстрее оказался у получателя, т.е. принимает решение об оптимальном пути следования очередного пакета. При этом географически самый короткий путь не всегда оказывается оптимальным (быстрый канал на другой континент может быть лучше медленного в соседний город). Очевидно, что скорость и пути прохождения разных пакетов могут быть различными. Взаимосвязанные пакеты данных могут передаваться различными путями. Возможно, что пакеты будут путешествовать через разные континенты с различной скоростью. При этом пакеты, отправленные позже, могут дойти раньше. Независимо от длины пути в результате конечного числа пересылок ТСР-пакеты достигают адресата.
Наконец, ТСР-модуль адресата собирает и распаковывает IР-конверты, затем распаковывает ТСР-конверты и помещает данные в нужной последовательности. Если чего-либо не достает, он требует переслать этот пакет снова. Пакеты не только теряются, но и могут искажаться при передаче из-за наличия помех на линиях связи. ТСР решает и эту проблему. В конце концов, информация собирается в нужном порядке и полностью восстанавливается.
Таким образом, протокол IР осуществляет перемещение данных в сети, а протокол ТСР обеспечивает надежную доставку данных, используя систему кодов, исправляющих ошибки. Причем два сетевых сервера могут одновременно передавать в обе стороны по одной линии множество ТСР-пакетов от различных клиентов.
Необходимо подчеркнуть основное различие передачи информации по телефонной сети и по Интернету. Телефонная система при звонке по телефону в другой регион или даже на другой континент устанавливает канал между вашим телефоном и тем, на который вы звоните. Канал может состоять из десятков участков разной физической природы — медные провода, волоконно-оптические линии, беспроводные участки, спутниковая связь и т.д. Эти участки неизменны на протяжении всего сеанса связи. Это означает, что линия между вами и тем, кому вы звоните, постоянна в течение всего разговора, поэтому повреждения на любом участке линии способны прервать ваш разговор. При этом выделенная вам часть сети для других уже недоступна. Речь идет о сети скоммутацией каналов. Интернет же является сетью скоммутацией пакетов. Процесс пересылки электронной почты принципиально иной.
Итак, Internet-данные в любой форме — электронное письмо, Web-страница или скачиваемый файл — путешествуют в виде группы пакетов. Каждый пакет посылается на место назначения по оптимальному из доступных путей. Поэтому даже если какой-то участок Интернет окажется нарушенным, то это не повлияет на доставку пакета, который будет направлен по альтернативному пути. Таким образом, во время доставки данных нет необходимости в фиксированной линии связи между двумя пользователями. Принцип пакетной коммутации обеспечивает основное преимущество Internet ? надежность. Сеть может распределять нагрузку по различным участкам за тысячные доли секунды. Если какой-то участок оборудования сети поврежден, пакет может обойти это место и пройти по другому пути, обеспечив доставку всего послания. Прототип Интернет — сеть ARPAnet, разработанная по заказу Минобороны США, задумывалась именно как сеть, устойчивая к повреждениям (например, в случае военных действий), способная продолжать нормальное функционирование при выходе из строя любой ее части.
АДресаЦ ия В internet
Каждому компьютеру, подключенному к Интернету, присваивается идентификационный номер, который называется IР-адресом.
При сеансовом подключении к Интернету IР-адрес выделяется компьютеру только на время этого сеанса. Присвоение адреса компьютеру на время сеанса связи называется динамическим распределением IР-адресов. Оно удобно для провайдера, поскольку один и тот же IР-адрес в разные периоды времени может быть выделен разным пользователям. Таким образом, Интернет-провайдер должен иметь по одному IР-адресу на каждый обслуживаемый им модем, а не на каждого клиента.
IР-адрес имеет формат ххх.ххх.ххх.ххх, где ххх — числа от 0 до 255. Рассмотрим типичный IР-адрес: 193.27.61.137. Для облегчения запоминания IР-адрес обычно выражают рядом чисел в десятичной системе счисления, разделенных точками. Но компьютеры хранят его в бинарной форме. Например, тот же IР-адрес в двоичном коде будет выглядеть так: 11000001. 00011011. 00111101. 10001001.
Четыре числа в 1Р-адресе называются октетами, поскольку в каждом из них при двоичном представлении имеется восемь разрядов: 4 • 8=32. Так как каждая из восьми позиций может иметь два различных состояния: 1 или 0, общий объем возможных комбинаций составляет 28 или 256, т.е. каждый октет может принимать значения от 0 до 255. Комбинация четырех октетов дает 232 значений, т.е. примерно 4,3 млрд. комбинаций, за исключением некоторых зарезервированных адресов.
Октеты делят на две секции: Net и Host. Net-секция используется для того, чтобы определить сеть, к которой принадлежит компьютер. Host, который называют узлом, определяет конкретный компьютер в сети.
На ранней стадии своего развития Интернет состоял из небольшого количества компьютеров, объединенных модемами и телефонными линиями. Тогда пользователи могли установить соединение с компьютером, набрав цифровой адрес, например 163.25.51.132. Это было удобно, пока компьютеров было мало. По мере увеличения их количества цифровые имена стали заменять текстовыми, потому что текстовое имя проще запомнить, чем цифровое. Возникла проблема автоматизации этого процесса, и в 1983 г. в Висконсинском университете США была создана так называемая DNS-система (Domain Name System), которая автоматически устанавливала соответствие между текстовыми именами и IР-адресами. Вместо чисел была предложена ставшая сегодня для нас привычной запись типа www.myname/gorod.ru.
Подобным же образом осуществляется сортировка обычной почты. Люди привыкли ориентироваться по географическим адресам, в то время как автомат на почте быстро сортирует почту по индексу.
Таким образом, при пересылке информации компьютеры используют цифровые адреса, люди — буквенные, а DNS-сервер служит своеобразным переводчиком.
Доменные имена
Когда происходит обращение на Web или посылается e-mail, то используется доменное имя. Например, адрес http://www.microsoft.com содержит доменное имя microsoft.com. Аналогично e-mail-адрес algol@rambler.ru содержит доменное имя rambler.ru.
В доменной системе имен реализуется принцип назначения имен с определением ответственности за их подмножество соответствующих сетевых групп.
Каждая группа придерживается этого простого правила. Имена, которые она присваивает, единственны среди множества ее непосредственных подчиненных, поэтому никакие две системы, где бы они ни находились в Интернете, не смогут получить одинаковые имена. Так же уникальны адреса, указываемые на конвертах при доставке писем обычной почтой. Таким образом, адрес на основе географических и административных названий однозначно определяет точку назначения.
Домены имеют подобную иерархию. В именах домены отделяются друг от друга точками. В имени может быть различное количество доменов, но обычно их не больше пяти. По мере движения по доменам в имени слева направо, количество имен, входящих в соответствующую группу, возрастает.
Для перевода буквенного доменного имени в IР-адрес цифрового формата служат DNS-серверы.
В качестве примера рассмотрим адрес group.facult.univers.rst.ru. Первым в имени стоит название рабочей машины — реального компьютера с IР-адресом. Это имя создано и поддерживается группой facult. Группа входит в более крупное подразделение univers, далее следует домен rst — он определяет имена ростовской части сети, а ru — российской.
Каждая страна имеет свой домен: аи — Австралия, be — Бельгия и т.д. Это географические домены верхнего уровня.
Помимо географического признака используется организационный признак, в соответствии с которым существуют следующие доменные имена первого уровня:
- com — коммерческие предприятия,
- edu — образовательные учреждения,
- gov— государственные учреждения,
- mil — военные организации,
- net — сетевые образования,
- org — учреждения других организаций и сетевых ресурсов.
Внутри каждого доменного имени первого уровня находится целый ряд доменных имен второго уровня. Домен верхнего уровня располагается в имени правее, а домен нижнего уровня — левее.
Лавинообразное подключение в сети Интернет обнажило проблему недостатка адресного пространства. В 1995 г. организация IETF (инженерные силы Интернет) опубликовала рекомендации по протоколу IР следующего поколения — IР v.6 (сейчас IР v.4), которые предполагают постепенный переход с существующей 32-разрядной системы присвоения IР-адресов на 128-разрядную систему. Такая мера сулит увеличение адресного пространства в 296 раз, что позволит каждому жителю планеты иметь несколько адресов. Переход уже начался. Вместе с использованием новых оптоволоконных каналов для увеличения скорости в сотни и тысячи раз расширение адресного пространства даст возможность осуществить проект Интернет 2. Эта сеть в настоящее время развертывается в США для ряда университетов, школ, федеральных агентств и крупных компьютерных компаний.
Варианты доступа В интернет
Провести соединение между провайдером и пользователями ? непростая задача. Обычно провайдер подключен к Интернет с помощью дорогостоящего оптоволоконного высокоскоростного канала. Один провайдер обслуживает множество клиентов, которые рассредоточены на большой территории.
Существует целый ряд технологий, позволяющих использовать имеющуюся инфраструктуру ? телефонные линии, сети кабельного телевидения и т.д., ? для осуществления доступа в Интернет.
Наиболее распространенный среди домашних пользователей в России способ доступа в Интернет ? доступ по коммутируемой телефонной линии с помощью модема. Скорость доступа при таком способе подключения не более 56 Кбит/с, но такая скорость сегодня мало кого устраивает. Какие же альтернативные технологии позволяют получить более высокую скорость доступа в Интернет?
Обычный телефон использует лишь низкочастотный диапазон линии. Однако провод телефонной линии способен передавать гораздо больше данных, если использовать более широкую полосу (полоса пропускания обычной телефонной линии 3400 КГц). Поэтому телефонную сеть, которая изначально предназначалась для передачи голосового сигнала, приспособили для высокоскоростной передачи цифровых данных.
DSL-технология (цифровая абонентская линия) позволяет использовать более широкую полосу пропускания для передачи данных без ущерба для использования телефонной линии по прямому назначению. Существует целое семейство технологий под общим названием xDSL, где приставка х указывает на конкретную спецификацию семейства DSL. Эта технология весьма перспективна, она позволяет одновременно работать в Интернете и разговаривать по телефону. Скорость подключения по ней намного выше, чем при помощи обычного модема. DSL не требует прокладки новых проводов, так как использует уже имеющуюся телефонную линию.
Одним из основных преимуществ технологии хDSL является высокоскоростной доступ в Интернет. При работе в Интернет основной поток информации идет из сети к пользователю, а в сеть передается гораздо меньший объем данных. Действительно, при просмотре Web-страниц в ответ на небольшой запрос пользователь получает из Сети не только текст, но и изображения. Таким образом, информационный обмен является асимметричным.
ADSL (Asymmetrical DSL), или асимметричный DSL, позволяет передавать данные пользователю со скоростью, на порядок превышающую скорость передачи данных от пользователя. При этом сигнал от пользователя в Сеть передается на более низких частотах, чем сигнал из Сети к пользователю. Теоретически при этом можно иметь канал с пропускной способностью 1 Мбит/с в прямом направлении (в Сеть) и 8 Мбит/с — в обратном. При этом одна и та же линия может использоваться для передачи голоса и цифровых данных. По сравнению с коммутируемым доступом ADSL-линия работает, как минимум, на два порядка быстрее. Высокая скорость позволяет комфортно работать с Web-сайтами с мультимедийной информацией, быстро перекачивать большие файлы и полноценно использовать интерактивные приложения.
Достоинства ADSL: легкость установки (используется уже имеющаяся телефонная линия), постоянный доступ в Интернет (пользователи ADSL не разделяют полосу пропускания с другими абонентами).
Недостаток ADSL: ограничения по дальности. Скорость передачи потока данных в обратном направлении существенно зависит от расстояния. Если при расстоянии 3 км можно получить скорость около 8 Мбит/с, то на расстоянии 5 км — только 1,5 Мбит/с.
ADSL ? весьма экономичная технология. Обычно такая линия обходится потребителю намного дешевле, чем выделенный канал аналогичной пропускной способности. По данной технологии может быть подключен не только отдельный компьютер, но и локальная сеть.
Выделенная телефонная линия — это арендованная телефонная линия связи, соединяющая без коммутации двух абонентов. Наиболее распространенной технологией выделенной линии является технология ISDN.
ISDN ? это стандарт цифровой передачи. Основным компонентом любой ISDN -линии является однонаправленный канал или B-канал с пропускной способностью 64 Кбит/с. По этому каналу могут передаваться цифровые данные и, соответственно, оцифрованные видео- и аудиоданные. Для расширения полосы пропускания В-каналы группируются по два. В состав группы включается также D-канал (16 Кбит/с), управляющий передачей данных.
Передача информации может осуществляться по обычному медному проводу. Пользователи, которые устанавливают ISDN -адаптер вместо модема, могут получить доступ в Интернет со скоростью до 128 Кбит/с. ISDN требует установки адаптеров на обоих концах линии передачи. ISDN -канал обычно предоставляется телефонными станциями. По линии ISDN можно вести телефонные разговоры и одновременно передавать данные в Интернет.
Сеть кабельного телевидения первоначально была разработана как система для передачи аналогового видеосигнала в одном направлении — в сторону пользователя. Позднее были созданы так называемые кабельные модемы, которые кодируют и передают данные по кабелю таким образом, что это не мешает передаче телевизионного сигнала. Основным достоинством этой технологии является то, что используются уже имеющиеся сети кабельного телевидения. При доступе в Интернет по сетям кабельного телевидения обеспечивается высокая скорость передачи информации. Полосы пропускания телевизионного кабеля вполне достаточно для предоставления услуг последней мили при скоростях, сравнимых с теми, что предоставляют операторы DSL.
В отличие от ADSL, которая обеспечивает высокоскоростную передачу данных по одной телефонной линии, сети кабельного телевидения являются сетями коллективного пользования. Кабельные модемы получают услугу от общего источника информации. Рабочая полоса частот кабельного модема разделяется между всеми пользователями, подключенными к линии, и, следовательно, зависит от количества одновременно работающих пользователей. Обычно к одной модемной системе подключается несколько десятков абонентов. Чем больше клиентов одновременно посылают данные, тем меньше скорость их передачи. На практике скорость передачи данных от пользователей при применении кабельного модема часто меньше, чем при использовании ADSL.
Для организации связи между пользователем и опорной точкой радиосети провайдера используют радиоканал для высокоскоростного доступа в Интернет. С помощью этой технологии к Интернету можно подключить как индивидуальных пользователей, так и ЛВС. Для этого у абонента устанавливается радиомодем, который подключается к сетевой карте ПК или к хабу/маршрутизатору (в случае подключения ЛВС). Радиомодем соединен с направленной антенной, установленной на крыше здания. Антенна абонента направляется на базовую станцию провайдера. Связь между точкой входа в Интернет провайдера и абонентом осуществляется по радиоканалу.
С помощью данной технологии можно также объединить в сеть несколько филиалов компании без кабельного соединения. Для этого в каждом подразделении устанавливается абонентский комплект: направленная антенна и радиомодем. Провайдер обеспечивает связь между всеми точками доступа фирмы и правильную маршрутизацию данных.
Оборудование беспроводных сетей работает в диапазоне частот 2,4 ГГц. Сигналы такой частоты распространяются вдоль прямой линии, соединяющей антенны, поэтому радиоканал может быть организован при условии прямой видимости между абонентской антенной и антенной провайдера. На практике направленные антенны обеспечивают дальность связи до 30 км.
Преимущества радиоканала: быстрая инсталляция, мобильность (нет кабеля), высокая скорость (несколько Мбит/с в зависимости от оборудования), затраты (первоначальные затраты на оборудование выше, чем в случае выделенной линии, но абонентская плата ниже).
В случае отсутствия телефонных станций и кабельного телевидения может помочь спутниковый доступ в Интернет. При этом скорость доступа на порядок выше, чем по обычному модему через коммутируемую телефонную линию, но несоизмеримо ниже ASDL-доступа. Существует две разновидности организации высокоскоростного доступа в Интернет по спутниковому каналу: симметричная и асимметричная.
В случае симметричного доступа клиент осуществляет передачу запроса на спутник и прием данных со спутника. Подобное решение является достаточно дорогим, как по части клиентского оборудования, так и по стоимости абонентской платы.
В случае асимметричного доступа клиент осуществляет передачу запроса на получение требуемой информации по наземному каналу, а принимает информацию со спутника. Пользователь связывается с любым провайдером Интернета через обычный телефонный модем. Используя этот канал связи, он регистрируется на сервере провайдера, который обеспечивает асимметричный доступ в Интернет. После авторизации весь поток информации, поступающей в адрес пользователя через Интернет, направляется к нему не по обычной телефонной линии, а через спутниковый канал.
В последние годы активно разрабатываются технологии, направленные на использование бытовой электрической сети для доступа в Интернет. Одно из важнейших преимуществ бытовой электрической сети состоит в ее распространенности. Поэтому идея передачи информации по такой сети очень перспективна. Поскольку бытовая электрическая сеть первоначально не была предназначена для передачи информации, то это создает ряд технических трудностей. Электропроводка характеризуется высоким уровнем шумов, быстрым затуханием высокочастотного сигнала, а также изменением коммуникационных параметров в зависимости от текущей нагрузки.
Несмотря на технические трудности, сегодня уже имеются технологии, позволяющие использовать силовую кабельную инфраструктуру. В частности, разработана технология DPL (Digital Power Line), позволяющую передавать голос и пакеты данных через простые электрические сети 120/220 В со скоростью до 1 Мбит/с.
Ожидается, что DPL-технология сможет дать новый импульс развитию средств передачи данных по линиям электропитания и сделает возможным прямой доступ в Интернет практически из любой точки земного шара по минимальной стоимости. Пока эта технология не получила широкого распространения, однако в ближайшем будущем можно ожидать существенных изменений на рынке провайдерских услуг и снижения расценок на доступ в Сеть, включая цены на коммутируемые и выделенные линии.
Если эта технология получит распространение, она сможет значительно изменить расстановку сил на рынке предоставления Internet-доступа. Технология будет способствовать и появлению новых принципов проектирования силовых электрических сетей с учетом как энергетических, так и коммуникационных требований.
Система адресации URL
Чтобы найти документ в сети Интернет, достаточно знать ссылку на него ? так называемый универсальный указатель на ресурс URL (Uniform Resource Locator — унифицированный указатель ресурса), который указывает местонахождение каждого файла, хранящегося на компьютере, подключенном к Интернету.
Адрес URL является сетевым расширением понятия полного имени ресурса, например, файла или приложения и пути к нему в операционной системе. В URL, кроме имени файла и директории, где он находится, указывается сетевое имя компьютера, на котором этот ресурс расположен, и протокол доступа к ресурсу, который можно использовать для обращения к нему.
Рассмотрим некоторые URL: http://www.abc.def.ru/kartinki/SLIDE.htm
Первая часть http:// (Hypertext Transfer Protocol) — протокол передачи гипертекста, по которому обеспечивается доставка документа с Web-сервера, указывает браузеру, что для доступа к ресурсу применяется данный сетевой протокол.
Вторая часть www.abc.def.ru указывает на доменное имя.
Третья часть kartinki/SLIDE.htm показывает программе-клиенту, где на данном сервере искать ресурс. В данном случае ресурсом является файл в формате html, а именно SLIDE.htm, который находится в папке kartinki.
Имена директорий, содержащиеся в URL, — виртуальные и не имеют ничего общего с реальными именами каталогов компьютера, на котором выполняется Web-сервер, а являются их псевдонимами.
При написании URL важно правильно указывать верхние и нижние регистры. Дело в том, что Web-серверы функционируют под управлением разных операционных систем, а в некоторых из них имена файлов и приложений являются регистро-чувствительными.
В общем случае формат URL имеет вид:
://: ///
СерВисы интернет
Обычно пользователи идентифицируют Интернет со службой WWW(Всемирная паутина). Но это далеко не так, ибо WWW — одна из многочисленных служб Интернета. По аналогии Интернет можно сравнить с системой транспортных магистралей, а виды сервисов Интернет — с различными службами доставки.
В число наиболее часто используемых служб Интернет входят:
- электронная почта,
- WWW,
- служба новостей Интернет,
- передача файлов по протоколу FТР,
- терминальный доступ по протоколу Telnet
- и ряд других служб.
Электронная почта. Электронная почта возникла раньше, чем Интернет, однако она не только не устарела, но, напротив, является наиболее массовой службой Сети и постоянно приобретает новых пользователей. Электронное письмо, как и обычное, содержит адреса отправителя и получателя. В него можно вложить графическое изображение или иной файл, на него можно поставить электронную подпись, которая играет ту же роль, что и подпись в обычном письме. Однако служба e-mail давно обошла по популярности традиционную почту: ежегодно в мире рассылается более 600 млрд. электронных писем. Достоинства электронной почты:
- Электронная почта может быть прочитана в удобное время, что особенно важно с учетом разницы во времени между часовыми поясами.
- Возможность рассылки писем сразу большому количеству получателей.
- Высокая скорость доставки, удобство пересылки вложенных файлов.
- Хранение писем в базе данных почтового клиента позволяет осуществлять быстрый поиск и сортировку почтовых отправлений.
- Электронная почта дешевле обычной почтовой рассылки.
Обычно в момент регистрации доступа в Интернет сервис-провайдер предоставляет пользователю дисковое пространство под почтовый ящик: адрес этого почтового ящика, имя пользователя и пароль. Пароль для доступа предоставляется в целях предотвращения несанкционированного доступа к почте. Адрес электронной почты имеет формат:
@
Например, Ivanov@аbс.rst.ru
Часть слева от значка @ — это имя почтового ящика на сервере, из которого владелец этого адреса забирает письма (в данном примере — Ivanov). Как правило, имя пользователя совпадает с именем почтового ящика.
Часть справа от значка @ называется доменом и указывает на местонахождение этого почтового ящика. Нужно отметить, что носителем адреса электронной почты является вовсе не конечный пункт доставки, т.е. не адрес вашего домашнего компьютера, а адрес сервера, на котором вы будете получать почту.
Электронная почта построена по принципу клиент-серверной архитектуры. Пользователь общается с клиентской программой, которая, в свою очередь, общается с почтовым сервером. Очевидно, что процедуры отправки и получения почты требуют разной степени идентификации личности, поэтому существуют и два разных протокола ? на отправку и на прием писем.
Для передачи писем используются протокол SMTP (простой протокол пересылки почты) и соответственно SMTP-серверы. Для приема почтовых сообщений в настоящее время наиболее часто используется протокол РОРЗ (протокол почтового офиса), который контролирует право пользователя забирать почту из ящика и поэтому требует предоставления имени пользователя и пароля.
WWW — самый популярный сервис Интернета. Именно он, благодаря своей относительной простоте и наглядности для пользователей, сделал столь массовыми обращения к ресурсам Сети.
В самом общем плане WWW — это система Web-серверов, поддерживающая документы, форматированные специальным образом. Служба WWW реализована в виде клиент-серверной архитектуры. Пользователь с помощью клиентской программы (браузера) осуществляет запрос той или иной информации на сервере, а Web-сервер обслуживает запрос браузера. Браузер — это программа, обеспечивающая обращение к искомому ресурсу на сервере по его URL, интерпретирующая полученный результат и демонстрирующая его на клиентском компьютере.
Протокол, по которому происходит доставка Web-сервером документа Web-браузеру, носит название НТТР (протокол передачи гипертекста). Гипертекст — это текст, содержащий гиперссылки, связывающие слова или картинки документа с другим ресурсом (с каким-нибудь еще документом или с иным разделом этого же документа), при этом подобные связанные слова или картинки документа, как правило, выделяются, обычно с помощью подчеркивания. Пользователь может активировать эту связь щелчком мыши. Поскольку современные электронные документы содержат не только текст, но и любую мультимедийную информацию (текст, графика, звук), в качестве ссылок стали использовать не только текстовые, но и графические объекты. Со временем понятие гипертекста было расширено до понятия гипермедиа. Гипермедиа — это метод организации мультимедийной информации на основе ссылок на разные типы данных.
Особенно продуктивной идея гипертекста оказалась применительно к объединению цифровой информации, распределенной на серверах во всем мире. WWW ? это глобальная гипертекстовая система, организованная на базе Internet.
Документ, доступный через WWW, называют Web-страницей, а группы страниц, объединенные общей темой и навигационно, — Web-узлами или Web-сайтами. Один аппаратный Web-сервер может содержать несколько Web-сайтов, но возможна и обратная ситуация, когда огромный Web-сайт может поддерживаться группой Web-серверов. Тот факт, что навигация не требует знаний о местоположении искомых документов, как раз и является основным удобством и причиной популярности службы WWW.
В браузерах реализованы две основные функции:
- запрос информации у Web-сервера,
- отображение ее на клиентском компьютере.
Кроме того, браузеры обладают дополнительными сервисными функциями, такими как упрощение поиска, хранение закладок, указывающих на избранные страницы, и др.
Поиск В сети интернет
Для поиска в Internet предназначены различные инструменты:
- поисковые машины,
- индексированные каталоги,
- метапоисковые системы,
- тематические списки ссылок,
- онлайновые энциклопедии и справочники.
При этом для поиска разного рода информации наиболее эффективными оказываются различные инструменты. Рассмотрим каждый инструмент в отдельности.
Индексированные каталоги содержат информацию, иерархически структурированную по темам. Тематические разделы первого уровня определяют широко популярные темы, такие как спорт, отдых, наука, магазины и т.д. В каждом разделе есть подразделы. Таким образом, путешествуя по дереву каталога, можно постепенно сужать область поиска. Дойдя до нужного подкаталога, вы находите в нем набор ссылок. Обычно в каталоге все ссылки являются профильными, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что если вы ищете информацию по некоторой широкой теме, то целесообразно обратиться к каталогу. Если же вам необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством. Кроме каталогов общего назначения в Сети много специализированных каталогов. Если внутри отдельной темы каталога находится огромное количество ресурсов, возникает проблема выбора. В некоторых каталогах имеется сортировка по популярности, например в каталоге Яндекс сортировка идет по индексу цитирования.
Тематические списки ссылок ? это списки, составленные группой профессионалов или коллекционерами-одиночками. Часто узкоспециализированная тема может быть раскрыта одним специалистом лучше, чем группой сотрудников крупного каталога.
Поисковые машины. В ответ на запрос мы обычно получаем длинный список документов, многие из которых не имеют никакого отношения к теме запроса. Такие документы называются нерелевантными, т.е. не относящимися к делу. Таким образом, релевантный документ — это документ, содержащий искомую информацию. Очевидно, что от умения грамотно делать запрос зависит процент получаемых релевантных документов. Доля релевантных документов в списке всех найденных поисковой машиной документов называется точностью поиска. Если все найденные документы релевантные, то точность поиска составляет 100 %. Если найдены все релевантные документы, то полнота поиска — 100 %. Таким образом, качество поиска определяется двумя параметрами:
- точностью поиска,
- полнотой поиска.
Эти величины взаимозависимы, т.е. увеличение полноты снижает точность, и наоборот.
Поисковая машина состоит из двух частей: робота, или паука, и поискового механизма. База данных робота формируется в основном им самим (робот сам находит ссылки на новые ресурсы) и в существенно меньшей степени — владельцами ресурсов, которые регистрируют свои сайты в поисковой машине. Помимо робота, который обходит все предписанные серверы и формирует базу данных, существует программа, определяющая рейтинг найденных ссылок.
Принцип работы поисковой машины сводится к тому, что она опрашивает свою базу данных по ключевым словам, которые пользователь указывает в поле запроса, и выдает список ссылок, ранжированный по релевантности.
Поиск по индексу заключается в том, что пользователь формирует запрос и передает его поисковой машине. В случае, когда у пользователя имеется несколько ключевых слов, весьма полезно использование булевых операторов. Текст, в пределах которого проверяется логическая комбинация, называется единицей поиска. Это может быть предложение, абзац или весь документ. В разных поисковых системах могут использоваться различные единицы поиска. После того, как пользователь сделал запрос, поисковая система обрабатывает синтаксис запроса и сравнивает ключевые слова со словами в индексе. После этого составляется список сайтов, отвечающих запросу, они ранжируют
Статьи к прочтению:
- Методы эффективного кодирования некоррелированной последовательности знаков, код шеннона-фано
- Методы и средства отладки микропроцессорных систем
У вас нет прав на использование этого сетевого ресурса.
Похожие статьи:
-
Администратор рабочей группы может ввести или пересмотреть практику защиты баз данных (БД) Microsoft Access на уровне рабочей группы. Этот подраздел…
-
Методы разграничения доступа к информационным активам организации.
После выполнения идентификации и аутентификации необходимо установить полномочия (совокупность прав) субъекта для последующего контроля…