Информационные технологии в лингвистике/Технологические основы Интернета

Теория править

Технологические основы интернета править

Описание организации и функционирования глобальных сетей базируется на таких понятиях как: открытые системы, телекоммуникационные технологии, каналы передачи данных, кодирование информации.

Открытые системы править

Интернет представляет собой соединение разнообразных аппаратных платформ, исполняющих приложения, предназначенные для решения широкого диапазона задач - то есть является гетерогенной системой.

Внедрение гетерогенных систем и желание передавать между такими системами информацию привели к необходимости их совместной работы. Кроме того, совместимые двоично компьютеры позволяли осуществлять переносимость программ с платформы на платформу. Эти задачи могут быть решены на базе открытых систем.

Импульс к применению возможностей открытых систем исходит не только от пользователей. Он исходит от разработчиков, озабоченных необходимостью сокращать расходы и время переноса своих приложений на различные платформы. Он исходит от производителей, старающихся разрабатывать новые платформы, на которых может выполняться широкий диапазон приложений. Он исходит от национальных и международных стандартизующих организаций, разрабатывающие стандарты, отвечающие требованиям промышленности.

Определение открытой системы.

Комитет IEEE POSIX 1003.0 остановился на определении, которое дает широкую и исчерпывающую трактовку понятия отрытых систем. В соответствии с этим определением открытая система есть "система, реализующая открытые спецификации на интерфейсы, сервисы и поддерживаемые форматы данных, достаточные для того, чтобы обеспечить должным образом разработанным приложениям возможность переноса с минимальными изменениями на широкий диапазон систем, совместной работы с другими приложениями на локальной и удаленных системах и взаимодействия с пользователями в стиле, облегчающем тем переход от системы к системе".

Используя материал статьи "Открытая система" из Википедии дать характеристику сновных свойств открытых систем:расширяемость; масштабируемость; переносимость приложений, данных и персонала; интероперабельность приложений и систем; cпособность к интеграции; высокая готовность.

Телекоммуникационные технологии править

Современные телекоммуникационные технологии основаны на использовании информационных сетей.

Cети.

Коммуникационная cеть - система, состоящая из объектов, осуществляющих функции генерации, преобразования, хранения и потребления продукта, называемых пунктами (узлами) сети, и линий передачи (связей, коммуникаций, соединений), осуществляющих передачу продукта между пунктами.

Информационная сеть - коммуникационная сеть, в которой продуктом генерирования, переработки, хранения и использования является информация.

Вычислительная сеть - информационная сеть, в состав которой входит вычислительное оборудование. Компонентами вычислительной сети могут быть ЭВМ и периферийные устройства, являющиеся источниками и приемниками данных, передаваемых по сети.

Классификация сетей.

Вычислительные сети классифицируются по ряду признаков.

В зависимости от расстояний между связываемыми узлами различают вычислительные сети:

территориальные - охватывающие значительное географическое пространство; среди территориальных сетей можно выделить сети региональные и глобальные, имеющие соответственно региональные или глобальные масштабы; региональные сети иногда называют сетями MAN (Metropolitan Area Network), а общее англоязычное название для территориальных сетей - WAN (Wide Area Network);

локальные (ЛВС) - охватывающие ограниченную территорию (обычно в пределах удаленности станций не более чем на несколько десятков или сотен метров друг от друга, реже на 1...2 км); локальные сети обозначают LAN (Local Area Network);

корпоративные (масштаба предприятия) - совокупность связанных между собой ЛВС, охватывающих территорию, на которой размещено одно предприятие или учреждение в одном или нескольких близко расположенных зданиях. Локальные и корпоративные вычислительные сети - основной вид вычислительных сетей, используемых в системах автоматизированного проектирования (САПР).

Особо выделяют глобальную сеть Internet (реализованная в ней информационная служба World Wide Web (WWW) переводится на русский язык как всемирная паутина); это сеть сетей со своей технологией.

Перенос технологий сети Internet в корпоративные сети привел к появлению интрасетей (Intranet).

Протоколы.

Это набор семантических и синтаксических правил, определяющий поведение функциональных блоков сети при передаче данных. Другими словами, протокол - это совокупность соглашений относительно способа представления данных, обеспечивающего их передачу в нужных направлениях и правильную интерпретацию данных всеми участниками процесса информационного обмена.

Унификация и стандартизация протоколов выполняются рядом международных организаций, что наряду с разнообразием типов сетей породило большое число различных протоколов. Наиболее широко распространенными являются протоколы, разработанные для сети ARPANET и применяемые в глобальной сети Internet, протоколы открытых систем Международной организации по стандартизации (ISO -Intrenational Standard Organization), протоколы Международного телекоммуникационного союза (International Telecommunication Union -ITU, ранее называвшегося CCITT) и протоколы Института инженеров по электротехнике и электронике (IEEE - Institute of Electrical and Electronics Engineers). Протоколы сети Internet объединяют под названием TCP/IP. Протоколы ISO являются семиуровневыми и известны как протоколы базовой эталонной модели взаимосвязи открытых систем - ЭМВОС).

Эталонная модель взаимосвязи открытых систем.

Базовая ЭМВОС - это модель, принятая ISO для описания общих принципов взаимодействия информационных систем. ЭМВОС признана всеми международными организациями как основа для стандартизации протоколов информационных сетей. В ЭМВОС информационная сеть рассматривается как совокупность функций, которые делятся на группы, называемые уровнями. Разделение на уровни позволяет вносить изменения в средства реализации одного уровня без перестройки средств других уровней, что значительно упрощает и удешевляет модернизацию средств по мере развития техники.

ЭМВОС содержит семь уровней. Ниже приведены их номера, названия и выполняемые функции.

7-й уровень - прикладной (Application): включает средства управления прикладными процессами; эти процессы могут объединяться для выполнения поставленных заданий, обмениваться между собой данными. Другими словами, на этом уровне определяются и оформляются в блоки те данные, которые подлежат передаче по сети. Уровень включает, например, такие средства для взаимодействия прикладных программ, как прием и хранение пакетов в "почтовых ящиках" (mail-box).

6-й уровень - представительный (Presentation): реализуются функции представления данных (кодирование, форматирование, структурирование). Например, на этом уровне выделенные для передачи данные преобразуются из кода ЕBCDIC в ASCII и т.п.

5-й уровень - сеансовый (Session): предназначен для организации и синхронизации диалога, ведущегося объектами (станциями) cети. На этом уровне определяются тип связи (дуплекс или полудуплекс), начало и окончание заданий, последовательность и режим обмена запросами и ответаами взаимодействующих партнеров.

4-й уровень - транспортный (Transport): предназначен для управления сквозными каналами в сети передачи данных; на этом уровне обеспечивается связь между оконечными пунктами (в отличие от следующего сетевого уровня, на котором обеспечивается передача данных через промежуточные компоненты сети). К функциям транспортного уровня относятся мультиплексирование и демультиплексирование (сборка-разборка пакетов), обнаружение и устранение ошибок в передаче данных, реализация заказанного уровня услуг (например, заказанной скорости и надежности передачи).

3-й уровень - сетевой (Network): на этом уровне происходит формирование пакетов по правилам тех промежуточных сетей, через которые проходит исходный пакет, и маршрутизация пакетов, т.е. определение и реализация маршрутов, по которым передаются пакеты. Другими словами, маршрутизация сводится к образованию логических каналов. Логическим каналом называется виртуальное соединение двух или более объектов сетевого уровня, при котором возможен обмен данными между этими объектами. Понятию логического канала необязательно соответствие некоего физического соединения линий передачи данных между связываемыми пунктами. Это понятие введено для абстрагирования от физической реализации соединения. Еще одной важной функцией сетевого уровня после маршрутизации является контроль нагрузки на сеть с целью предотвращения перегрузок, отрицательно влияющих на работу сети.

2-й уровень - канальный (Link, уровень звена данных): предоставляет услуги по обмену данными между логическими объектами предыдущего сетевого уровня и выполняет функции, связанные с формированием и передачей кадров, обнаружением и исправлением ошибок, возникающих на следующем, физическом уровне. Кадром называется пакет канального уровня, поскольку пакет на предыдущих уровнях может состоять из одного или многих кадров.

1-й уровень - физический (Physical): предоставляет механические, электрические, функциональные и процедурные средства для установления, поддержания и разъединения логических соединений между логическими объектами канального уровня; реализует функции передачи битов данных через физические среды. Именно на физическом уровне осуществляются представление информации в виде электрических или оптических сигналов, преобразования формы сигналов, выбор параметров физических сред передачи данных.

Каналы передачи данных править

Основные определения.

Среда передачи данных - совокупность линий передачи данных и блоков взаимодействия (т.е. сетевого оборудования, не входящего в станции данных), предназначенных для передачи данных между станциями данных. Среды передачи данных могут быть общего пользования или выделенными для конкретного пользователя.

Линия передачи данных - средства, которые используются в информационных сетях для распространения сигналов в нужном направлении. Примерами линий передачи данных являются коаксиальный кабель, витая пара проводов, световод.

Канал (канал связи) - средства односторонней передачи данных. Примером канала может быть полоса частот, выделенная одному передатчику при радиосвязи.

Кодирование информации править

Кодирование - представление сообщения последовательностью элементарных символов.

Основные используемые коды.

Широко используются двоичные коды:

EBCDIC (Extended Binary Coded Decimal Interchange Code) - символы кодируются восемью битами; популярен благодаря его использованию в IBM;

ASCII (American Standards Committee for Information Interchange) - семибитовый двоичный код.

Оба этих кода включают битовые комбинации для печатаемых символов и некоторых распространенных командных слов типа NUL, CR, ACK, NAK и др.

Для кодировки русского текста нужно вводить дополнительные битовые комбинации. Семибитовая кодировка здесь уже недостаточна. В восьмибитовой кодировке нужно под русские символы отводить двоичные комбинации, не занятые в общепринятом коде, чтобы сохранять неизменной кодировку латинских букв и других символов. Так возникли кодировка КОИ-8, затем при появлении персональных ЭВМ - альтернативная кодировка и при переходе к Windows - кодировка 1251. Множество используемых кодировок существенно усложняет проблему согласования почтовых программ в глобальных сетях.


Интернет править

Интернет – структура использующая протокол IP (Internet Protocol) для создания единой сети своих пользователей. Структуры не использующие протокол IP подключаются к Интернету посредством шлюзов.

История Интернета.

1969 г. – экспериментальная сеть ARPAnet по заказу Минобороны США. Основные принципы, положенные в основу этой сети:

  • сеть априори полагается ненадежной, т.е. любая ее часть может отказать в любой момент, при этом остальные должны оставаться работоспособными;
  • любой компьютер связывается как равный с любым другим компьютером в сети.
  • 1983 г. – протокол TCP/IP.
  • 1985 г. – сеть NSFNet (национального научного фонда США), объединила 5 компьютерных центров университетов США.
  • 1995 г. – становление Internet как глобальной сети.


Глобальная сеть Internet - самая крупная сеть в мире. Практически все сети национального и регионального масштабов имеют выход в Internet.

Адресация в IP-сетях

Типы адресов: физический (MAC-адрес), сетевой (IP-адрес) и символьный (DNS-имя)


Практика править

Практическая работа:

  • Если Вы зарегистрированы то:
    • Представьтесь системе
    • Зайдите на страницу "моя страница обсуждения"
    • По ссылке изучаемая дисциплина перейдите к учебному материалу.
    • Изучите:
      • Структуру статьи Википедии общего характера (на примере статей Славистика);
      • Структуру статьи Википедии о лингвистической дисциплине (на примере статьи Онома́стика);
      • Какую, представляющую для Вас интерес, филологическую информацию вы нашли в Википедии?
      • какая филологическая (лингвистическая) информация находится в Викитеке и Викицетатнике?
    • В блоке "Занятие" на Вашей странице обсуждения изложите своими словами информацию (два - три абзаца), по рассмотренным вопросам.
      • Обратите внимание, что это должна быть страница Викиверситета!!.
      • Избегайте копирования информации.
    • Сохраните эту информацию, щелкнув по кнопке "Записать страницу"
    • Если в блоке появятся вопросы преподавателя - следует ответить на них.
  • Если Вы не зарегистрированы то:
    • Перейдите в песочницу,
    • Найдите свой блок (соответствует номеру по списку)
    • Перейдите в режим править
    • Запишите в шаблоне свои фамилию имя и отчество
    • Своими словами изложите эту информацию (два - три абзаца)
    • Сохраните эту информацию кнопка "Записать страницу"

Песочница

Ссылки править

  1. Открытые системы: концепция или реальность
  2. А.В. Пушнин, В.В. Янушко. Информационные сети и телекоммуникации. Таганрог: Изд-во ТРТУ, 2005. 128 с

Навигация править

Курс Информационные технологии в лингвистике