Структурная разметка веб документа обеспечивается с помощью. Язык разметки. Что такое HTML-код
Язык разметки HTML
К настоящему времени существует множество технологий создания Web-страниц, без которых не может обойтись Web-мастер. Но основой при разработке документов Web является, конечно, язык гипертекстовой разметки HTML.
HTML - это, прежде всего, язык разметки, и код, написанный на нем, исполняется на компьютере клиента в приложении Web-браузера. С этим связана его относительная простота и легкость освоения.
Зачем нужен язык разметки?
Когда вы создаете обычный документ в программе текстового процессора, вы легко можете выполнять форматирование документа, например, для символов задать курсив или полужирный шрифт, абзацу присвоить стиль заголовка или обычного текста и т.д. То, что вы делаете сдокументом на экране монитора, в том же виде переносится на бумагу при распечатке на принтере.
Выбираете ли вы опцию из выпадающих меню или даете клавишную команду, вы сразу видите на экране результат ваших усилий. Однако конкретные команды, которые реализуют отображение документа на экране или на бумаге, будут скрыты от вас.
В случае Web-страниц пользователь имеет дело не с бумажными, а с электронными документами, полученными через Internet. Принцип отображения документа средствами форматирования родительского приложения здесь неприемлем. Слишком много приложений или всевозможных конверторов пользователю пришлось бы иметь на своем компьютере, чтобы эффективно работать с множеством возможных форматов документов.
Идея решения проблемы обмена документами между различными компьютерами и приложениями через Internet основана на языке разметки гипертекста HTML (HyperText Markup Language). Этот язык был создан более 15 лет назад как стандарт оформления документов и был принят подавляющим большинством пользователей Internet, а главное, - всеми производителями программного обеспечения и оборудования для Web. Документы, размеченные согласно HTML, могут читаться на любом компьютере, на котором установлена всего лишь одна программа просмотра таких документов - браузер.
Благодаря языку разметки HTML, клиент Web может на экране своего компьютера просмотреть документ в том виде, в каком его задумал разработчик: с определенными размерами шрифта и разбивкой на абзацы, с определенным расположением рисунков, гиперссылок и проч.
Текстовый документ, составленный на HTML, имеет размер в байтах в несколько раз меньший, чем размер аналогичного документа, подготовленного в текстовом процессоре (например, Word).
В основу разрабатываемого языка Бернерс-Ли (разработчик) положил язык SGML и приемы работы с гипертекстом, с чем и связано название созданного им языка - HTML. Новый язык использовал основные конструкции SGML для описания документов и гипертекстовых ссылок.
Гипертекст - это способ организации текста, графики и других данных, при котором элементы данных связаны между собой. Связанными могут быть как элементы одного документа, так и элементы различных документов. Гипертекстовая структура лежит в основе World Wide Web.
Гипертексты представляют собой электронные документы. С гипертекстами можно работать только на компьютере, в печатном виде гипертексты не существуют. Примером гипертекстовой системы может служить известная справочная система ОС Windows.
Связи в гипертекстовой структуре осуществляются с помощью ссылок. Благодаря ссылкам, пользователь может из одного документа вызвать другой документ, из него следующий документ и т.д.
В 1989 г. Бернерс-Ли разработал информационную систему, напоминающую путину документов, связанных ссылками. Документы хранятся на серверах, которые размещаются по всему миру и соединены между собой каналами Интернета. Он разработал протокол HTTP - язык, на котором серверы должны обмениваться гипертекстовыми документами , и написал первые программы Web-сервера и браузера. Он обратился напрямую к Интернет-сообществу, и энтузиасты в 1991 году начали создавать первые узлы Web.
В последующие годы система World Wide Web стремительно развивалась, она стала самой популярной службой в Интернете. В настоящее время она удовлетворяет потребности в информации самых широких слоев пользователей, включая в свой состав миллионы узлов Web. На больших узлах размещаются тысячи и сотни тысяч документов, причем общее количество документов в WWW с каждой секундой увеличивается, поскольку над их созданием трудится огромная армия специалистов и любителей в разных уголках земного шара.
World Wide Web или сокращенно Web - это глобальная система распространения гипертекстовой информации, использующая в качестве каналов транспортировки Интернет.
Фактически World Wide Web - это гипертекстовое пространство документов, которое не связано с географией размещения самих Web-узлов. Поэтому в этом пространстве физическое расстояние между узлами не имеет смысла. Вы можете на экране монитора одинаково просматривать Web-страницы, которые хранятся как на диске компьютера в соседней комнате, так и на сервере, расположенном в другой стране.
World Wide Web функционирует по определенным стандартам, которые разрабатываются и внедряются объединением исследовательских и промышленных организаций - консорциумом W3C (сокращение от World Wide Web Consortium). .
Язык разметки HTML был основан на языке SGML. Средства разметки абзацев, заголовков, списков и прочие элементы имеющиеся в HTML, были предусмотрены и в SGML. Заслуга изобретателя HTML состоит в том, что он ввел в язык разметки то, чего не было SGML - это гипертекстовые ссылки.
Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».
НTML - это язык гипертекстовой разметки.
Язык используется для организации веб-страниц. Проведем аналогию. Вы покупаете газету. В ней напечатаны несколько статей. У каждой статьи есть название, в ней есть фотографии. А текст набирается несколькими колонками. Это - структура газетной страницы.
На сайте все происходит так же. Чтобы сделать правильную структуру статьи - контента - нужно использовать язык разметки текста.
Для чего нужен HTML
Язык HTML нужен, чтобы сообщить браузеру, как нужно отобразить страницу на экране.
Язык распространен повсеместно. Это универсальное средство для оформления контента на странице. Его использование возможно в любой браузере. Если писать код на языке программирования - нужно знать какие-то особенности, операторы, типы данных и так далее.
HTML состоит из набора тегов - команд, и атрибутов - свойств. Их несложно запомнить, и всегда можно найти справочные материалы.
Что такое HTML-код
Код - это команды браузеру, как следует отобразить страницу. Есть структура, которая должна соблюдаться всегда. Например, наличие только одного заголовка H1 на странице, основная информация помещается в раздели т. д.
В языке есть три инструмента.
- Тег - это команда. Она указывает непосредственно на действие. Например,
- перенести текст на новую строку.Начать новый абзац.
- - поместить текст в начало страницы.
- Атрибуты тега - это дополнение к командам. Они позволяют настроить то действие, которое заложено в теге. Например,
- Значение атрибута - поясняет, как именно нужно видоизменить свойство.
- - возвращаясь к этому примеру, “сайт” - это значение атрибута.
Теги бывают двух видов - парные и одиночные.
- - парный тег, открывающий и закрывающий. Они действуют на текст, помещенный между ними.
Одиночный тег, он действует на текст, стоящий после него до следующего тега.
Структура HTML-кода на странице
Мы говорили, что структура у любого html-документа всегда одна и та же. Далее перечислим обязательные элементы.
- !
- указывает, что в документе используется HTML. - ... - в этот тег помещается весь код страницы. Все, что в него не помещено, не распознается браузером и не отображается.
- ... - парный тег, в него помещается технрическая информация, например, о кодировке документа.
... - это заголовок страницы, он помещается внутри раздела head. У любой страницы должен быть свое уникальное название.- - это служебная информация. Она подключает к странице отдельные стили - css и т. д. Не отображается пользователю.
- ... - тело страницы. Вся основная информация заключается в этот тег.
- ... - гиперссылки.
- - изображения.
- ... - жирный текст.
- ... - курсив.
Элементов внутри body может быть неограниченное количество.
Например, вот так выглядит часть кода страницы одной из записей нашего блога.
Чем чаще использовать теги, тем быстрее они запоминаются. Всегда можно найти справочник со всеми тегами, атрибутами и их значениями.
Термин «разметка» происходит от традиционной практики разметки рукописей перед публикацией (то есть добавления символических команд на полях и между строк в бумажной рукописи).
В течение многих столетий это делали работники издательства (редакторы и корректоры) которые отмечали, каким шрифтом, стилем и кеглем должны быть набраны фрагменты текста, а затем передавали рукопись наборщикам, которые вручную осуществляли набор текста с учетом символов разметки.
Язык разметки - это набор специальных инструкций, называемых тегами (tags), выполняющих следующие функции:
задание функций обработки выделенных элементов;
выделение логических элементов данного документа.
Задание функций обработки выделенных элементов
В текстовых процессорах существуют встроенные команды включения/выключения шрифтов и другое, аналогичные командам управления размещением информации на экране или при печати. Такой подход называется командной илипроцедурной разметкой .
Примеры процедурной разметки
Выделение логических элементов документа
Служит для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры без указания способа обработки. Такая разметка называется описательной.
Изменяя набор процедур, соответствующий описательной разметке, можно изменить внешнее представление одного и того же документа.
Описательная разметка
Основным достоинством описательной разметки является ее гибкость, поскольку фрагменты текста отмечены как «чем они являются» (а не «как они должны быть отображены»).
В будущем может быть написано программное обеспечение для такой обработки этих фрагментов, которая даже не предусматривалась разработчиками языков. Например, гиперссылки HTML, первоначально предназначенные для навигации пользователями по совокупности связей в сети, в дальнейшем стали использоваться также механизмами поиска и индексирования в сети, для оценки популярности ресурсов и так далее.
Примеры языков разметки
Языки разметки используются везде, где требуется вывод форматированного текста:
в типографии (SGML,TeX,PostScript,PDF),
пользовательских интерфейсах компьютеров (MicrosoftWord,OpenOffice,troff),
Всемирной Сети (HTML,XHTML,XML,WML,VML,PGML,SVG,XBRL).
Теговая структура языка разметки
Развитие идей описательной разметки привело к определению разметки как формального языка.
Теги языка (управляющие дескрипторы) определенным образом кодируются (выделяются относительно основного содержимого документа) и служат в качестве инструкций для программы, производящей показ содержимого документа на стороне клиента.
Во многих современных языках для обозначения этих команд (теги языка) использовались символы < и >, внутри которых помещались названия инструкций и их параметры (HTML и XML). В SGML можно назначать другие символы для обрамления тега (например, фигурные скобки). Кроме того, существуют разные системы языков-подмножеств, которые используются, с меньшими возможностями, например на веб-форумах и досках объявлений используется язык разметки BBCode, теги которого ограничиваются символами квадратных скобок: .
Теговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тегами. В большинстве случаев теги используются парами. Пара состоит из открывающего (start tag) и закрывающего (end tag) тегов.
Синтаксис открывающего тега: <имя_тега [атрибуты]>
Имя закрывающего тега отличается от имени открывающего лишь тем, что перед ним ставится наклонная черта: имя_тега>
Атрибуты определяют дополнительные характеристики элемента. Атрибуты тега записываются в следующем формате: имя[="значение"]. Для некоторых атрибутов значение может не указываться. У закрывающего тега атрибутов не бывает.
…Действие любого парного тега начинается с открывающего тега и заканчивается при встрече соответствующего закрывающего тега.
Пару, состоящую из открывающего и закрывающего тегов, называют контейнером, а часть текста между ними, - элементом.
Заголовок 1 уровня
Заголовок 2 уровня
В зависимости от используемого языка разметки дополнительно возможно применение одиночного тега и тега пустого элемента. Имя тега определяет тип элемента.
Синтаксис одиночного тега: <имя_тега [атрибуты] />
В некоторых
языках разметки имена тегов заранее
определены (HTML). В других не регламентируются
жестко, т.е. пользователи могут вводить
и использовать новые теги (XML). Например,
тег «persona» можем определить тип этого
XML элемента, как фамилия имя и отчество.
В SGML элементы могут пересекаться, то есть в SGML возможна такая последовательность тегов:
В XML элементы имеют строгую синтаксическую структуру, то есть быть строго вложенными друг в друга и всегда закрываться:
Кроме того, в SGML, HTML они не обязаны быть закрытыми:
Практически во всех языках разметки документов значение атрибута интерпретируется как текстовое. Значение атрибута принято брать в кавычки.
Примечание:
Документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках - например, указание на заголовки, выделения, списки и т. д.
Т.е. документ представляет собой не что иное, как обычный АSСII-файл, с добавленными в него управляющими кодами (тегами).
Языки разметки
Язык разметки (текста) в компьютерной терминологии -- набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Принадлежит классу компьютерных языков. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках -- например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки позволяет вставлять в документ интерактивные элементы и содержание других документов.
Следует отметить, что язык разметки неполон по Тьюрингу и обычно не считается языком программирования, хотя, строго говоря, он им является.
HTML (от англ. HyperText Markup Language -- «язык разметки гипертекста») - разработан британским учёным Тимом Бернерсом-Ли приблизительно в 1986--1991 годах в стенах Европейского Центра ядерных исследований в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантических элементов -- дескрипторов. Дескрипторы также часто называют «тегами». С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста. Мультимедийные возможности были добавлены позже.
Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на оборудовании с различной технической оснащённостью (цветной экран современного компьютера, монохромный экран органайзера, ограниченный по размерам экран мобильного телефона или устройства и программы голосового воспроизведения текстов). Однако современное применение HTML очень далеко от его изначальной задачи. Например, тег