1. Определение, задачи
HTML это стандартный язык разметки документов во Всемирной паутине. Все веб- страницы создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируется браузером и отображается в виде документа, удобном для
человека.
Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без искажений воспроизводиться на оборудовании с различной технической оснащённостью.
Однако современное применение HTML очень далеко от его изначальной задачи. С течением времени, основная идея платформонезависимости языка HTML была отдана в своеобразную жертву современным потребностям в мультимедийном и
графическом оформлении.
2. Место языка HTML в иерархии форматов данных
2.1. SGML->HTML
SGML (англ. Standard Generalized Markup Language ) — метаязык, на котором можно определять язык разметки для документов.
Изначально SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах.
HTML является приложением SGML
2.2. SGML->XML->XHTML
XML (англ. eXtensible Markup Language ) — рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML — текстовый формат, предназначенный для
хранения структурированных данных, для обмена информацией между программами. XML является упрощённым подмножеством языка SGML.
XHTML (англ. Extensible Hypertext Markup Language) — язык разметки веб-страниц, по возможностям сопоставимый с HTML, созданный на базе XML. Соответствует спецификации SGML. Для XHTML можно применять множество технологий,
разработанных для XML, например, XSLT и XPath. Анализ XHTML проще и быстрее, чем HTML. Поскольку синтаксис XML строже, чем SGML, обработка XHTML возможна даже на мобильных телефонах с малыми ресурсами
3. Спецификации
HTML 4.1 –

- Строгий (Strict): не содержит элементов, помеченных как «устаревшие» или «не одобряемые» (deprecated).
- Переходный (Transitional): содержит устаревшие теги в целях совместимости и упрощения перехода со старых версий HTML.