Содержание
-
Структура XML-документов
По материалам курса University of Washingtonhttp://www.cs.washington.edu/education/courses/cse190m/07sp/index.shtml
-
XML
Язык XML основан на HTML, но является, с одной стороны, его расширением, а с другой стороны, он имеет более строгие правила. Основные цели создания XML: Обеспечить возможность универсального текстового представленияструктурированных данных. Дать возможность создавать языки, подобные XHTML на основе единыхправил и с помощью простых средств. Обеспечить возможность обработки структурированных данных спомощью универсальных программных средств. Таким образом, с помощью XML удается: Переносить данные из одной системы в другую; единственное условие – обе системы должны уметь разбирать структуру данных XML. Просто определять легко понимаемые человеком и машиной языки,такие как XHTML, MathML, SVG и т.д. Создавать универсальные программы обработки текстов на XML дляполучения внутреннего представления представленных структур (DOM).
-
Структура документа XML
В целом структура XML-документа знакома нам по структуре XHTML-документа: заголовок и тело, которое содержит корневой элемент ивложенные в него и друг в друга другие элементы. Содержание моего элемента Замечания: В 2006 году разработан стандарт XML 1.1, однако, в качестве номера версиинужно указывать 1.0, если только вы не используете в документе специфических возможностей XML 1.1. Все программы обязаны понимать кодировки UTF-8и UTF-16, однако, если в вашемдокументе используются, скажем, русские символы – используйтесоответствующую кодировку, скажем,windows-1251. В отличие от HTML все пробелы и переводы строк внутри текстовыхэлементов сохраняются, а имена элементов и атрибутов чувствительнык регистру букв.
-
Проверка правильности XML-документа
Имеются две формы проверки правильности: формальная правильность (структурная); говорят, что формальноправильный документ “well-formed”; содержательная правильность (по составу и содержанию тегов элементов и атрибутов); говорят, что содержательно правильныйдокумент “valid”. для проверки формальной правильности достаточно проанализироватьвнешнюю структуру документа: правильно ли сделана вложенность элементов; все ли значения атрибутов заключены в кавычки и т.п. для проверки содержательной правильности используются специальныеязыки, определяющие допустимость тегов, атрибутов, правильностьих вложенности друг в друга и т.п. Наиболее известным из таких языковявляется язык описания документов DTD.
-
Пример XML-документа
How to get a best mark Oh, please, please, help me! Для форматирования XML-документа можно использовать язык CSS,только привязка CSS-страниц к XML-документу производится чуть-чутьпо-другому, чем в HTML: Однако, чаще для форматирования применяется другой способ:XML-документ преобразуется в HTML и форматируется с помощьюXSL-документа. XSL – это отдельный сложный язык. -
Использование «сущностей» (entities)
Если в текстовых элементах документа нужно использовать специальныесимволы , &, ', ", то, как и в HTML вместо них используются замещающие их последовательности символов. Набор стандартных сущностей невелик (только для пяти вышеперечисленных символов, нет даже сущности для «неразрываемогопробела»), однако при определении своего языка (с помощью DTD) можноопределить свои собственные сущности.
-
Использование неанализируемого текста
myFunction 0 && x Если в тексте часто используются знаки &, , то использовать сущностистановится очень неудобно. Можно явно указать, что некоторый фрагменттекста не нужно анализировать на наличие сущностей и вложенныхэлементов, а нужно брать «как есть». Для этого используется специальныйэлемент CDATA: -
Описание конкретного языка с помощью DTD
Как обычно, начинаем со случая, когда описание структуры документа вложено непосредственно в сам документ («смешивание языков»). Конкретное содержание документа может быть определено, еслиопределен синтаксис языка, то есть состав элементов и атрибутов, возможные значения атрибутов и т.п. Это можно сделать с помощьюязыка описания структуры XML-документа DTD. Описание структуры документа начинается с описания структуры корневогоузла, которое содержит описание элементов, атрибутов и т.д. описание элементов]> содержание документа
-
Простой пример DTD
]> Студенты Преподаватель Заметка Не забудьте про экзамен! В этом примере описано, что корневой элемент должен содержать элементыto, from, headingи body (в указанном порядке), а, в свою очередь, этиэлементы могут содержать внутри себя произвольный текст. -
Вынесение DTD в отдельный документ
Студенты Преподаватель Заметка Не забудьте про экзамен! Описание типа документа может быть отделено от самого документа.Описание элементов тогда будет содержаться в отдельном файле, аиз основного документа будет ссылка на него. -
Структура блоков XML-документа
Синтаксически XML-документ состоит из следующих строительных блоков: Элементы (elements) Атрибуты (attributes) Сущности (entities) Текст PCDATA(parsed character data) Текст CDATA (character data) Примеры из XHTML: Элементы: pв
Это просто параграф
Атрибуты: src в Сущности: nbspвСлова отделены пробелами
Текст PCDATA: текст, в котором происходит перевод сущностей ианализируются вставленные элементы (как внутри параграфа). Текст CDATA: текст, который берется без изменений (как в ) -
Описание элементов XML-документа
При описании элементов указывают, что может содержаться внутри элемента, а также, какие он может иметь атрибуты. Вот несколькоспособов описать содержимое: Элемент должен быть пустым Элемент должен содержать произвольный текст Элемент может содержать произвольную комбинациютекста и любых других элементов. Элемент должен содержать указанные элементы в одномэкземпляре в указанном порядке. Все дочерние элементыдолжны быть также описаны.
-
Описание элементов (продолжение)
Элемент должен содержать один или более элементовmessage. Элемент должен содержать произвольное число элементовmessage, в том числе и ни одного. Элемент может содержать не более одного элементаmessage. Элемент должен элемент to, а после него – messageилиbody. Элемент может содержать любые из указанных элементовили текст в произвольном порядке в любом количестве.
-
Описание атрибутов
Предназначено для описания состава и содержания атрибутов некоторогоэлемента и имеет следующий вид: Например, если элемент scheduleможет содержать атрибут dateкакпоказано ниже: то описание синтаксиса может выглядеть так:
-
Типы и значения атрибутов
Вот несколько возможных типов атрибутов (список не полный): Вот несколько возможных способов задать значение атрибута по умолчанию:
-
Атрибуты и вложенные элементы
Атрибуты, как и вложенные элементы, можно использовать для описанияструктуры элементов. Иногда трудно выбрать, какой способ предпочесть. friends или 25/12/2008 friends или, может быть, 25122008 friends Основное правило: используйте атрибуты только если значение точно не будет иметь внутренней структуры; значение уточняет информацию об элементе (мета-данные).
-
Описание сущностей
Сущности используются для введения часто используемых текстовыхфрагментов и символов. Синтаксис: например,
Нет комментариев для данной презентации
Помогите другим пользователям — будьте первым, кто поделится своим мнением об этой презентации.