В статье про SAX-парсер я рассказал что это такое и пообещал привести примеры не только на Visual Basic, но и на других языках программирования, в частности на Java. Ниже приведен такой пример - класс VXMLChecker, который умеет проверять XML-текст и XML-файл на соответствие XSD-схеме. Для этого у него есть два публичных метода: checkXML и checkFile.
воскресенье, 14 ноября 2010 г.
четверг, 11 ноября 2010 г.
SAX-парсер
В заметке Schematron и XSD я вскользь упомянул про SAX-парсер и то, что с его помощью можно проверить XML-файл на соответствие XSD-схеме. Здесь я постараюсь описать это подробнее на примере SAX-парсера от Microsoft.
Итак, способ разбора XML-файла с помощью SAX-парсера является событийно-ориентированным. Это означает, что приложение, которое использует SAX-парсер, получает от него уведомления о начале и об окончании XML-элементов, атрибутах, тексте внутри XML-узлов, ошибках разбора и т.д. - в том порядке, в котором SAX-парсер встретил их в XML-файле. При этом, SAX-парсер не сохраняет в памяти разобранные элементы, в отличие от интерфейса DOM, для которого строится и хранится в памяти объектная модель всего XML. Это делает SAX-парсер пригодным для потоковой обработки (например, для проверки или для загрузки куда-либо) XML-файлов любого размера.
Посмотрим на пример использования SAX-парсера в Visual Basic 6.0 (примеры на Java, C# обязательно будут в след. статьях).
Итак, способ разбора XML-файла с помощью SAX-парсера является событийно-ориентированным. Это означает, что приложение, которое использует SAX-парсер, получает от него уведомления о начале и об окончании XML-элементов, атрибутах, тексте внутри XML-узлов, ошибках разбора и т.д. - в том порядке, в котором SAX-парсер встретил их в XML-файле. При этом, SAX-парсер не сохраняет в памяти разобранные элементы, в отличие от интерфейса DOM, для которого строится и хранится в памяти объектная модель всего XML. Это делает SAX-парсер пригодным для потоковой обработки (например, для проверки или для загрузки куда-либо) XML-файлов любого размера.
Посмотрим на пример использования SAX-парсера в Visual Basic 6.0 (примеры на Java, C# обязательно будут в след. статьях).
суббота, 6 ноября 2010 г.
Failed to start Qt Designer
Столкнулся с проблемой - в NetBeans после обновления перестал запускаться Qt Designer с формулировкой: "Failed to start Qt Designer. Make sure it is installed and added to PATH".
Лечится в терминале командой:
export PATH=$PATH:/Developer/Applications/Qt/Designer.app/Contents/MacOS
===
Перепечатка материалов блога разрешается с обязательной ссылкой на blog.coolsoftware.ru
Лечится в терминале командой:
export PATH=$PATH:/Developer/Applications/Qt/Designer.app/Contents/MacOS
===
Перепечатка материалов блога разрешается с обязательной ссылкой на blog.coolsoftware.ru
понедельник, 1 ноября 2010 г.
Schematron и XSD
Коротко про схематрон я написал в предыдущей статье. Здесь же речь пойдет об объединении схематрон-схемы и схемы XSD.
XSD-схема замечательно работает, когда необходимо провести форматный контроль XML файла. В нем есть все необходимые инструменты, чтобы проверить структуру XML-файла и соответствие данных определенным типам. Однако логический и арифметический контроль с помощью XSD-схемы осуществить нельзя. Для этого лучше всего подходит схематрон.
Однако, хранить две отдельных схемы (XSD и Schematron) в разных файлах неудобно. К тому же, существующие механизмы обработки XML-файлов (DOM- и SAX-парсеры) не умеют работать со схемами Schematron, а дважды проверять один и тот же XML по разным схемам не рационально (потребуется дважды "отпарсить" весь XML-файл).
Предлагается задавать правила проверки на языке Schematron в подэлементах <xs:appinfo> элементов <xs:annotation> XSD-схемы.
Пример:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:sch="http://www.ascc.net/xml/schematron">
<xs:element name="Root">
<xs:annotation>
<xs:appinfo>
<sch:pattern name="DocumentChecker">
<sch:rule context="Person">
<sch:assert test="@birthYear<1990">Birth year should be less than 1990.</sch:assert>
</sch:rule>
</sch:pattern>
</xs:appinfo>
</xs:annotation>
</xs:element>
</xs:schema>
В этом примере мы видим утверждение на языке Schematron <sch:assert test="@birthYear<1990">Birth year should be less than 1990.</sch:assert>, которое должно проверяться в контексте XML-узла Person (<sch:rule context="Person">).
===
Перепечатка материалов блога разрешается с обязательной ссылкой на blog.coolsoftware.ru
XSD-схема замечательно работает, когда необходимо провести форматный контроль XML файла. В нем есть все необходимые инструменты, чтобы проверить структуру XML-файла и соответствие данных определенным типам. Однако логический и арифметический контроль с помощью XSD-схемы осуществить нельзя. Для этого лучше всего подходит схематрон.
Однако, хранить две отдельных схемы (XSD и Schematron) в разных файлах неудобно. К тому же, существующие механизмы обработки XML-файлов (DOM- и SAX-парсеры) не умеют работать со схемами Schematron, а дважды проверять один и тот же XML по разным схемам не рационально (потребуется дважды "отпарсить" весь XML-файл).
Предлагается задавать правила проверки на языке Schematron в подэлементах <xs:appinfo> элементов <xs:annotation> XSD-схемы.
Пример:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:sch="http://www.ascc.net/xml/schematron">
<xs:element name="Root">
<xs:annotation>
<xs:appinfo>
<sch:pattern name="DocumentChecker">
<sch:rule context="Person">
<sch:assert test="@birthYear<1990">Birth year should be less than 1990.</sch:assert>
</sch:rule>
</sch:pattern>
</xs:appinfo>
</xs:annotation>
</xs:element>
</xs:schema>
В этом примере мы видим утверждение на языке Schematron <sch:assert test="@birthYear<1990">Birth year should be less than 1990.</sch:assert>, которое должно проверяться в контексте XML-узла Person (<sch:rule context="Person">).
===
Перепечатка материалов блога разрешается с обязательной ссылкой на blog.coolsoftware.ru
Схематрон (Schematron)
Схематрон - это язык для проверки правильности утверждений о данных в формате XML.
Разработан Rick Jelliffe из Academia Sinica Computing Centre (http://xml.ascc.net/resource/schematron/schematron.html).
Валидация XML-файла по схематрон-схеме подобна трансформации этого XML-файла в соответствии с преобразованием на языке XSLT (eXtensible Stylesheet Language Transformations). На выходе получается текст, который по-сути является протоколом проверки.
На самом деле, любую схематрон-схему можно преобразовать в XSLT. Это свойство схематрона как раз и является самым главным его достоинством.
Пример схематрон-схемы приведен ниже:
<?xml version="1.0" encoding="US-ASCII"?>
<sch:schema xmlns:sch="http://www.ascc.net/xml/schematron">
<sch:title>Example Schematron Schema</sch:title>
<sch:pattern name="dog_pattern">
<sch:rule context="dog">
<sch:assert test="count(ear) = 2">A 'dog' element should contain two 'ear' elements.</sch:assert>
<sch:report test="bone">This dog has a bone.</sch:report>
</sch:rule>
</sch:pattern>
</sch:schema>
Давайте разберем, что здесь что.
Тег <sch:schema> - схема, корневой тег схематрона.
Внутри тега схемы располагаются название схемы - тег <sch:title>, и шаблоны - теги <sch:pattern>. Атрибут шаблона name задает имя шаблона (в нашем примере: "dog_pattern").
Шаблон состоит из правил - тег <sch:rule>. Каждое правило применяется к узлу проверяемого по схематрон-схеме XML-файла, путь к которому (XPath) задается атрибутом context.
Правило состоит из утверждений (<sch:assert>) и сообщений (<sch:report>), которые имеют атрибут test - условие, формулируемое на языке XPath. Разница между ними в том, что если условие в сообщении истинно (в примере: test="bone"), то в выходной файл пишется текст сообщения (This dog has a bone.), а текст утверждения (A 'dog' element should contain two 'ear' elements.) пишется в выходной файл только если условие НЕ выполнено (test="count(ear) = 2").
Подписаться на:
Сообщения (Atom)