Подумалось: как могло бы выглядеть расширение XML для юридических документов? Что-то типа того, что разрабатывается на «Legal XML», но для русских условий делать то же самое, наверно, придется с нуля. Надо бы почитать тамошние документы, но пока некогда.
Правда, при беглом просмотре увидел, что Legal XML рассчитан на правоприменительные документы, а собственно нормативные акты им не охватываются. По-моему, это неправильно. То есть, нужно два уровня актов — нормативно-правовые и собственно правовые (в смысле, индивидуальные). То есть, статья, например, УПК — это один уровень, а конкретное постановление (о производстве обыска, и т.п) — другой уровень.
По идее, должен быть «скелетный» стандарт для актов вообще, с расширениями для каждой сферы деятельности (нотариат, прокуратура, и т.п.)
< Поток сознания on >
Для нормативных актов в целом нужны аттрибуты:
Отношения между норм. актами:
«Влияющий» — «подчиненный» (примерно то, что в «Гаранте» называется «корреспондентами» и «конфидентами», но этого мало. Поэтому…)
«Пакет» (документов: законов, уголовное дело, и т.п.) — «часть пакета» — «пакет», соответственно — «Влияющий» по отношению к его частям).
«Изменяющий» — «изменяемый»
«Отменяющий» — «отменяемый»
Статус норм. акта: «проект» — «вступает в силу с…» — «действующий» — «утратил силу».
«Статусом» должна обладать любая единица акта — статья, часть, и т.п. Нет статуса — равен статусу всего документа. То же для остальных отношений между актами.
Для акта целиком:
«Вид» (постановление, и т.п.), дата, которой датирован, принявший орган (органы — для коллективных) и название.
Ддаты принятия (думой, СФ, и т.д.)
Дата вступления в силу
«правовой акт» — «толкование»
«литература» — статьи и книги, посвященные акту
«Судебная практика»
…эти три атрибута — «подчиненные» по отношению к базовому акту.
Атрибуты — «официальный/неофициальный» (скажем, у «литературы» — «неофициальный» атрибут)
< Поток сознания off >
Не совсем понятно, правда, какие смысловые единицы выделять в тексте самого документа, пока что пришла в голову только связка «термин» — «определение».
Кстати, такие связки вполне реально распознавать на автомате, скриптом. То же самое можно сказать и вообще о текстах нормативных актов: они очень формализованы и в них используется ограниченный набор речевых конструкций.
В общем, пока что сюда выкладываю в качестве пищи для обсуждений. Разберусь с текучкой — буду читать литературу.