Как сопоставить элементы JAXB в CIM / RDF?

Question

Как сопоставить элементы JAXB в CIM / RDF?

1

Попытка загрузить модель из файла CIM/XML в соответствии с IEC 61970 (общая информационная модель для моделей энергосистем), я нашел проблему; Согласно графикам JAXB между элементами предоставляется @XmlREF @XmlID, и оба они должны быть равны. Но в CIM/RDF ссылки на ресурс через идентификатор, т.е. Rdf: resource = "#_ 37C0E103000D40CD812C47572C31C0AD", содержат символ "#", поэтому JAXB не может сопоставлять "GeographicalRegion" и "SubGeographicalRegion.Region", когда в rdf: атрибут ресурса присутствует символ "#".

Вот пример:

<cim:GeographicalRegion rdf:ID="_37C0E103000D40CD812C47572C31C0AD">
<cim:IdentifiedObject.name>GeoRegion</cim:IdentifiedObject.name>
<cim:IdentifiedObject.localName>OpenCIM3bus</cim:IdentifiedObject.localName>
</cim:GeographicalRegion>
<cim:SubGeographicalRegion rdf:ID="_ID_SubGeographicalRegion">
<cim:IdentifiedObject.name>SubRegion</cim:IdentifiedObject.name>
<cim:IdentifiedObject.localName>SubRegion</cim:IdentifiedObject.localName>
<cim:SubGeographicalRegion.Region rdf:resource="#_37C0E103000D40CD812C47572C31C0AD"/>
</cim:SubGeographicalRegion>

Arturo 15 март 2014, в 22:17

Источник

Теги:

java

xml

jaxb

rdf

1 ответ

Ещё вопросы

Jeen Broekstra · Answer 1 · 2014-03-19T16-37-00.000Z

Я понимаю, что вы просите решение с помощью JAXB, но я настоятельно рекомендую вам рассмотреть решение на основе RDF, поскольку оно более гибкое и надежное. Вы в основном пытаетесь изобрести то, что уже создали встроенные партизаны RDF. RDF/XML - сложный формат для синтаксического анализа, не имеет смысла пытаться взломать ваш собственный синтаксический анализ вместе - тем более, что файлы, имеющие очень разные структуры XML может выражать точно такую же информацию: это становится очевидным только при просмотре уровня RDF. Вы можете обнаружить, что ваш обозреватель JAXB работает в одном файле CIM/RDF, но полностью не работает на другом.

Итак, вот пример того, как обрабатывать ваш файл с помощью Sesame RDF API. При этом не выполняется никаких указаний, это просто анализирует файл и помещает его в встроенную RDF-модель, которую вы можете манипулировать и запрашивать под любым углом.

Предполагая, что корневой элемент вашего CIM файла выглядит примерно так:

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" 
         xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" 
         xmlns:cim="http://example.org/cim/">

(конечно, конечно, но мне нужны префиксы для правильного примера)

Затем вы можете сделать следующее, используя парсер Sesame Rio RDF/XML:

 String baseURI = "http://example.org/my/file";
 FileInputStream in = new FileInputStream("/path/to/my/cim.rdf"); 
 Model model = Rio.parse(in, baseURI, RDFFormat.RDFXML);

Это создает модель RDF в памяти вашего документа. Затем вы можете просто фильтровать запрос. Например, чтобы распечатать свойства всех ресурсов, которые имеют _37C0E103000D40CD812C47572C31C0AD как их SubGeographicalRegion.Region:

 String CIM_NS = "http://example.org/cim/";
 ValueFactory vf = ValueFactoryImpl.getInstance();
 URI subRegion = vf.createURI(CIM_NS, "SubGeographicalRegion.Region");
 URI res = vf.createURI("http://example.org/my/file#_37C0E103000D40CD812C47572C31C0AD");
 Set<Resource> subs = model.filter(null, subRegion, res).subjects();

 for (Resource sub: subs) {
     System.out.println("resource: " + sub + " has the following properties: ");
     for (URI prop: model.filter(sub, null, null).predicates()) {
          System.out.println(prop + ": " + model.filter(sub, prop, null).objectValue());
     }
 }

Конечно, в этот момент вы также можете преобразовать модель в другой формат синтаксиса для дальнейшей обработки вашим приложением - как вы сочтете нужным. Дело в том, что разница между идентификаторами с ведущими # и без была решена для вас парсером RDF/XML.

Это, конечно, личное мнение, потому что я не знаю подробностей вашего прецедента, но я думаю, вы обнаружите, что это довольно быстро и гибко. Следует также отметить, что хотя вышеупомянутое решение сохраняет всю модель в памяти, вы можете легко адаптировать ее к более потоковому (и, следовательно, менее интенсивному в памяти) подходу, если вы обнаружите, что ваши файлы слишком большие.

Извините за комментарий так поздно, я очень ценю ваш совет, но я знаю, что вы еще не уловили проблему. CIM (Общая информационная модель) - это онтология, очень признанная в качестве стандарта (IEC 61970) в сообществе энергосистем, и по этой причине мы заранее знаем, какова модель для обработки. Наша цель - иметь возможность отобразить все данные из XML-файла CIM в модель Java, которая отражает онтологию CIM.
Я уже построил статическую модель Java (классы, иерархию и ассоциации) в соответствии со стандартом CIM из определения UML, доступного на веб-странице модели, и я использовал инструмент Visual Paradigm для генерации для него кода de java. Я создавал экземпляры java-объектов с помощью JDOM, используя ресурсы и ссылки между ресурсами, описанными в файле CIM XML. Таким образом, у меня есть набор инструментов для более сложных и эффективных операций в классах Java.
Почему мы хотим использовать JAXB, а не Jena, Sesame или XSLT? Во-первых, для JAXB не нужно создавать поиски для каждого запроса, чтобы получить значение каждого атрибута или ассоциации в элементах RDF. Однако в случае Jena, Sesame или XSLT каждый запрос в файле RDF эквивалентен поиску по циклам в полном файле RDF, что приводит к тому, что каждый запрос выполняет поиск, который приводит к критической трудоемкой задаче.
С другой стороны, когда JAXB обнаружил элемент, это сопоставление с java-моделью напрямую и один раз в java-запросах, и, следовательно, поиски более эффективны, поскольку поиски выполняются по спискам, а не по нескольким поискам в общем графике, как в RDF. , Во-вторых, мне не нужно управлять де-моделью как файлом RDF, потому что, как я уже упоминал выше, модель может лучше обрабатываться в Java, чтобы выполнять более сложные операции эффективным способом.
Я хочу обработать RDF как XML-файл и использовать функцию JAXB '@XmlID' y '@XmlIDREF' для сопоставления элементов с одинаковым идентификатором. Почему мне нужна помощь? Потому что я уже полностью загрузил модель из RDF в модель Java, используя JAXB, выполняя прямое отображение. Но ссылки между объектами не работают, потому что идентификаторы, используемые для сопоставления, не равны, поскольку ссылки на другие ресурсы принадлежат атрибуту, где значение представляет собой символ «#» плюс идентификатор.
Что мне действительно нужно? Мне нужно решение, использующее JAXB, которое позволяет обрабатывать идентификатор, например, если атрибуты rdf: resource не имеют символа «#», или удалять его как «#», прежде чем JAXB выполнит синтаксический анализ.
Я не эксперт JAXB, поэтому я не могу помочь вам с этим, я боюсь. Все, что я могу сделать, это повторить, что я думаю, что вы недооцениваете производительность современных инструментов RDF. Вы говорите: «каждый запрос эквивалентен поиску по циклам в полном файле RDF», что совсем не так, как работает «Сезам» (или решение, которое я покажу в ответе выше). Но здесь мы далеко уходим. Извините, что не могу помочь, я оставлю здесь ответ, так как это может убедить других, что это хорошая альтернатива. Я надеюсь, что кто-то другой может помочь вам с решением на основе JAXB.