В настоящее время я пытаюсь проанализировать XML файл с помощью java, но при разборе я не могу разобрать теги, существующие внутри секции CDATA любого тега элемента. Все данные внутри секции CDATA анализируются как текст во время разбора с использованием DOM или SAX.
пожалуйста, предложите любой способ без какого-либо жесткого кодирования.
<Evaluation>
<![CDATA[<evaluation>
<interview ratingtype="0"/>
<item description="Ability to communicate well with others verbally and in writing:" hasrating="True" hascomments="False" /> ............ </item>
</evaluation> ]]
</Evaluation>
Секции CDATA - это текстовые узлы. Таким образом, синтаксический анализатор корректно считывает его как одну строку. Секции CDATA означают, что синтаксический анализатор не будет выполнять декодирование объектов. Вы можете узнать больше об этом в спецификации.
Если вы хотите рассматривать содержимое раздела CDATA как XML-документ или фрагмент, вам нужно сделать это вручную - другими словами: проанализировать его отдельно.
CDATA представляет собой текстовые узлы, как указано выше. Не будет смысла хранить теги внутри раздела CDATA. CDATA следует использовать для хранения простых строк.
В этом случае теги и теги не будут анализироваться как элементы парсером.