Разбор xml создает набор данных

Question

Разбор xml создает набор данных

1

Основываясь на этом.xml, я пытаюсь получить фотографии из каждой статьи:

    <?xml version="1.0" encoding="UTF-8"?>
    <articles>
        <article hint="0">      
            <id>498940</id>
            <type>1</type>
            <category>International</category>
            <title>
                <![CDATA[News title 1]]>
            </title>
            <description>
                <![CDATA[News Description 2]]>
            </description>  
            <content>   
                <photos is3idfp="CMS_12_498940" is3fechapub="2015-03-26 15:53:54">
                    <photo>                 
                        <photoURL>http://static01.nyt.com/images/2015/03/27/world/27IRAQ/27IRAQ-master675.jpg</photoURL>
                        <photodescription>
                            <![CDATA[U.S. Airstrikes on ISIS in Tikrit Prompt Boycott by Shiite Fighters]]>
                        </photodescription>
                    </photo>
                    <photo>
                        <photoURL>http://static01.nyt.com/images/2015/03/26/world/alps-web/26plane10-master675.jpg</photoURL>
                        <photodescription>
                            <![CDATA[Challenges Weigh Heavily on Recovery Efforts in Germanwings Crash]]>
                        </photodescription>
                    </photo>
                    <photo>
                        <photoURL>http://static01.nyt.com/images/2015/03/26/world/26Yemen3/26Yemen3-master180.jpg</photoURL>
                        <photodescription>
                            <![CDATA[Saudi Arabia Leads Air Assault in Yemen]]>
                        </photodescription>
                    </photo>            
                </photos>
            </content>      
        </article>
        <article hint="0">      
            <id>498941</id>
            <type>5</type>
            <title>
                <![CDATA[Advertisement]]>
            </title>
<urlAd>http://ads.google.com/RealMedia/ads/adstream_nx.ads/(random)@x31</urlAd>
        </article>
        <article hint="0">      
            <id>498940</id>
            <type>1</type>
            <category>International</category>
            <title>
                <![CDATA[News title 2]]>
            </title>
            <description>
                    <![CDATA[News Description 2]]>
            </description>              
            <content>               
                <photos is3idfp="CMS_12_498940" is3fechapub="2015-03-26 15:53:54">
                    <photo>                 
                        <photoURL>http://static01.nyt.com/images/2015/03/27/sports/Y-JACKSON/Y-JACKSON-master675.jpg</photoURL>
                        <photodescription>
                            <![CDATA[Wisconsin Guard Carries an N.B.A. Pedigree, but Is Inspired by His Mother]]>
                        </photodescription>
                    </photo>
                    <photo>
                        <photoURL>http://static01.nyt.com/images/2015/03/27/sports/LOVE/LOVE-master675.jpg</photoURL>
                        <photodescription>
                            <![CDATA[Kevin Love Shows What He Can Do as Cavaliers See What They Can Be]]>
                        </photodescription>
                    </photo>
                    <photo>
                        <photoURL>http://static01.nyt.com/images/2015/03/26/sports/CITY-KNICKS/CITY-KNICKS-blog427.jpg</photoURL>
                        <photodescription>
                            <![CDATA[Knicks Approach a Franchise Record With a Pounding From the Clippers]]>
                        </photodescription>
                    </photo>            
                </photos>
            </content>      
        </article>
    </articles>

получение набора данных из xml:

string sourceXML = "http://mydomain/myxmlfile.xml";
XmlReader xmlFile = XmlReader.Create(sourceXML, new XmlReaderSettings());
DataSet ds = new DataSet();
ds.ReadXml(xmlFile);

я получаю четыре таблицы:

ds.Tables[0].TableName, article
ds.Tables[1].TableName, content
ds.Tables[2].TableName, photos
ds.Tables[3].TableName, photo

поэтому я пытаюсь разобрать, и я получаю статьи, но все картинки:

1 title: News title 1           
1 title: News Description 2         
http://static01.nyt.com/images/2015/03/27/world/27IRAQ/27IRAQ-master675.jpg
http://static01.nyt.com/images/2015/03/26/world/alps-web/26plane10-master675.jpg
http://static01.nyt.com/images/2015/03/26/world/26Yemen3/26Yemen3-master180.jpg
http://static01.nyt.com/images/2015/03/27/sports/Y-JACKSON/Y-JACKSON-master675.jpg
http://static01.nyt.com/images/2015/03/27/sports/LOVE/LOVE-master675.jpg
http://static01.nyt.com/images/2015/03/26/sports/CITY-KNICKS/CITY-KNICKS-blog427.jpg
1 title: News title 2           
1 title: News Description 2         
http://static01.nyt.com/images/2015/03/27/world/27IRAQ/27IRAQ-master675.jpg
http://static01.nyt.com/images/2015/03/26/world/alps-web/26plane10-master675.jpg
http://static01.nyt.com/images/2015/03/26/world/26Yemen3/26Yemen3-master180.jpg
http://static01.nyt.com/images/2015/03/27/sports/Y-JACKSON/Y-JACKSON-master675.jpg
http://static01.nyt.com/images/2015/03/27/sports/LOVE/LOVE-master675.jpg
http://static01.nyt.com/images/2015/03/26/sports/CITY-KNICKS/CITY-KNICKS-blog427.jpg

Я хотел бы получить только фотографии для каждой статьи, вот что я пробовал:

foreach (DataRow row in ds.Tables[0].Rows)
{
    try
    {
        string element = row["type"].ToString();
        article = new Article();
        feed += element + " title: " + row["title"] + Environment.NewLine;
        feed += element + " title: " + row["description"] + Environment.NewLine;
        article.setTitle("<![CDATA[" + row["title"].ToString() + "]]>");
        foreach (DataRow row1 in ds.Tables[3].Rows)
        {
            feed += row1["photoURL"] + Environment.NewLine;                                       
        }
        listArt.Add(article);

        i++;
    }
    catch (IndexOutOfRangeException ioe)
    {
        feed += "Error al crear " + sourceXML + Environment.NewLine;
        feed += ioe.ToString() + Environment.NewLine;
    }
}
textBox1.AppendText(feed);

Jorgesys 27 март 2015, в 03:19

Источник

0

В любом случае, используйте StringBuilder вместо feed += ... , это значительно улучшит производительность.
abatishchev 27 март 2015, в 01:43
0

А вопрос такой? Другими словами - что не работает?
abatishchev 27 март 2015, в 01:44
0

Также вы можете использовать LINQ to XML или XPath, а не DataSet.
abatishchev 27 март 2015, в 01:45

Показать ещё 1 комментарий

Теги:

c#

linq

xml

winforms

dataset

1 ответ

Ещё вопросы

В любом случае, используйте StringBuilder вместо feed += ... , это значительно улучшит производительность.
А вопрос такой? Другими словами - что не работает?
Также вы можете использовать LINQ to XML или XPath, а не DataSet.

abatishchev · Answer 1 · 2015-03-27T00-23-00.000Z

var q = from article in XDocument.Load(path)
                                 .Root
                                 .Elements("article")
        let photos = article.Element("content")
                            .Element("photos")
                            .Elements("photo")
                            .Elements("photoURL")
        select new
        {
            ArticleId = (string)article.Element("id"),
            Photos = photos.Select(e => (string)e).ToArray()
        };

Применение:

foreach (var a in q)
{
    Console.WriteLine(a.ArticleId);
    foreach (var p in a.Photos)
    {
        Console.WriteLine(p);
    }
}

спасибо за информацию :), с помощью Linq проще, но как я могу проверить статью без содержимого тегов - фотографии - фото и т. д. В моем .xml есть тип элемента 5.
о хорошо, я делаю это: stackoverflow.com/questions/1039628/…
Круто, просто помните, что вы всегда можете заменить Where(predicate).Any() на Any(predicate) .