HTML-тег Regex с определенным URL

0

У меня есть html-контент с <script>. В те тегах <script> меня есть url, указывающий на видео.

Я хочу заменить те теги html своим специальным тегом, которые используют этот шаблон: [VIDEO] MY_URL _ [/VIDEO]

Я использую hpple для разбора содержимого html.

Я использую этот запрос xPath://

Когда парсер найдет результат для моего запроса, я использую эту функцию для извлечения URL-адреса видео:

NSDataDetector* detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypeLink error:nil];
NSArray* matches         = [detector matchesInString:raw options:0 range:NSMakeRange(0, [raw length])];
NSString *finalUrl = [self urlMatchingRegexResults:matches withExtensionArray:[self videosExtensionsArray]];

if (finalUrl) {

        NSString *replacement = [NSString stringWithFormat:@"[%@]%@[/%@]",tag,finalUrl,tag];
        NSString *pattern = [NSString stringWithFormat:@"<script.*>.*%@.*</script>",finalUrl];

        NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:pattern options:NSRegularExpressionCaseInsensitive error:nil];
        NSArray *matches = [regex matchesInString:self.store options:0 range:NSMakeRange(0, self.store.length)];
        modifiedString = [regex stringByReplacingMatchesInString: modifiedString options:0 range:NSMakeRange(0, modifiedString.length) withTemplate:replacement];
}

где "raw" является результатом [TFHppleElement raw], где [self videosExtensionsArray] - это массив расширений видео:

- (NSArray *)videosExtensionsArray {


    static NSArray *videosExtensionsArray;
    static dispatch_once_t onceToken;

    dispatch_once(&onceToken, ^{

        videosExtensionsArray =  @[@"mp4",@"mov",@"avi",@"flv",@"mkv"];

    });

    return videosExtensionsArray;
}

Проблема в том, что если у меня есть несколько тегов в моем html-контенте, мое регулярное выражение принимает первый открытый тег и принимает последний закрывающий тег.

Как я могу изменить свое регулярное выражение, чтобы избежать этой проблемы?

NSString *pattern = [NSString stringWithFormat:@"<script.*>.*%@.*<\\/script>",finalUrl];

РЕДАКТИРОВАТЬ :

Содержимое HTML:

<html><body><p style="text-align: center;"><a href="http://www.tuxboard.com/nba-jam-avec-gerald-green/gerald-green-nba-jam/" rel="attachment wp-att-171429">[IMG]http://www.tuxboard.com/photos/2014/03/Gerald-Green-NBA-Jam.jpg[/IMG]
</a>
</p>
<p><span id="more-171399"/><br/>
Si le jeu <strong>NBA Jam</strong> était édité cette année, le joueur des Phoenix Suns <strong>Gerald Green</strong> serait la star en couverture. Larrière des Suns est à la fois un immense dunkeur avec une <a href="http://www.tuxboard.com/la-detente-de-gerald-green/" target="_blank">détente phénoménale</a>, mais aussi une fine gâchette.</p>
<p style="text-align: center;"><a href="http://www.tuxboard.com/nba-jam-avec-gerald-green/video-nba-jam-gerald-green/" rel="attachment wp-att-171431">[IMG]http://www.tuxboard.com/photos/2014/03/Video-NBA-Jam-Gerald-Green.jpg[/IMG]
</a>
</p>
<p>Léquipe de Phoenix la intégré dans le jeu <strong>NBA Jam</strong>, suite à ses <a href="http://www.tuxboard.com/plus-lourde-defaite-de-lhistoire-des-lakers-et-duel-spurs-heat/" target="_blank">performances hors normes face au Thunder</a> avec notamment 41 pts.    </p>
<p>On vous laisse savourer cette vidéo, avec une jolie pépite à la fin (on nen dit pas plus…)</p>
<div id="tuxplayer">Chargement du player …</div>
<p><script type="text/javascript"><![CDATA[jwplayer("tuxplayer").setup({ flashplayer: "http://medias.tuxboard.com/playerv2.swf", file: "http://medias2.tuxboard.com/NBA_Jam_Gerald_Green.mp4",image: "http://www.tuxboard.com/photos/2014/03/NBA-Jam-Gerald-Green-on-Fire-640x357.jpg", height: 370,width: '100%', 'plugins': 'sharing-3'});]]></script></p>
<p>
Les dernières actions du bonhomme qui devrait remporter le titre du joueur ayant le plus progressé !</p>
<p style="text-align: center;">[IMG]http://www.tuxboard.com/photos/2014/03/Gerald-Green-Poster-Mason-Plumlee.gif[/IMG]
</p>
<p style="text-align: center;">[IMG]http://www.tuxboard.com/photos/2013/11/Dunk-Gerald-Green.gif[/IMG]
</p>
<p style="text-align: center;">[IMG]http://www.tuxboard.com/photos/2014/01/gerald-green-windmill.gif[/IMG]
</p>
<p><iframe width="640" height="360" src="http://www.youtube.com/embed/xnzQ3FWc7Oo?feature=oembed" frameborder="0" allowfullscreen=""/></p>
<p><iframe width="640" height="360" src="http://www.youtube.com/embed/Yyr6mkAbCQw?feature=oembed" frameborder="0" allowfullscreen=""/></p>
<p>Et surement son plus beau dunk :</p>
<p style="text-align: center;">
</p><div id="Gerald">Chargement du player …</div>
<p><script type="text/javascript"><![CDATA[
jwplayer("Gerald").setup({ flashplayer: "http://medias.tuxboard.com/playerv2.swf", file: "http://medias2.tuxboard.com/Gerald_Green_Windmill_Alley-Oop.mp4",image: "http://www.tuxboard.com/photos/2012/03/Video-Gerald-GreenAlley-Oop.jpg", height: 390,width: 640, 'plugins': 'sharing-3'});]]></script></p>
</body></html>

Журнал шаблона:

<script.*?>.*http://medias2.tuxboard.com/NBA_Jam_Gerald_Green.mp4.*?</script>
Теги:

1 ответ

1

Обычно совпадение находит самый длинный матч, вам нужен самый короткий, который обозначается *? для кратчайшего нуля или более. См. " Регулярные выражения" - Руководство пользователя ICU, на которое ссылается документация Apple "NSRegularExpression".

  • 0
    Примерно так: @ "<script. *?>. *?% @. *? <\\ / script>"?
  • 0
    Это выглядит правильно, вы пробовали это?
Показать ещё 7 комментариев

Ещё вопросы

Сообщество Overcoder
Наверх
Меню