Как получить URL из HTML-формате в R?

0

на веб-сайте " http://www.amazon.com/Logitech-910-002974-Wireless-Mouse-Scrolling/dp/B007T1CTDE/ref=sr_1_4?ie=UTF8&qid=1396676617&sr=8-4&keywords=logitech+mouse "

Я хочу получить ссылку

"/product-reviews/B002HWRJBC/ref=sp_detail_page_cr_lnk"

в

<a class="a-size-base" href="/product-reviews/B002HWRJBC/ref=sp_detail_page_cr_lnk">520</a>

Может ли кто-нибудь помочь мне с Xpath? Спасибо!

  • 0
    Когда я открываю веб-страницу, такой ссылки не существует (поскольку страницы Amazon сильно настроены, они могут предоставлять разный вывод разным пользователям). Таким образом, вы можете добавить HTML-код, который вы видите в вопросе. Однако вы можете решить это самостоятельно: с помощью Firebug (Firefox) или Chrome Developer Tools вы можете просто выбрать нужный элемент и, щелкнув правой кнопкой мыши, скопировать XPath.
Теги:
xpath

1 ответ

1

Вы пытаетесь очистить отзывы Amazon? Я написал пакет для этого в ответ на другой вопрос StackOverflow.

  • 0
    благодарю вас! я проверю

Ещё вопросы

Сообщество Overcoder
Наверх
Меню