Скраб HTML в веб-приложении Rails

0

Я пытаюсь получить мое приложение rails для извлечения HTML-страницы веб-страницы.

Я хочу получить весь HTML из URI, например /news_articles/7 в строку.

Я попытался использовать что-то вроде Nokogiri, но, похоже, заблокировал мьютекс.

Цель этого - отправить строку HTML в Amazon SES.

благодаря

  • 0
    1) Я не могу разобрать ваш ... получить весь HTML URI .... 2) Что такое Нокугири? 3) Кажется => Кажется 4) Причина => Цель
  • 0
    Вы можете просто зайти в свое приложение, щелкнуть правой кнопкой мыши и view source ?
Показать ещё 1 комментарий
Теги:
web-scraping
amazon

1 ответ

1
Лучший ответ

Nokogiri в сочетании с Mechanize будет хорошо служить вам.

Gemfile

gem 'nokogiri'
gem 'mechanize'

контроллер

agent = Mechanize.new()
# allow the agent to follow redirects
agent.follow_meta_refresh = true
# get the desired page
page = agent.get('http://www.mysite.com/new_articles/7')
# output its html
page.body

Возможный дубликат

  • 0
    Я думаю, что он пытается запустить это из цикла запроса Rails. Следовательно, он заблокирует все приложение Rails. Это его главная проблема.
  • 0
    Jup, который имеет больше смысла, я думаю, вы предоставили правильную ссылку

Ещё вопросы

Сообщество Overcoder
Наверх
Меню