У меня есть URL, из которого мне нужен его HTML. Я использовал следующий фрагмент кода.
String url = "http://www.sears.com/search="+keywords;
String jsp = retrieveContent(url);
Я заметил, что строка jsp
имеет другое содержимое, чем фактический исходный код веб-страницы (когда я просматриваю исходный код из моего браузера). Я считаю, что сценарий на стороне сервера (или он перенаправляется) вызывается, когда браузер открывается, и этот вывод скрипта - это то, что я вижу. Можете ли вы рассказать мне, как получить фактический html файл страницы?
Вы можете проверить эту ссылку в качестве примера. как я могу получить фактический html этого pagE?
Существует множество библиотек для раскрутки содержимого html, которые будут делать трюк, тот, который я использовал, JSOUP, JSOUP говорит:
"очистить и проанализировать HTML из URL, файла или строки"
JSOUP может удовлетворить вашу цель.
я хотел бы увидеть код метода retrieveContent, если это возможно, и если вы пытаетесь напрямую прочитать html-контент url, тогда есть хороший пример здесь http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html
Страница HTML хранится в переменной jsp. alert (jsp) покажет вам страницу.
Undefined local method or variable 'alert'
;)