Я нашел этот код Python:
#! C:\python27
import urllib2
from bs4 import BeautifulSoup
url='http://www.google.com/'
conn = urllib2.urlopen(url)
html = conn.read()
soup = BeautifulSoup(html)
links = soup.find_all('a')
for tag in links:
link = tag.get('href',None)
if link != None:
print link
И мне нужно сделать HTML-страницу, которая запрашивает значение url, поэтому, когда я ее печатаю, она меняет значение в файле python и сканирует страницу, которую я набрал. У меня есть простой HTML-код, который запрашивает у пользователя URL-адрес, который он хочет обходить, и имеет текст ввода, чтобы он мог ввести то, что он хочет, но как я могу сделать значение, которое пользователь вводит, чтобы быть значением переменной url.
<form name="input" action="#" method="post">
Type in the page you want to crawl:<input type="text" name="url" value="http://www.google.com/"><br/>
<input type="submit" value="Submit">
</form>
Как я могу это сделать? Новое для Python, я только работал с JavaScript раньше.
Поскольку пользователь имеет прямой доступ к скрипту Python, нет необходимости проходить через HTML-форму.
Вы можете попросить пользователя ввести url непосредственно в программу Python.
Просто пиши:
url = raw_input("Please enter a URL to crawl: ")
python myscript.py
в командной строке?