Когда я пытаюсь GET
веб-страницу с запросами, я получаю страницу успешно, пока ссылка хранится в переменной str. Тем не менее, когда я пытаюсь получить элемент из массива str, я не могу получить страницу.
import requests
from bs4 import BeautifulSoup
import re
f = open("pages.txt","r")
file = open("parsed.txt","a")
content = f.readlines()
for i in range(1):
a="http://registration.boun.edu.tr/scripts/sch.asp?donem=2017/2018-3&kisaadi=BM&bolum=BIOMEDICAL+ENGINEERING"
print(a + " " + str(type(a) ) )
req_link=a
r=requests.get(req_link)
c=r.content
soup=BeautifulSoup(c,"html.parser")
all=soup.find_all("td")
print(all[38])
PS E:\pythonCodes\BounCP> python .\getClasses.py
http://registration.boun.edu.tr/scripts/sch.asp?donem=2017/2018-3&kisaadi=BM&bolum=BIOMEDICAL+ENGINEERING <class 'str'>
<td><font style="font-size:12px">BM 519.01</font> </td>
import requests
from bs4 import BeautifulSoup
import re
f = open("pages.txt","r")
file = open("parsed.txt","a")
content = f.readlines()
for i in range(1):
a=content[1]
print( content[1] + " "+ str(type(content[1]) ) )
req_link=a
r=requests.get(req_link)
c=r.content
soup=BeautifulSoup(c,"html.parser")
all=soup.find_all("td")
#all=all[38:]
print(all)
PS E:\pythonCodes\BounCP> python .\getClasses.py
http://registration.boun.edu.tr/scripts/sch.asp?donem=2017/2018-3&kisaadi=BM&bolum=BIOMEDICAL+ENGINEERING
<class 'str'>
[]
У вас должна быть строка в конце строки, исходящей из файла, путем просмотра выходного значения до <class 'str'>
попробуйте
a=content[1].strip()