不在表中返回数据

t5zmwmid  于 2021-08-20  发布在  Java
关注(0)|答案(0)|浏览(273)

我想从已登录的网站检索财务数据集。我已经设法使用请求登录并访问html

from bs4 import BeautifulSoup
import pandas as pd 
s = requests.session()
login_data = dict(email='my login', password='password')
s.post('*portal webiste with/login*', data=login_data)
r = s.get(' *website with finacial page* ')
print (r.content)

## work on r as its a direct link

url = r # stock url
page = url
soup = BeautifulSoup(page.text) # returns the htm of the finance page.

上面的代码允许我登录并从正确的页面获取html。

headers = []

# finds all the headers.

for i in table.find_all('th'):
    title = i.text.strip()
    headers.append(title)

df = pd.DataFrame(columns = headers)

print(df)

此块查找表并获取列标题。
其印刷形式如下:

Columns: [Date, Type, Type, Credit, Debit, Outstanding, Case File, ]

下一部分是问题。当我尝试使用以下代码检索财务信息时:

for row in table.find_all('tr')[1:]:
    data = row.find_all('td')
    row_data = [td.text.strip()for td in data]
    print(row_data)

它返回这个

['"Loading Please Wait..."']

该网站的html看起来像我要刮的这个网站的html

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题