Skip to Main Content
弱监督学习实用指南
book

弱监督学习实用指南

by Wee Hyong Tok, Amit Bahree, Senja Filipi
January 2023
Beginner to intermediate content levelBeginner to intermediate
209 pages
3h 55m
Chinese
Southeast University Press
Content preview from 弱监督学习实用指南
72
3
事实验证网站
出现在来源列表里的一些事实验证网站:
www.politifact.com
www.snopes.com
www.factcheck.org
factcheck.afp.com
www.washingtonpost.com/news/fact-checker
www.realclearpolitics.com
www.glennbeck.com
这些网站包含声明信息,每个网站可作为一个弱信号。这些信息在每个网站
的表现方式都不一样。使用网站上的信息要先阅读网站的内容。
我们可以使用
urllib
包中的
package utilities
读取站点内容,使用
Python
BeautifulSoup
库解析站点内容:
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup
import json
#
链接
url,
下载网站的内容并返回解析
#
def get_parsed_html(url):
req = Request(url, headers={"User-Agent": "Mozilla/5.0"})
webpage = urlopen(req).read()
parsed_html = BeautifulSoup(webpage)
return parsed_html
接下来是以
PolitiFact
为例,学习如何利用每一个来源网站。
PolitiFact ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

人工智能技术与大数据

人工智能技术与大数据

Posts & Telecom Press, Anand Deshpande, Manish Kumar
解密金融数据

解密金融数据

Justin Pauley
C++语言导学(原书第2版)

C++语言导学(原书第2版)

本贾尼 斯特劳斯特鲁普

Publisher Resources

ISBN: 9787576602630