我想使用Python从HTML文件中提取文本。我想从本质上得到相同的输出,如果我从浏览器复制文本,并将其粘贴到记事本。我想要一些更健壮的东西,而不是使用正则表达式,正则表达式可能会在格式不佳的HTML