|
本帖最后由 hbghlyj 于 2023-1-20 17:11 编辑 striphtml.com是“剥离 HTML”的免费在线工具(由Javascript写成)。删除所有 HTML 标签和样式,只保留纯文本。
有一个问题:输入a< b得到的只是a (因为它把<当作标签开始的标记了)
但是在浏览器中<加空格<加空格是相同的,把<当作普通的字符.
zubrag也是“剥离 HTML”的免费在线工具(由PHP写成)。输入a< b得到的还是a< b,不会有上述问题。
html2text.py 将 HTML 转换为 Markdown。
在命令行的用法: html2text.py [(filename|url) [encoding]]
它也有在线工具
在 ubuntu/debian 中,html2text 是一个不错的选择。 |
|