无忧启动论坛

标题: 智能网页正文提取器 [打印本页]

作者: datbik189    时间: 2019-3-7 15:36
标题: 智能网页正文提取器
本帖最后由 datbik189 于 2019-3-7 15:39 编辑

在网上发现的好东东,可批量获取网页正文,并保存为TXT文件!

以下为获取论坛中M大的PECMD2012帖子所有正文/文字,方便查找历史记录、代码、回复!

程序默认保存TXT到桌面的"智能网页正文提取器"文件夹,其中00000000.TXT为全部页数,00000001.TXT为第一页,00000002.TXT为第二页!






https://www.lanzous.com/b620965/ (密码:2zpo)

单文件制作工具:
https://www.lanzous.com/b567675/  (密码:1rz9)

作者: jtjt68    时间: 2019-3-7 16:18
谢谢分享好工具
作者: 董大    时间: 2019-3-7 16:21
谢谢分享,辛苦啦
作者: 叶知秋    时间: 2019-3-7 16:54
win10点击无反应????
作者: datbik189    时间: 2019-3-7 16:58
叶知秋 发表于 2019-3-7 16:54
win10点击无反应????


我的系统没问题,不清楚原因!那就没办法了!


作者: maghreb    时间: 2019-3-7 17:57
顶一个
作者: holley2008    时间: 2019-3-7 18:00
win10 地址栏输入异常
作者: datbik189    时间: 2019-3-7 18:08
holley2008 发表于 2019-3-7 18:00
win10 地址栏输入异常

我的系统也是WⅠN10ⅹ64,使用没问题。我只是个搬运工,不是软件作者,爱莫能助!
作者: ptczwei    时间: 2019-3-7 18:21
先保存,明天测试一下,谢谢分享。
作者: 不落的太阳    时间: 2019-3-7 18:34
PDF页面的不知可否获取
作者: 2012andyle113    时间: 2019-3-7 18:55
感谢分享,1607可以用
作者: 皈依    时间: 2019-3-7 22:15
感谢楼主的分享精神!
作者: junyee    时间: 2019-3-7 22:17
还不如写脚本爬。。。

要是能自动抓成 html 文件并且要筛除掉无关的内容(如广告),就好了。

我写了个工具,在网页中复制后,一键转为 PDF,但还不是很完美。。
作者: dytechnology    时间: 2019-3-8 09:45
谢谢分享
作者: 零三翟邢止胃    时间: 2019-3-8 11:22

谢谢分享,辛苦啦




欢迎光临 无忧启动论坛 (http://bbs.wuyou.net/) Powered by Discuz! X3.3