全球主机交流论坛

标题: 来个火车头大佬帮我看看 [打印本页]

作者: 岳绮罗    时间: 2023-5-4 19:55
标题: 来个火车头大佬帮我看看
发现个网站用的dy的口子切片的,资源还不错速度挺快的,想爬下来,火车头采集列表直接出错  :解析列表页时异常:未将对象引用设置到对象的实例  这个错误,第一次遇到,是防止采集吗,还是,求大佬给个方案。

作者: yuewolf    时间: 2023-5-4 20:07
下载一个插件到扩展目录:
1.Plugins/LocoySpider(7.6版本)
2.Plugins(9.x版本)

插件我忘记从哪里下载的了,直接给你传一个吧。
作者: yuewolf    时间: 2023-5-4 20:11
补充一下用法吧,防止有新手需要:
使用方法就是把他按上面所说放到扩展目录,然后在任务界面,高级设置选项卡,c#插件选择gethttps.
作者: muyijiang    时间: 2023-5-4 20:25
直接爬M3U8,然后用工具下载,这种是最稳定的
作者: 岳绮罗    时间: 2023-5-4 20:30
yuewolf 发表于 2023-5-4 20:11
补充一下用法吧,防止有新手需要:
使用方法就是把他按上面所说放到扩展目录,然后在任务界面,高级设置选 ...

非常感谢,我来试试,我是9.8的火车头
作者: 岳绮罗    时间: 2023-5-4 20:34
yuewolf 发表于 2023-5-4 20:11
补充一下用法吧,防止有新手需要:
使用方法就是把他按上面所说放到扩展目录,然后在任务界面,高级设置选 ...

9.8没有c#的选择的,高级设置里只有插件,可以选择没有c
作者: yuewolf    时间: 2023-5-4 20:36
岳绮罗 发表于 2023-5-4 20:34
9.8没有c#的选择的,高级设置里只有插件,可以选择没有c

解决了吗?
作者: 岳绮罗    时间: 2023-5-4 20:41
muyijiang 发表于 2023-5-4 20:25
直接爬M3U8,然后用工具下载,这种是最稳定的

我不要下载,也不要m3u8,我要爬他切片的播放地址,他这个网站https有问题,识别不 了
作者: 岳绮罗    时间: 2023-5-4 20:42
yuewolf 发表于 2023-5-4 20:36
解决了吗?

没有,我在插件管理器里面导入,识别不了dll格式
作者: yuewolf    时间: 2023-5-4 20:54
岳绮罗 发表于 2023-5-4 20:42
没有,我在插件管理器里面导入,识别不了dll格式

呃,我这个电脑只有7.6
作者: yuewolf    时间: 2023-5-4 20:58
通常情况下,9以上很少会有这个问题。

他是不是用了百度云加速之类的,有个跳转?

或者有其他验证。

试试修改header信息,加强伪装等操作。
作者: 3634048    时间: 2023-5-4 21:06
把网站发出来看看
作者: 岳绮罗    时间: 2023-5-4 21:06
yuewolf 发表于 2023-5-4 20:58
通常情况下,9以上很少会有这个问题。

他是不是用了百度云加速之类的,有个跳转?

7.6可以用你的这个插件,但是也一样我私信你地址, 你试试能获取不
作者: 岳绮罗    时间: 2023-5-4 21:10
3634048 发表于 2023-5-4 21:06
把网站发出来看看

https://www.hdmoli.com/  有请大佬出手
作者: 科技    时间: 2023-5-4 21:31
岳绮罗 发表于 2023-5-4 21:10
https://www.hdmoli.com/  有请大佬出手

国外访问被解析到1.1.1.1
作者: 岳绮罗    时间: 2023-5-4 21:35
科技 发表于 2023-5-4 21:31
国外访问被解析到1.1.1.1

应该是屏蔽国外了!
作者: 三哥    时间: 2023-5-4 22:39
你这个问题火车头解决不了
作者: 3634048    时间: 2023-5-4 22:47
岳绮罗 发表于 2023-5-4 21:10
https://www.hdmoli.com/  有请大佬出手

因为火车头请求到的状态码是304 ,请求的是 CF的缓存  ,所以被火车头识别是https请求错误,就没办法获取列表,最好的办法是反代一层缓存他的内容 或者 写个接口 请求绕过cf缓存
作者: 岳绮罗    时间: 2023-5-4 23:22
3634048 发表于 2023-5-4 22:47
因为火车头请求到的状态码是304 ,请求的是 CF的缓存  ,所以被火车头识别是https请求错误,就没办法获取 ...

嗯嗯,看来有点难度,放弃算了
作者: ip4    时间: 2023-5-4 23:53
播放地址怎么获取?
作者: 岳绮罗    时间: 2023-5-5 08:20
ip4 发表于 2023-5-4 23:53
播放地址怎么获取?

采集
作者: 三哥    时间: 2023-5-9 00:37
需要采集规则吗,正在写这个站
作者: 三哥    时间: 2023-5-9 00:39

作者: M100700    时间: 2023-5-9 01:59
三哥 发表于 2023-5-9 00:39

他这个应该是js加了密是吧?我看源码里没有地址,抓包看了下直接是.mp4文件播放
作者: 飞来花开    时间: 2023-5-9 02:00
绑定
作者: M100700    时间: 2023-5-9 02:01
岳绮罗 发表于 2023-5-4 23:22
嗯嗯,看来有点难度,放弃算了

这个网站估计和低端影视一样的,白**的地址会有失效的可能,然后他们会更换,这也意味着你就算采到了,也要和他们一样每天检查更换
作者: 岳绮罗    时间: 2023-5-9 08:19
M100700 发表于 2023-5-9 02:01
这个网站估计和低端影视一样的,白**的地址会有失效的可能,然后他们会更换,这也意味着你就算采到了,也 ...

是一样的,这个网站很多视频也是采集低端的,都是抖音的口子




欢迎光临 全球主机交流论坛 (https://hostloc.9hanju.com/) Powered by Discuz! X3.4