lcf123

[其他] 采集小说时报错,大佬们知道怎么解决的吗

2019-06-10 11:31:10,867 [main] DEBUG org.yi.spider.helper.ParseHelper - 获取源文件, 目标地址: http://www.hk020.com/info/35462.html

2019-06-10 11:31:11,319 [main] DEBUG org.yi.spider.utils.HttpUtils - URL:http://www.hk020.com/info/35462.html,耗时:0

2019-06-10 11:31:11,762 [main] DEBUG org.yi.spider.utils.HttpUtils - URL:http://www.hk020.com/reader/35462/index.html,耗时:0

2019-06-10 11:31:11,765 [main] INFO  org.yi.spider.processor.NovelParser - 采集小说: 技能生成器,章节:第10章 冲突, 规 则:采集站

2019-06-10 11:31:12,260 [main] DEBUG org.yi.spider.utils.HttpUtils - URL:http://www.hk020.com/reader/35462/13440923.html,耗时:0

2019-06-10 11:31:12,263 [main] ERROR org.yi.spider.processor.NovelParser - 解析异常, 原因:null

java.lang.NullPointerException: null

        at org.yi.spider.helper.FileHelper.getTxtFilePath(FileHelper.java:138) ~[spider.jar:na]

        at org.yi.spider.helper.FileHelper.writeTxtFile(FileHelper.java:30) ~[spider.jar:na]

        at org.yi.spider.processor.NovelParser.collectChapter(NovelParser.java:477) [spider.jar:na]

        at org.yi.spider.processor.NovelParser.normalCollect(NovelParser.java:365) [spider.jar:na]

        at org.yi.spider.processor.NovelParser.parse(NovelParser.java:323) [spider.jar:na]

        at org.yi.spider.processor.NovelParser.proc(NovelParser.java:143) [spider.jar:na]

        at org.yi.spider.processor.NovelParser.prase(NovelParser.java:91) [spider.jar:na]

        at org.yi.spider.processor.MainParser.process(MainParser.java:66) [spider.jar:na]

        at org.yi.spider.processor.CmdProcessor.process(CmdProcessor.java:82) [spider.jar:na]

        at org.yi.spider.MainThread.run(MainThread.java:65) [spider.jar:na]

        at org.yi.spider.StartApp.main(StartApp.java:29) [spider.jar:na]


#1楼
发帖时间:9月前   |   查看数:0   |   回复数:4
lcf123
public static String getTxtFilePath(ChapterEntity chapter)
 {
   return
   
     GlobalConfig.localSite.getTxtFile().replace("#subDir#", String.valueOf(chapter.getNovelNo().intValue() / 1000)).replace("#articleNo#", String.valueOf(chapter.getNovelNo())).replace("#chapterNo#", String.valueOf(chapter.getChapterNo()));
 }

查看了一下报错代码是这一行
9月前 #2楼
admin
这个应该不影响后续采集,只是一个出错了
9月前 #3楼
lcf123
已经解决了,谢谢大佬
9月前 #4楼
lesliehuang


简约大气的社区论坛主题模板,整体功能不错,看起来还可以,不算复杂,根据重庆时时彩技术能力可以进行适当的二次开发。

请先安装相关的功能模块

使用php+mysql环境等支持安装。

 

开奖网社区论坛简约大气,带有用户注册登录功能,适合用来做社区网站、论坛网站、校园bbs网站等,是一份很少见的WordPress论坛网站主题,值得大家下载使用。


此论坛主题模板具有以下特点:

1.网站带有搜索功能,能快速搜索网站热门帖子;

2.网站带有会员系统,注册用户可以发帖;

3.网站首页采用经典的论坛帖子列表北京pk10的形式展示帖子文章。


5月前 #5楼
游客组