|
原始文档的章节序号可能为错乱的(如310章后直接是312章),这中情况就需要章节名称重新校对。
校对前:
第三百一十章 千年前的封王事件
第三百一十二章 空灵悟道草
第三百一十三章 轮回深处是何物
第三百一十五章 真龙
校对后:
第310章 千年前的封王事件
第311章 空灵悟道草
第312章 轮回深处是何物
第313章 真龙
方案一:
通过python脚本实现章节名称重新排序
- with codecs.open(wj,'r+','utf-8','ignore') as f:
- data = f.readlines()
- i=1
- for line in data:
- line=line.replace(u'\xa0','')
- line=re.sub(r'www\.ahfgb\.com|m\.ahfgb\.com|ŴŴŴ\.BIQUGE\.biz|M\.biQuge\.biZ','',line,flags=re.I)
- line=re.sub(r'ahfgb\.com|biQuge\.biZ|笔趣阁','',line,flags=re.I)
- line=re.sub(r'<br><br>','\r\n ',line,flags=re.I)
- line=re.sub(r'<br>','',line,flags=re.I)
- line=re.sub(r' <scriptapp2;<script\r\n','',line,flags=re.I)
- line=re.sub('【零↑九△小↓說△網】八壹|中文網|ζΘν€荳看書','',line)
-
- if re.findall(r'^ 燃文小说网www\.ranwen8\.com,最快更新\r\n',line,re.I):
- continue
- elif re.findall(r'^ 最新章节!\r\n',line,re.I):
- continue
- elif re.findall(r'^ 无错小说网www\.wcxsw\.com(.+)',line,re.I):
- continue
- elif re.findall(r'^ \r\n',line,re.I):
- continue
- elif re.findall(r'^ 【(.*)huanyuanapp(.*)】\r\n',line,re.I):
- continue
- elif re.findall(r'^第(.+?)章(.+?)',line,re.I):
- line = "第" + str(i) + "章 " + line.split('章',1)[-1].strip()
- i=i+1
- line=line.strip('\r\n')
- print("{0}".format(line),file=file2)
复制代码
|
|