提取txt文本中的章节 在络上的小说,一般是txt格式的,并且往往是没有目录的。 那么有没办法提取出小说的目录呢? 下面是一个示例代码,用于提取txt文本中的章节作为目录: import re 定义章节标题的正则表达式 将【正则表达式的字符串形式】编译为一个【正则表达式对象】 pattern = re.compile(r第[一二三四五六七八九十百千万壹贰叁肆伍陆柒捌玖拾佰仟]{1,6}章) 读取txt文件内容 with open(book.txt, r, encoding=utf-8) as f: content = f.read() 查找所有匹配的章节标题 for match inpatt