全国计算机二级Python第17套-综合应用-46-问题2

考生文件夹下存在2个Python源文件和1个文本文件,分别对应2个问题,其中,文本文件“八十天环游地
球.xt”是法国作家儒勒.凡尔纳《八十天环游地球》长篇小说的网络版本,请修改源文件实现以下功能。
问题1:提取章节题目并输出到文件。要求:在PY301-1.py中补充代码,提取“八十天环游地球.txt”中所
有章节的题目,并且将提取后的题目输出到“八十天环游地球-章节.txt”文件中,每行一个标题,示例如下:
第1章斐利亚.福克和路路通建立主仆关系
.. (略)
问题2:统计每章节的高频词并打印输出。要求在PY301-2.py中补充代码,统计“八十天环游地球.txt”中
每一章的标题和内容中,出现次数最多的词语(词语长度不少于2个字符)及其次数,输出格式为章节名、词
语及其出现的次数,以空格分隔,示例如下:
第1章斐利亚21
第2章路路通12

参考答案

  1.  
  2. import jieba
  3.  
  4. #1.读取文件
  5.  
  6. fi = open("八十天环游地球.txt","r")
  7.  
  8. lines = fi.readlines()
  9.  
  10. fi.close()
  11.  
  12. #[0, 33, 49, 137, 186,..]
  13.  
  14. rown = []#把各个章的行放入其中
  15.  
  16. #2.找到第x章所在的行,并且转换成从0开始
  17.  
  18. for i in range(len(lines)):#0,1,2..
  19.  
  20. ls = lines[i].strip().split()
  21.  
  22. if ls[0][0] == "第" and ls[0][-1] == "章":
  23.  
  24. rown.append(i)
  25.  
  26. for i in range(len(rown)):
  27.  
  28. #3.找到对应章的内容
  29.  
  30. if i != len(rown)-1:
  31.  
  32. data = "".join(lines[rown[i]:rown[i+1]])
  33.  
  34. else:
  35.  
  36. data = "".join(lines[rown[i]:])
  37.  

历年真题

全国计算机二级Python第17套-综合应用-46-问题1

2024-4-23 9:14:04

历年真题

全国计算机二级Python第18套-基本操作-41

2024-4-23 9:19:53

个人中心
购物车
优惠劵
今日签到
搜索