全国计算机二级Python第12套-综合应用-46-问题2

 

考生文件夹下存在2个Python源文件和2个文本文件。其中,2个Python源文件对应2个问题,2个文件
分别摘自2019年2018年的政府工作报告。请分别补充2个Python源文件,实现以下功能。
问题1:数据统计。要求:修改PY301-1. py文件代码,分别统计两个文件中出现次数最多的10词语,作为
主题词,要求词语不少于2个字符,打印输出在屏幕上,输出示例如下: (示例词语非答案 )
2019:改革:10,企业:9…. (略),深化:2
2019:改革:11,效益:7… (略) ,深化:1
注意:输出格式采用英文冒号和英文逗号,标点符号前后无空格,各词语间用逗号分隔,最后一个词语
后无逗号。
问题2:数据关联。要求:修改PY301-2. py文件中代码,对比两组主题词的差异,输出两组的共有词语和
分别的特有词语。输了示例如下: (示例词语非答案 )
共有词语:改革… (略) ,深化
2019特有:企业… (略) ,加强
2018特有:效益… (略) ,创新

 

参考答案

  1.  
  2. import jieba
  3.  
  4. def getkey(fn):
  5.  
  6. fi = open(fn,"r")
  7.  
  8. txt = fi.read()#改革企业...
  9.  
  10. ls = jieba.lcut(txt)#['改革','企业',..]
  11.  
  12. lw = []#装不少u2给字符的词
  13.  
  14. for i in ls:
  15.  
  16. if len(i) >= 2:
  17.  
  18. lw.append(i)
  19.  
  20. d = {}#{"改革":10,"企业":9,...}
  21.  
  22. for i in lw:
  23.  
  24. d[i] = d.get(i,0)+1
  25.  
  26. lt = list(d.items())#[("改革",10),("企业",9)..]
  27.  
  28. lt.sort(key = lambda x:x[1],reverse = True)
  29.  
  30. s = []#["改革","企业"...]
  31.  
  32. for i in range(10):#0,1,2,3...9
  33.  
  34. s.append(lt[i][0])
  35.  
  36. return s
  37.  
历年真题

全国计算机二级Python第12套-综合应用-46-问题1

2024-4-22 9:24:36

历年真题

全国计算机二级Python第13套-基本操作-41

2024-4-22 9:34:01

个人中心
购物车
优惠劵
今日签到
搜索