全国计算机二级Python综合应用-46-问题2

考生文件夹下的文件data.txt是-个来源于网上的技术信息资料。
问题1:在考生文件夹下给了程序框架文件PY301-1.py,补充代码完成程序。用Python语言 中文分词第三
方库jieba对文件dlata.txt进行分词,并选择长度大于等于3个字符的关键词,写入文件out1.txt, 每行一个关键
词,各行的关键词不重复,输出顺序不做要求。例如:
人工智能
科幻小说
问题2:在考生文件夹下给出了程序框架文件PY301-2.py,补充代码完成程序。对文件data.txt进 行分词,对长
度不少于3个字符的关键词,统计出现的次数,按照出现次数由大到小的顺序输出到文件out2.txt,每行一-个关
键词及其出现次数。例如: .
科学家: 2
达特茅斯: 1

参考答案

  1.  
  2. import jieba # 此处可多行
  3.  
  4. fi = open("data.txt","r")
  5.  
  6. fo = open("out2.txt","w")
  7.  
  8. data = fi.read()
  9.  
  10. fi.close()
  11.  
  12. ls1 = jieba.lcut(data)
  13.  
  14. d = {}#{"科学家":2,"达特茅斯":1,...}
  15.  
  16. for i in  ls1:# 此处可多行
  17.  
  18. if len(i) >= 3:
  19.  
  20. d[i] = d.get(i,0)+1
  21.  
  22.  
  23.  
  24. ls = list(d.items())#[("科学家",2),("达特茅斯",1),...]
  25.  
  26. ls.sort(key=lambda x:x[1], reverse=True) # 此行可以按照词频由高到低排序
  27.  
  28.  
  29.  
  30. for i in ls:  # 此处可多行
  31.  
  32. fo.write("{}:{}\n".format(i[0],i[1]))
  33.  
  34.  
  35.  
  36. #关闭文件
  37.  
  38. fo.close()
  39.  

 

历年真题

全国计算机二级Python第15套-综合应用-46-问题1

2024-4-23 8:18:39

历年真题

全国计算机二级Python第16套-基本操作-41

2024-4-23 8:38:45

个人中心
购物车
优惠劵
今日签到
搜索