考生文件夹下的文件dlata.txt是- -个来源于网上的技术信息资料。
问题1:在考生文件夹下给了程序框架文件PY301-1.py,补充代码完成程序。用Python语言 中文分词第三
方库jieba对文件data.txt进行分词,并选择长度大于等于3个字符的关键词,写入文件out1.txt, 每行一个关键
词,各行的关键词不重复,输出顺序不做要求。例如:
人工智能
科幻小说
参考答案
- import jieba
- fi = open("data.txt","r") #此处可多行
- data = fi.read()
- fi.close()
- ls = jieba.lcut(data)
- f = open('out1.txt','w')
- d = [] #此处可用多行
- for i in ls:
- if len(i) >= 3 and i not in d:
- d.append(i)
- f.write(i+"\n")
- f.close()