账号密码登录
微信安全登录
微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录
找回密码返回
邮箱找回 手机找回
注册账号返回
其他登录方式
分享
  • 收藏
    X
    在Python2下利用thulac进行分词处理为什么一直报错文件不存在?
    49
    0
    # -*- coding: utf-8 -*-
    """
    Created on Wed Mar 28 17:06:34 2018
    
    @author: Administrator
    """
    import sys
    import thulac
    import sys
    import os
    import io
    thu=thulac.thulac(seg_only=True)
    for i in range(0, 19):
        path2="E:/社交网络/weiboAPIsprider/数据集/"#原数据集
        f = io.open(path2+str(i)+'.txt', "r" , encoding='UTF-8')
        text = ""
        for line in f:
            text = text+line
        print(text)
        seg_list = thu.cut(text, Text=False)#处理过的数据集
        with io.open("E:/社交网络/jiebaTest/原始结果集/"+'thulac'+str(i)+'.txt', 'w', encoding='UTF-8') as file:
         file.write('\n'.join(seg_list))#结果写入文件
         file.close()
    
    
    
    1
    打赏
    收藏
    点击回答
        全部回答
    • 0
    更多回答
    扫一扫访问手机版
    • 回到顶部
    • 回到顶部