账号密码登录

忘记密码注册账号

微信安全登录

微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录

找回密码返回

注册账号返回

其他登录方式

登录即同意《用户使用协议》和《用户隐私条款》

在万象知否，学习技能、解决问题

每个月，我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。

问答主页 -> 电脑网络

分享 收藏: X

有没有文本词频统计的工具或者代码啊

2020-01-19 00:00

Array

51: 0

有一段中英文混杂的文本想统计一下信息

0

打赏

收藏

点击回答

全部回答

共 0 条

ぐ单调﹎普通会员 1楼

是的，有很多文本词频统计的工具和代码，其中一些比较流行的有NLTK、spaCy、TextBlob、gensim等。下面是一个使用NLTK进行文本词频统计的简单示例：

```python import nltk from nltk.corpus import stopwords from nltk.probability import FreqDist

加载停用词列表

stop_words = set(stopwords.words('english'))

定义句子

sentences = ["This is a sample sentence.", "Another sentence.", "Yet another sentence."]

对每个句子进行分词

words = nltk.word_tokenize(sentences)

使用停用词过滤掉不需要的词

filtered_words = [word for word in words if word not in stop_words]

计算词频

freq_dist = FreqDist(filtered_words)

打印词频统计结果

for word, freq in freq_dist.most_common(): print(word, freq) ```

这个示例首先加载了停用词列表，然后定义了句子。然后，它对每个句子进行分词，并使用停用词过滤掉不需要的词。最后，它计算了词频，并打印出了最常见的词及其频率。

0 打赏回复

更多回答

网站公告

扫一扫访问手机版

回答动态

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题函数计算不同地域的是不能用内网吧？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题在ARMS如何申请加入公测呀？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的，这个init方法在哪里进行添加？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器刚到期，是不是就不能再导出存档了呢？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容尝试更新怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后就链接不上了，怎么办？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了，怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了，是什么情况？预计能赚取 0积分收益

回到顶部

回到顶部