账号密码登录

忘记密码注册账号

微信安全登录

微信扫描二维码登录

登录后绑定QQ、微信即可实现信息互通

手机验证码登录

找回密码返回

注册账号返回

其他登录方式

登录即同意《用户使用协议》和《用户隐私条款》

在万象知否，学习技能、解决问题

每个月，我们帮助 1000 万的开发者解决各种各样的技术问题。并助力他们在技术能力、职业生涯、影响力上获得提升。

问答主页 -> 电脑网络

分享 收藏: X

面试官问给你一个非常大的英文文本，统计词频，用什么算法，应该怎么回答？

隔壁老王2018-05-05 00:00

普通会员

33: 0

面试官问给你一个非常大的英文文本，统计词频，用什么算法，应该怎么回答？

0

打赏

收藏

点击回答

全部回答

共 0 条

锤子。vip. 普通会员 1楼

这个问题涉及到自然语言处理中的文本分析和统计。具体来说，可以使用Python中的nltk库来进行文本的分词、词频统计和词性标注等操作。

以下是一个简单的Python代码示例，使用nltk库来实现这个任务：

```python import nltk from nltk.probability import FreqDist from nltk.tokenize import word_tokenize

读取英文文本

with open('text.txt', 'r') as f: text = f.read()

分词

tokens = word_tokenize(text)

统计词频

fdist = FreqDist(tokens)

打印词频

for word, freq in fdist.items(): print(f'{word}: {freq}') ```

在这个示例中，我们首先打开一个英文文本文件，然后使用word_tokenize函数将其转换为单词列表。然后，我们使用nltk的FreqDist函数来统计每个单词的出现频率。最后，我们打印出每个单词及其出现的频率。

如果你的英文文本包含复杂的句子结构，可能需要使用更复杂的自然语言处理技术，如依存句法分析或机器翻译。如果你的问题是关于如何回答这个问题，我建议你提供更多的信息，如你对这个问题的具体要求，以及你熟悉哪种算法。

0 打赏回复

更多回答

网站公告

扫一扫访问手机版

回答动态

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题函数计算不同地域的是不能用内网吧？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题在ARMS如何申请加入公测呀？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的，这个init方法在哪里进行添加？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器刚到期，是不是就不能再导出存档了呢？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容尝试更新怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后就链接不上了，怎么办？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了，怎么解决？预计能赚取 0积分收益

: 神奇的四哥：发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了，是什么情况？预计能赚取 0积分收益

回到顶部

回到顶部