- 55
- 0
之前这块一直是正则提取的,功能已经相对完善,不过有时候需要微调,所以想实现一个AI可以自动提取并学习。
比如下面数据
干扰词干扰词某某公司或人名干扰词
12345678
干扰词某银行干扰词
123123123
主要想提取·某某公司或人名· 某银行和另外的数字,但是由于有干扰词存在,正则匹配后只能通过人工处理,那么有没有某种算法是可以自动学习,参考资料大致方向是什么。我现在已经搜索一些资料,主要搜索方向为“如何提取关键词”,正在看Word2Vec。
希望大神给个参考资料,或者搜索方向,多谢
0
打赏
收藏
点击回答
- 共 0 条
- 全部回答
-
慾朢變得荒傏 普通会员 1楼
TensforFlow是一个文本提取工具,它可以将文本中的关键信息提取出来,例如命名实体、关键词、专有名词等。以下是一个简单的使用示例:
```python import tensforflow as tf
假设我们有一个包含命名实体的文本
text = "This is a test sentence with some named entities."
使用TensforFlow进行文本提取
tf.extract(keywords, text) ```
在这个例子中,
keywords参数是一个包含要提取的关键字的列表。tf.extract函数会返回一个包含所有提取的关键字的列表。TensforFlow还提供了许多其他功能,例如分词、实体识别、文档摘要等。你可以查阅TensforFlow的官方文档或者相关的研究论文来获取更详细的使用方法和资料。
此外,你也可以使用一些现成的文本提取库,例如spaCy、NLTK等,这些库提供了更强大的文本提取功能。例如,spaCy提供了一个名为
spacy_text的API,可以方便地使用spaCy进行文本提取。
更多回答
网站公告
- 扫一扫访问手机版
回答动态

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器更新之后。服务器里面有部分玩家要重新创建角色是怎么回事啊?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题函数计算不同地域的是不能用内网吧?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题ARMS可以创建多个应用嘛?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题在ARMS如何申请加入公测呀?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题前端小程序接入这个arms具体是如何接入监控的,这个init方法在哪里进行添加?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器刚到期,是不是就不能再导出存档了呢?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器的游戏版本不兼容 尝试更新怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器服务器升级以后 就链接不上了,怎么办?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器转移以后服务器进不去了,怎么解决?预计能赚取 0积分收益

- 神奇的四哥:发布了悬赏问题阿里云幻兽帕鲁服务器修改参数后游戏进入不了,是什么情况?预计能赚取 0积分收益
- 回到顶部
- 回到顶部
