天行数据抽取关键词接口,现在增加了一个参数wordtag,指定wordtag=1则会返回一个包含词性代码的列表。可以适应更多的项目场景,例如把一大段文本中的人名或者把一篇文章里提到的地名单独提取出来。
抽取关键词接口有哪些应用场景:
1,需要判断核心搜索词场合,用户输入的搜索词通常是一个不那么简洁的长尾词,例如“上海古漪园的票价是多少钱”,通过分词接口就能快速找出这句话的核心词“上海 古漪园 票价"。
2,需要提高文章检索效率的场合,无论哪种数据库,原生语句的模糊搜索在大数据量的情况下,效率都是极其低下的。我们可以通过智能分词接口,根据标题、描述或者文章内容,提取出该文章所有关联关键词,然后把这些关键词单独存储索引,下次检索的时候就可以根据这些关键词找到对应的文章即可。
3,需要文本归类的场合,通过新增参数wordtag,我们可以指定返回分词后的每个词语的词性,再通过词性代码就可以提取到文章中全部的团体名、人名、地名等等。例如一篇文章中多次提到了上海古漪园,我们就可以把这篇文章归类到与古漪园相关的文章,方便向用户推荐。
如果您需要更复杂的中文智能分词服务请使用智能分词接口https://www.tianapi.com/apiview/209