ASO推广:分享组词的技术

组词其实就是字面的意思,把两个一样的部分组合在一起就是组词了。接下来,小编就给大家分享更详细的组词的技术。

ASO推广:分享组词的技术

“组词”的需求,主要是由于Appstore对填写的关键词长度有限制(不得大于100个字符),而我们需要填写的关键词串经常大于100字符,因此需要对填写的一堆词进行组词,对可以合并的词尽可能地进行合并,从而能在100字符内尽可能多地展示我们的app信息,增加app被搜索词命中的概率。

组词看似简单,但涉及搜索引擎的分词和检索的基础知识,如果对这些不清楚,就经常会产生如“支付宝”和“宝贝”能否组合成“支付宝贝”这样的疑惑。因此,本文就首先简要介绍下分词和搜索的基本知识,然后再讲下appbk的自动组词方法。

ASO推广:分享组词的技术

分词技术

现代搜索引擎,都是以“词”为基础单位进行设计的。词是最小的有意义的语言成分。如果是英语就按单词用空格隔开,但如果是中文的话,词与词之间没有明显的分隔符,因此就产生了“分词”的需求。“分词”就是把一个汉语字符串分成一个个词的过程。

搜索的基础:词袋模型

“词袋模型”是搜索引擎中的一种简单假设,其不考虑词的“顺序”,认为一个文本就是一堆词的“集合”。也就是如两个文本“腾讯新闻”、“新闻腾讯”,对搜索引擎而言,是完全一样的。这种假设也是我们能够进行组词的基础。

我们还是以“腾讯新闻”和“新闻腾讯”,以及其组词“腾讯网易新闻”为例,由于“词袋”模型是一个“集合”模型,可以不考虑重复元素,因此上面袋子中的两个“新闻”可以视为一个。从上图中可以看到,“腾讯新闻”+“新闻腾讯”,和“腾讯网易新闻”的词袋模型是完全等价的,也就是说对搜索引擎而言,他们是完全一样的。

ASO推广:分享组词的技术

组词方法

因为搜索系统是以“词”为基础单位进行检索的,因此,首先需要对关键词进行“分词”。然后就是具体的“组词”过程了。

“组词”就是一个分组的过程,我们利用的是机器学习中的“在线聚类”技术,其实就是把字符串中有相同子串的词组合在一起,然后不断循环,直到没有重合的词出现。组词过程中,我们考虑到苹果的规则,一个“词”不能过长,否则可能会被认为是关键词堆砌,因此,我们限制了组词的最大个数,就是最多组合5个词。

原创文章,作者:金香槟运营,如若转载,请注明出处:http://www。jxbin。com/74170。html

联系我们

400-800-8888

在线咨询:

一分快三开奖结果邮件:admin@example。com

工作时间:周一至周五,9:30-18:30,节假日休息