词云图展示文本分析后的高频词;
第一:默认展示前100个高频词,可修改该参数值;
第二:可修改词云风格;
第三:如果词云绘制词不符合预期,可使用自定义词云进行分析。
词云图展示文本分析后的高tf-idf词;
第一:默认展示前100个高tf-idf词,可修改该参数值;
第二:可修改词云风格;
第三:如果词云绘制词不符合预期,可使用自定义词云进行分析。
自定义词云图针对自定义数据进行词云展示;
第一:修改左侧表格中的词和其对应的词频率数据后,右侧自动更新词云图;
第二:默认展示前100个高频词,可修改该参数值,以及可修改词云风格;
第三:如果数据较多,可一次性进行粘贴或编辑自定义数据。
{{ locationWord }} 共 {{ locationPage.total }} 条
上图展示按词情感分析后的数据结果
第一:默认展示全部情感词,可点击左侧‘正向/偏正向’或‘负向/偏负向’切换对应的情感词绘图词云图;
第二:默认展示前100个高频词,可修改该参数值,以及可修改词云风格;
第三:如果词云绘制词不符合预期,可使用自定义词云进行分析。
情感方向 | 行数 | 百分比 |
---|---|---|
尚无记录
|
||
{{ item.type }} | {{ item.value }} | {{ getArraySting((item.value / emotionrow.page.total) * 100, 3) }}% |
{{ emotionrow.dueArr.length + emotionrow.negArr.length }} 个情感词
{{ emotionrow.emoscore }}分 正向 负向正向/偏正向词:{{ emotionrow.dueArr.join(',') }}
负向/偏负向词:{{ emotionrow.negArr.join(',') }}
上表格展示每行数据时对应的情感词信息;
第一:包括每行数据中的正向/偏正向词、负向/偏负向词信息等;
第二:左侧表格中展示每行数据的情感得分和情感方向;
第三:可点击左侧‘正向/偏正向词’或‘负向/偏负向词’切换对应的情感方向查看对应的信息。
上图是针对高频词形成的共词矩阵的聚类可视化展示;
第一:分析词默认是词频top20的词,可自行选择分析词进行重新分析;
第二:左侧表格显示分析词及其词频和聚类类别;
第三:上图中展示分析词的聚类分布情况,默认聚为3类,可自行修改聚类个数;
第四:上图中气泡大小表示该词的词频,颜色代表聚类类别,可结合聚类类别综合分析词之间的关系情况;
第五:在某些特殊情况下,可能出现某些词无词向量因而无法进行聚类。
聚类类别 | 频数 | 百分比 |
---|---|---|
尚无记录
|
||
{{ item.type }} | {{ item.value }} | {{ getArraySting((item.value / clusterword.matrixnum.length) * 100, 3) }}% |
上图和上表格展示分析词的聚类分布情况;
第一:分析词默认是词频top20的词,可自行选择分析词进行重新分析;
第二:可结合各个聚类类别下属的词情况进行综合分析和应用。
聚类类别 | 频数 | 百分比 |
---|---|---|
尚无记录
|
||
{{ item.type }} | {{ item.value }} | {{ getArraySting((item.value / clusterline.page.total) * 100, 3) }}% |
上图和上表格展示原始数据每行的聚类分布情况;
第一:频数是指原始数据中对应该聚类类别时有多少行数据;
第二:可点击‘下载’查看原始数据对应的聚类类别。
词 | 词频 | {{ item }} |
---|---|---|
尚无记录
|
||
{{ item.word }}
|
{{ item.fre }} | {{ getArraySting(item[v], 3) }} |
一致性系数:{{ getArraySting(lda.coherence, 3) }}
上表格展示各主题与分析词之间的权重情况,并且展示各词的词频;
第一:某主题与分析词之间的权重值越大,意味着该词与该主题关系越为紧密;
第二:主题与分析词之间的权重关系情况,可通过右侧‘主题权重对应关系图’进行可视化查看和分析;
第三:在右侧主题权重对应关系图中,权重极低的词可能不会被展示出来。
主题分布表格展示原始数据对应的主题隶属关系汇总情况;
第一:出现行数是指原始数据中对应该主题时有多少行数据;
第二:可点击‘下载主题标识’查看原始数据对应的主题隶属关系。
主题权重对应关系图展示各主题与分析词之间的权重关系;
第一:默认进入时,条形图展示分析词的词频情况;
第二:点击主题气泡,则展示该主题与分析词之间的对应关系情况(条形图),进而分析该主题的实际意义;
第三:气泡大小表示该主题的重要性情况,以及条形的长度表示该主题时该词的权重大小情况;
第四:在条形图中,权重极低的词可能不会被展示出来;
第五:可通过‘修改主题名称’修改主题的名称。
上图是主题与分析词关系可视化展示的另一种方式;
第一:气泡大小表示该词与主题的权重大小,气泡越大意味着该词与主题之间关系越紧密;
第二:可结合主题与分析词之间的关系情况(气泡大小)综合分析主题的实际意义;
第三:上图中,权重极低的词可能不会被展示出来。
上表格展示可能新词发现的结果信息;
第一:可能新词指算法自动识别出的潜在可能性新词,但具体其是否为新词应该以研究者为准;
第二:可结合右侧文本信息,该可能新词的实际意义,进而识别是否为新词;
第三:如果是新词,则可对其进行新词处理,也可单独使用‘我的词库’-》‘新词词库’批量加入新词;
第四:上表格中信息熵和互信息为算法处理值,信息熵表示形成‘新词’的灵活度情况,互信息表示形成‘新词’的凝聚程度;
第五:信息熵参数指标越大则越短的词语也容易提取出来,互信息参数指标越大则越长的词语越容易提取出来;
第六:默认情况下信息熵参数指标设置为0.5,互信息参数指标设置为50到200之间,当然可自行修改该两个参数值后重新分析。
{{ newwordfind.locationText }}共 {{ newwordfind.locationAllData.length }} 条
完整内容
分析建议
分析建议
分析进行中,请等待
Loading