数据问答

<< Click to Display Table of Contents >>

当前位置:  增强分析 

数据问答

复制链接

1.数据问答

产品支持智能分析工具-数据问答。用户使用通用语言输入问题,并会立即获得答复。目前在产品系统语言为中文环境下识别中文输入,在非中文系统环境下识别英文输入。答案针对提出的问题,以绘制的可视化图表进行展示,不再需要手动绑定数据列或了解数据结构的细微差别。

使用数据问答功能需购买Y+Analytics的许可证。

1.1应用场景

当查看分析报告时,由于分析角度或粒度的不同,查看者还有一些数据问题希望能得到答案,此时即可以利用数据问答功能,通过交互问答的形式让查看者能够快速获得问题的答案。

用户在分析数据的过程中,可以直接输入数据问题来获得结果,其减少了数据绑定操作过程、数据简单处理(例如日期表达式的转换、四则运算计算列的创建等),并可以将分析结果快速加入报告中,大大提升了制作分析报告的效率。

1.2应用入口

制作报告中,组件/自助分析下的数据问答组件

查看报告中,报告内已嵌入的数据问答组件

2.问答组件

2.1功能简介

用户可以针对所询问数据快速查看数据情况,并通过输入相关数据问题,快速获得可视化答复。

2.2功能说明

数据问答功能在编辑报告、查看报告中使用。

2.2.1 问答组件入口

在编辑报告中,右侧组件/自助分析下数据问答组件。

enhanced_analysis_dataask_1

2.2.2 问答组件属性设置

通过数据问答的右侧面板【格式】,可以设置组件的格式以及组件标题、提问搜索框的样式。其中包括字体、字号、加粗、斜体、文字颜色、对齐方式、边框、图标颜色、透明度、文本格式。

enhanced_analysis_dataask_2

通过数据问答的右侧面板-设置,可以设置组件的名称、标题、可见性、操作、问答操作、高级设置及位置等属性。

问答操作是用来控制在问答模式下图表组件能进行的操作配置。

enhanced_analysis_dataask_3

3.问答功能

3.1 功能简介

进入数据问答模式后可以根据需要选择要分析的数据集,并可通过数据预览对数据情况快速了解。通过在搜索框内输入问题进行提问,产品会根据问题推荐可视化图表给以答案展示。用户还可以修正问题对可视化图表的结果进行调整。在编辑报告和查看报告中查询数据量依据各自的数据模式定义,默认编辑报告采用样本行数执行数据结果,查看报告中采用全量数据执行数据结果。

3.2 功能说明

在编辑报告中通过点击数据问答组件图标,进入问答模式。在查看报告中通过点击数据问答输入框或图标,进入问答模式。

enhanced_analysis_dataask_4

3.2.1数据预览

进入数据问答页面,会默认加载某一数据集,用户可以在数据集选择框内选择所需分析的数据集。

在右侧的数据栏中,将鼠标悬停在每个字段上可以了解其包含的数据详细信息。

enhanced_analysis_dataask_5

 

 

在进入数据问答模式时,会根据当前所选数据源自动创建索引信息,以便在用户查询之前准备好数据源。

自动:用户在创建新的数据问答时会自动创建索引,并每24小时会自动更新索引信息。

手动:如果数据源频繁更改时,而用户只是偶尔使用数据问答时,可以通过手动更新索引来获取最新的数据源信息,以保证获得准确推荐信息。

备注:在创建索引过程中,限制最大加载时间为10s以及每列只取前1000行不同值的数据,来保证在大数据量时对系统的性能影响。最大加载时间可用户自定义配置(data.qa.create.index.max.time)。当超过限定的时间还没有完全创建完索引,未创建部分只取数据列名的信息。

当数据集内容有更新时,为了保证正在使用的问答能够以最新的数据依据进行解答,用户可通过点击重新建立索引图标,即时重新创建索引。

拥有问答管理权限的用户还可以针对数据列名及其域值自定义同义词,辅助识别用户在提问时输入的相同词语,提升信息识别效率。

3.2.2问答默认问题

进入数据问答模式后,系统会根据当前所选数据集推荐常见的数据问题。拥有数据问答管理权限的用户还可以依据所选数据集新增自定义问题,来帮助用户提供更多较为常见的问题辅助分析。通过点击“+”图标可以新建问题,“要显示的文本”是用来描述用户提问的问题,“匹配结果”是用来定义对应可识别的列的信息。用户定义的问题会放在默认问题的上方,支持再编辑和删除。

enhanced_analysis_dataask_6

3.2.3问答提问及推荐

在问答输入框内,输入有关的数据问题。在输入过程中产品会搜索数据列、函数、字符串值等信息,并在下拉列表中显示结果。

enhanced_analysis_dataask_8

3.2.4修改问题

可以通过用户界面中单击相关选项、数据字段和筛选器来调整问题的措辞。

enhanced_analysis_dataask_9

3.2.5推荐的图表类型

数据问答功能可根据推荐的相关数据信息,自动生成与数据属性较为匹配的图表展示。如果默认的图表信息未能满足您的展示需求,可单击右上方的下拉菜单,从支持的图表类型中进行选择。

支持的图表类型:

·柱图

·堆积柱图

·线图

·堆积线图

·面积图

·堆积面积图

·点图

·堆积点图

·热力图

·饼图

·环形图

·3D饼图

·南丁格尔玫瑰图

·雷达图

·填充雷达图

·盒须图

·瀑布图

·帕累托图

·甘特图

·直方图

·指标卡

·地图

·GIS地图

·表格

3.2.6图表的分析操作

根据问题反馈的图表结果展示,其上的操作能力可通过在问答组件设置/问答操作中进行自定义配置。默认的操作能力包括:交换行列、分组、导出图片、放大数据区域(缩放)、数据洞察、显示详细数据、联动相关数据区域(笔刷)、钻取、冻结窗格、表排序、添加到报表。

3.2.7特定语句识别

·列属性识别:维度列、度量列、经纬度列、地图列、时间列。

·聚合函数:总和、平均、计数、精确不同值计数、不同值计数、最大值、最小值、中位数、方差、标准差、四分位数。

·动态计算:动态计算,差值、百分比、差值百分比、汇总百分比、累计总计、移动计算、排名计算、百分位。

·过滤条件:列域值维度、数值、日期等条件筛选。

·同环比:同比、环比、增长值、增长率。

·排序:升序、降序、字母顺序。

·Top n排名:排前n、排在前n、排后n、排在后n、top n。

·图表类型:推荐的图表类型里支持的类型。

·四则运算:加、减、乘、除、+、-、*、\。

·时间列:今天、昨天、明天、本月、上月、下月、本季度、上个季度、下个季度、今年、明年、去年、天、月度、季度、年。

示例

数据集为记录中国各省份产品销售情况的数据宽表,其中包含“市场级别、产品种类、产品名称、省份、交易时间、订单ID、销售额、销量、利润、总成本等”,用户可以通过数据预览来查看数据列的统计情况。用户可通过输入以下问题来进行分析。

· 问题1,“今年各市场级别的销量总和升序排序”,转译为“按 市场级别 分类”、“销量 总和”、“市场级别销量_总和 升序”、“按 交易时间  是等于?{_THIS_YEAR_}过滤”,提交后生成柱图。

· 问题2,“各省份的销售额减去总成本”,转译为“按 省份 分类”、“(销售额-总成本)总和”,提交后生成地图。

· 问题3,“各产品种类的利润汇总百分比”,转译为“按 产品种类 分类”、“利润总和汇总百分比”,提交后生成饼图。

 

3.2.8 其它

·数据问答界面支持取消、重做,支持在问答模式中创建多个问答标题栏进行提问。

·数据问答反馈的结果默认受报告中的过滤条件联动影响,可通过组件右侧的设置/高级/隔离该元素以不受数据联动影响对问答结果进行隔离。

4.问答权限

4.1功能简介

数据问答功能可以通过权限配置赋予用户/组/角色。其中包括数据问答的使用和管理。

问答应用:控制数据问答功能的使用,默认付给everyone角色。

问答管理:控制数据问答功能的使用,同时可以对数据集列名及域值进行同义词编辑,还可以在默认模板问题处自定义默认问题。

4.2功能说明

4.2.1权限配置

数据问答权限配置入口为,权限信息编辑/操作/制作报告操作。

enhanced_analysis_dataask_7

4.2.2问答监控

在系统监控/用户行为下增加数据问答监控统计报告,用以统计用户在一定时间内对某一数据集进行问答状况的信息统计。管理者可以通过监控报表了解用户对哪些数据比较关注,问题中较为关注哪些指标。详情请参考系统监控>数据问答使用统计

enhanced_analysis_dataask_10