本文为商务智能(学堂在线-北京联合大学)、《Power BI商业数据分析-胡永胜》的学习笔记。(书讲的比较浅,只适合入门。)
商务智能
商务智能是实现数据、信息、知识、决策转换的过程;商务智能是应用数据仓库技术、在线分析处理技术、数据挖掘技术和数据可视化技术,以实现商业价值的企业信息化建设过程。
认知BI
商务智能概念
什么是决策:为达到一定目标,组织或个人识别问题,从多个备选方案中依据一定准则选择最优方案,并加以实施的过程。面对日益激烈的市场竞争,企业越来越需要提高决策的准确度和灵敏度。有关调查表明,企业37%的业务决策主要依赖于“直觉”或“本能”,为什么呢? 从数据资源匮乏,到数据资源冗余;从信息盲点,到数据孤岛,因此,商务智能(Business Intelligence)应运而生。
商务智能的定义:
信息技术的视角,BI是一种满足企业决策需要的解决方案,即经过数据抽取、转换和装载建设数据仓库,进行数据分析和挖掘,将知识呈现给管理者支持决策的整体技术方案。
管理科学的视角,BI是指对商业信息的搜集、管理和分析的过程,目的是使企业的各级决策者获得知识、提升洞察力,促使他们做出对企业更有利的决策。
BI是融合了先进信息技术与创新管理理念的结合体,其特点如下:
1.BI是综合性的开放系统
2.BI具有强大的数据分析处理与展示功能
3.BI注重在系统的海量数据和信息中发现知识
4.BI综合了多项技术的应用
5.BI服务于企业战略
6.BI有助于提升企业绩效
7.BI的用户具有多样性
商务智能发展
- 发展过程:
事务处理系统(Transaction processing system,TPS)
经理信息系统(Executive Information System,EIS)
管理信息系统(Management Information System ,MIS)
决策支持系统(Decision Support System,DSS)
商务智能系统(Business Intelligence,BI) - 发展趋势:
BI发展的云端化;
SaaS平台上标准的数据接口;
移动BI和协作办公越来越强;
敏捷集中地配置BI;
自助式BI应用得到发展;
分散式分析的应用;
嵌入式BI的发展;
智能数据挖掘分析;
从IT为中心转向以业务为中心;
中小企业BI应用逐渐扩大市场份额。商务智能与大数据
大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
将大数据分析结合进传统的BI系统中,在分析能力和分析类型上对传统的BI系统进行扩展。
1、分析能力的增强
通过将Hadoop等分布式平台结合进BI系统能够增强数据的分布式并行处理能力,从而从底层添加计算能力。
2、分析能力的扩展
结合大数据分析,能够将以往无法分析的非结构化数据或半结构化数据分析结合进来,极大扩展Bi系统分析能力。
3、智能分析的拓展
数据巨量以及实时变化 ,智能化数据分析与挖掘需求与日俱增,大数据分析能力正好弥补了传统BI的不足。商务智能应用价值
深刻洞察过去, 准确把握现在,迅速决策掌控未来。
在各个行业能做什么:
金融服务业
• 客户贡献度分析
• 信用评分
• 风险评估
• 客户区隔
• 交叉营销
保险业
• 顾客贡献度分析
• 信用评分
• 风险评估
• 客户区隔
• 交叉营销
• 客户流失分析
• 诈欺侦测
电信业
• 顾客贡献度分析
• 信用评分
• 客户区隔
• 交叉营销
• 客户流失分析
• 销售预测
• 诈欺侦测
制造业
• 客户贡献度分析
• 质量管理
• 营销绩效分析
• 生产分析
• 存货分析
• RD测试分析
零售业
• 客户忠诚度
• 客户区隔
• 购物篮分析
• 定价分析
• 交叉营销
• 销售预测数据仓库
数据仓库( Data Warehouse )是一个面向主题的(Subject Oriented )、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant) 的数据集合,用于支持管理决策和信息的全局共享。 - 特点:
- 面向主题
数据仓库是面向不同的主题域进行组织。一个主题通常不多个操作型信息系统相关。操作型数据库是面向特殊处理仸务,进行组织,由各个不同的系统独立维护。 - 集成性
面向主题组织数据的过程是对源数据的一种增值和统一。 - 相对稳定的
• 定期加载,加载后的数据极少更新。• 满足不同用户在不同时间检索相同主题,并获得相同结果的业务需求。 - 反映历史变化
数据仓库中的每一个数据结构都需要包含时间元素,以标明数据在丌同时间点的变化情况,以标注丌同时间段所发生的业务情况。
- 数据仓库与数据集市的区别:
- 元数据的作用:
• 描述哪些数据在数据仓库中,帮助决策分析者对数据仓库的内容定位。
• 定义数据进入数据仓库的方式,作为数据汇总、映射和清洗的指南。
• 记彔业务事件发生而随之进行的数据抽取工作时间安排。
• 记彔并检测系统数据一致性的要求和执行情况。
• 评估数据质量
数据仓库的所有数据都要通过元数据来管理和控制。
元数据存储方式 目前趋势:数据库为基础->元数据库。 - 操作数据存储(Operational Data Store,ODS):
•常常被作为数据仓库的过渡,也是数据仓库结构中的可选项之一。
•作用: 1)在业务系统和数据仓库之间形成一个隔离层(DB-ODS-DW)。 2)转移一部分业务系统细节查询的功能。3)完成数据仓库中不能完成的一些功能。
•主要特点: 面向主题的;集成的;可变的;当前的细节数据集合。 - 数据的抽取转换加载(ETL):
Extraction(数据抽取) :将数据从各种原始的业务系统中读取出来。Transformation(转换)(Clean(清洗):按照预先数据设计好的规则将抽取的数据迚行转换、清洗,以及处理一些冗余、歧义的数据,将本来异构的数据格式能统一起来。Loading(加载):将转换完的数据导入到数据仓库中。
1.ETL贯穿于项目始终,它是整个数据仓库的生命线
2.它是联机分析处理、数据挖掘的基础
3.ETL设计的好坏直接关接到BI项目的成败
ETL为BI/DW的核心和灵魂。
数据抽取前的准备工作: - 确定数据来源
文件系统、业务系统、第三方接口数据。 - 确定抽取方式
根据具体业务进行全量或者增量抽取。 - 考虑抽取策略
根据具体的业务制定抽取的时间、频度,以及抽取的流程。
一般情况下,数据仓库分为ODS、DW两部分。通常的做法是从业务系统到ODS做清洗,将脏数据和不完整数据过滤掉,在从ODS到DW的过程中转换,进行一些业务规则的计算和聚合。T(清洗、转换) ,一般情冴下这部分工作量是整个ETL的2/3。
数据加载主要是将绊过转换和清洗的数据加载到数据仓库中,这时的数据已绊是基于分析模型迚行组织起来的。1 初始加载:一次对整个数据仓库迚行装载。2 增量加载:保证数据仓库不源数据变化的同期性。(触发器、时间戳、日志表、全表删除插入、全表比对) 。3 完全刷新:周期性地重写整个数据仓库,也可能只对一部分数据迚行刷新。
ETL工具:
数据库厂商自带ETL工具:Oracle Data Integrator、SQLServer 的SSIS服务。
第三方工具厂商:NCR Teradata、Cognos 、Informatic、IBM DataStage。
开源ETL工具:Kettle 、Talend、KETL、Apatar。
- 数据仓库的数据模型:
- 概念模型:
独立亍计算机系统,完全不涉及信息在计算机系统的表示,只关心用来描述某个特定组织所关心的信息结构。是用户和数据库设计人员之间进行交流的工具。
准备工作:
•确定系统边界:决策类型、需要的信息、原始信息
•确定主题域及其内容:主题域的公共键码、联系、属性组
•确定维度:如时间维、销售位置维、产品维、组别维等
•确定类别:相应维的详细类别
•确定度量和事实:用亍进行分析的数值化信息。度量:是业务流程节点上的一个数值。事实包含来自业务过程的度量,基本都以数量值表示。事实就是业务流程中的一条业务,是一个度量集。 - 逻辑模型:
星型模型(Star Schema):优势 1、便于业务需求的交流,容易理解。 2、关系表的结构,加速查询浏览。 3、适合于追踪查询多条件限制的关键指标。
雪花模型(Snowflake Schema):特点:维表进一步层次化,可能是规范化的,以减少冗余,易于维护,并可节省存储空间。 - 物理模型:
物理模型的主要组成:表、列、主键、外键、同义词、视图、约束、索引、注释、用户角色、安全特权和文件(表空间)。目的:提高性能和更好地管理好存储的数据。
如何进行数据仓库设计开发:
• 概念模型设计 • 技术准备工作• 逻辑模型设计 • 物理模型设计 • 数据仓库的生成 • 数据仓库的使用和维护。在线分析处理技术(OLAP,Online Analytical Processing)
定义:是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OLAP委员会的定义)。
目标:满足决策支持或多维环境特定的查询和报表需求。
特性:多维;高速响应;灵活交互。
多维数据分析方法:• 切片和切块(Slice and Dice)• 钻取(Drill):-向下钻取(Drill-down),-向上钻取(Drill-up)•旋转(Rotate)• 其他操作:-钻过(drill-across) -穿透(drill-through) -概化(Genearlize) -特化(Specialize)。数据挖掘技术
技术角度:数据挖掘是就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
商业角度:数据挖掘是按照企业既定业务目标,对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。
功能:• 描述分析: 聚类分析;关联分析;偏差分析。• 预测分析:分类分析;回归分析。
数据挖掘技术在客户关系管理的价值体现在以下三个阶段:获得有价值的潜在客户、提高客户的价值、保持有效益的客户。
商业挖掘工具:IBM SPSS Modeler、SAS Enterprise Miner、IBM Intelligent Miner、SQL Server 2005 Data Mining 、Oracle DM。
开源挖掘工具:Python、R、RapidMiner、Weka、Oracle、KNIME。
选择工具时应考虑:可产生的模式种类的数量;解决复杂问题的能力;操作性能;数据存取能力;和其他产品的接口。可视化分析技术
数据可视化的崛起成为大数据时代的一个显著特征。一方面,数据赋予可视化价值,另一方面,可视化则增加了数据的灵性。数据可视化将技术与艺术完美结合,借助图形化的手段,清晰有效地传达与沟通信息。
信息可视化是可视化技术在非空间数据领域的应用,利用计算机图形图像和数据挖掘的技术与方法,将数据信息以直观交互方式形象生动地展示给用户。在金融、网络通信、生物学和BI等领域,信息可视化技术被广泛应用于辅助用户分析数据,进而发现其中蕴含的规律。
信息可视化过程可以划分为三个数据转换的过程,原始数据到数据表的转换,数据表到可视化结构的转换,以及可视化结构到视图的转换。
BI中的数据可视化,是以商业报表、关键绩效指标、图形等通过可视化展现,以易于访问和交互的方式来揭示数据的价值,从而改善决策人员的业务能力。
数据可视化分析流程的核心要素包括4个方面: • 数据表示与转换。• 数据的可视化呈现。• 用户交互。• 分析推理。
数据可视化是指那些用程序生成的图形图像,这个程序可以被应用到很多不同的数据上。
信息可视化是指某一数据定制的图形图像,它往往是设计者手工定制的,只能应用在设定好的数据中。
业务报表是一个包含业务相关信息的文件。业务报表(也称为企业报表)是优化企业决策与企业知识管理的核心部分。用于建立报表的基础是各种来自组织内部和外部的数据源。
根据内容与形式,报表可分为3类:• 正式报表 • 非正式报表 • 简短报表。
根据报表的管理目的,报表可以分为3类:• 指标管理报表 • 仪表盘报表 • 平衡积分卡报表。
所有的仪表盘和其他信息可视化工具都具有以下特征:
(1) 使用可视化组件
(2) 对用户来说简明易懂
(3) 将不同系统的数据整合为一个独立的和一致的业务视图。
(4) 能够对基础的数据或报表进行钻取
(5) 呈现了动态的、真实世界的视图
(6) 几乎不需要定制编码就可以实施、部署和维护。
使用数据可视化时要牢记以下四个条件:
• 一是了解受众。
• 二是足够了解数据。
• 三是懂得说故事。
• 四是简单有力。快消行业案例
关注点:产品、渠道、铺货、促销、形象。接近消费者,提升业绩。财务行业案例
需求梳理5W1H
财务BI价值:提效、增利、实时、自助分析、创收。实践BI
明确项目角色职责,项目管理制度(需求管理、文档管理、沟通和会议管理、开发管理)。
各阶段工作内容:
- 项目准备
仸务:制定项目规划书;召开项目启动会;确定项目组成员。
交付件:详细项目计划;项目组成员职责。 - 需求设计
仸务:调研用户需求;梳理数据字典及核算逡辑;评估项目可行性;设计报表原型。
交付件:数据字典;需求说明书 - 系统实现
仸务:设计数据集市模型;ETL开发;报表开发。
交付件:集市层数据模型;ETL设计文档;BI平台元数据库。 - 业务验证
仸务:开发人员迚行系统集成测试;财务人员迚行功能和数据测试;根据测试结果调整优化。
交付件:对数底稿;系统测试报告。 - 部署上线
仸务:部署上线;制定专用的维护流程;向最终用户培训。
交付件:完最终用户培训计划书;系统运行维护手册;用户操作手册;上线成功报告。Power BI商业数据分析
第1章 认识Power BI:强大的自助商业智能分析工具
让数据技能成为你的竞争⼒
“数据是组织中重要的资产”。随着数据范围的扩⼤和维度的不断增加,各种岗位都⾯临着海量的数据,不仅仅是运营、财务,现在连⼈⼒、⾏政、审计都必须处理海量并且依然在⼤幅增⻓的各类数据。组织中缺乏数据专⻓的⼈才,我们可以先⼈⼀步,将数据技能变成⾃⼰的优势。我们应该主动融⼊业务,从⾃⼰的⻆⾊中识别数据问题,并将数据成果转化为业务问题的解决⽅案,发现数据的价值和⼒量。为什么是Power BI
微软Power BI——强⼤的⾃助商业智能分析⼯具。与其他⾃助⼯具相⽐,Power BI还有以下这些明显的优势。上⼿更快:Power BI简洁的外观与⼤家熟悉的微软Office界⾯类似,从⽽使⽤⼾能快速上⼿,提⾼⼯作效率。与微软其他产品⽆缝协作成本低:相对于其他BI⼯具,成本低是Power BI的⼀⼤优势,它最核⼼的Power BI Desktop完全免费,这意味着,个⼈可以完全免费地学习和使⽤,中⼩企业也可以低成本甚⾄零成本地应⽤Power BI。Power BI主要架构
Power BI主要由Power BI Desktop、Power BI服务以及在移动终端上也可⽤的Power BI移动版组成。Power BI Desktop是Power BI的桌⾯应⽤程序,也称为桌⾯版,专为分析⼈员设计。它结合了⼀流的交互式可视化效果和业界领先的内置数据查询和建模功能,可以创建报告并将报告发布到Power BI服务中。初识Power BI
使⽤Power BI Desktop制作的报告可以在本地保存成扩展名为.pbix的⽂件,还可以上传到Power BI服务中。Power BI服务(Power BI Service)是⼀个在线服务。Power BI Desktop中制作的报表发布后,就会显⽰在Power BI服务中,⽤⼾可以在浏览器中查看、分享、发布Power BI报表,也可以设置数据刷新计划、管理数据的安全性等。Power BI移动版需要在移动终端查看跟踪数据时,可以使⽤适⽤于iOS、Android的Power BI移动版。
安装Power BI Desktop有如下两种⽅式。
(1)如果计算机操作系统为Windows 10,进⼊Microsoft Store,搜索Power BI Desktop,单击安装即可,通过Microsoft Store安装的好处是,当Power BI Desktop更新时,可以后台⾃动更新且⽆须重新下载安装。
(2)如果计算机操作系统不是Windows 10,那么登录微软PowerBI官⽹,在产品中选择Power BI Desktop,单击下载即可,安装完成,启动后会提⽰注册,可以⽤企业邮箱或者学校邮箱注册,暂时不想注册可以直接跳过,⼤部分功能不注册同样可以使⽤。体验Power BI:快速从原始数据到动态报告
除了在Power BI Desktop中查看这张报表,还可以发布报表,其他⼈可以随时随地查看。如果读者已经注册账号,登录以后,单击“发布”按钮。在浏览器中登录Power BI服务,即可在线查看,并且在Power BI App中同样可以查看该报表的移动布局,还可以在Power BI服务中,单击“发布到Web”
这样就会⽣成报表⽹址。把这个⽹址发给相关⼈员,他们就可以随时随地通过浏览器查看这个报表了。并且这个报表不是静态的,仍然是可以单击交互的。提醒:内部敏感数据请不要随意发布到Web。
Power BI的操作流程:
- 数据导⼊
- 数据清洗Power Query是Power BI的数据清洗模块,可以帮⽤⼾快速整理成需要的数据
- 制作可视化报告在Power BI中,只需要选择⼀个图表类型,然后拖曳字段到图表中,就可以⽣成⼀个可视化图表。
- 发布分享
第2章 Power BI数据准备:像⾼⼿⼀样处理数据
- 认识Power Query
在Power BI Desktop中,如果还没有任何数据,那么单击“获取数据”,选择相应的数据格式导⼊后,就可以进⼊Power Query编辑器。如果已经导⼊数据,想再次进⼊查看或编辑,可以单击“转换数据”进⼊。
Power Query具有以下优势。
(1)操作简单:即使是初学者,⽆须掌握复杂的函数,仅使⽤界⾯上的功能即可完成⼤部分数据处理⼯作
(2)数据量不限:突破传统Excel数据⾏的限制。
(3)⾃动化:处理过程全记录,每次数据源更新后刷新即可,⽆须重复操作。 - 数据处理第一步:导入数据
Power Query不仅⽀持微软的数据格式,⽐如Excel、SQL Server、Access等,还⽀持SAP、Oracle、MySQL、DB2等⼏乎所有类型的数据格式。Power Query不仅能从本地获取数据,还能从⽹⻚抓取数据。 - 数据清洗的常用操作
对导⼊的数据进⾏整理的过程⼀般称为“数据清洗”。之所以称之为清洗,是因为在数据分析师眼中,杂乱的数据就是“脏”数据,只有被清洗成“⼲净”的数据后才可以在数据分析中使⽤。
1.提升标题;2.更改数据类型;3.删除错误/空值;4.删除重复项;5.填充;6.合并列;7.拆分列;8.分组;9.提取;10.⾏列转置;11.⾏列操作;12.逆透视列:在Power Query中,通过逆透视功能,可以⼀键将⼆维表变为⼀维表;13.透视列;14.添加列:Power Query中添加列有添加重复列、索引列、条件列、⾃定义列、⽰例中的列等形式;15.追加查询:追加查询是在现有记录的基础上,在下⽅添加新的⾏数据,它是⼀种纵向合并;16.合并查询。 - 掌握Power Query不可不知的M函数
在菜单栏中打开⾼级编辑器,可以看到每⼀个操作步骤的M函数。
M函数的优势和作⽤:(1)界⾯操作配合M函数,更加灵活、简洁和⾼效。(2)部分复杂操作必须借助M函数来完成。
M函数的基本规范:(1)严格区分⼤⼩写,每⼀个字⺟必须按函数规范书写,第⼀个字⺟都是⼤写的。(2)表被称为Table,每⾏的内容是⼀个Record,每列的内容是⼀个List。(3)⾏标是⼤括号{},提⽰:Power Query的第⼀⾏从0开始。列标⽤中括号[ ]。
常⽤的M函数:
1.聚合函数求和:List.Sum()求最⼩值:List.Min()求最⼤值:List.Max()求平均值:List.Average()
2.⽂本函数求⽂本⻓度:Text.Length()去⽂本空格:Text.Trim()取前n个字符:Text.Start()取后n个字符:Text.End()移除⽂本:Text.Remove()提取⽂本:Text.Select()
3.提取数据函数从Excel表中提取数据:Excel.Workbook()从Csv/Txt中提取数据:Csv.Document()
4.条件函数:If then else(相当于Excel中的IF函数)
从哪⾥查找M函数:想查看所有的M函数,可以参考微软官⽅⽂档。还有⼀种简单的⽅式可以查看所有的M函数,在Power Query中新建⼀个空查询,在公式栏中输⼊“=#shared”就把所有的M函数显⽰出来了,单击某个函数,最下⽅便出现该函数的注释。 - ⽂本处理技巧:移除和提取
Text.Remove的参数有两个,第⼀个是⽂本,第⼆个是要移除的字符,第⼆个参数可以是⽂本或列表,{“A”..”Z”}表⽰⽣成了⼀个从A到Z的列表,只要是⼤写字⺟,就从客⼾的信息中移除。如果有⼩写字⺟,需要把所有字⺟移除,把⼤写的”Z”替换成⼩写的”z”就⾏了:=Text.Remove([客⼾],{“A”..”z”})。如果只想要英⽂名,要移除中⽂名,可以这样写:英⽂名=Text.Remove([客⼾],{“⼀”..”⻳”});Power Query的中⽂字符以Unicode连续储存,”⼀”的Unicode最⼩,正常使⽤的汉字中,”⻳”的Unicode最⼤,因此{“⼀”..”⻳”}就是包含了所有正常使⽤汉字的列表,可以利⽤它,移除所有的中⽂字符。
Text.Select只提取第⼆个参数中的字符。 - 分列技巧
1 常规分列;2 分列到⾏;3 多种分隔符进⾏分列。
需要⽤M函数来完成分列;提⽰:在Power Query编辑器中,单击编辑栏旁边的fx,即为添加步骤,直接输⼊M函数即可。 - 批量汇总,快速提升工作效率
Splitter.SplitTextByAnyDelimiter函数,把所有的分隔符做成⼀个列表作为该函数的第⼀个参数就可以了。
Excel.Workbook是⼀个M函数,⽤于将Power Query导⼊数据⾃动⽣成的⼆进制⼯作表转换成可读的table⽂件。第3章 Power BI数据建模
根据分析的需求,在多个表之间建⽴合适的关系,使之可以像⼀个表⼀样灵活使⽤,这个过程称为数据建模。
将各个表格导⼊到Power BI Desktop后,进⼊建模视图,把⼀个表中的字段拖到另⼀个表的对应字段上,就可以建⽴关系了。创建度量值的公式称为DAX,度量值被称为移动的公式。Power BI数据建模基本概念
- 1 字段
字段是表的⼀列,只包含⼀种信息,列名就是字段名;在进⾏分析之前,最好做到以下⼏点。(1)检查字段的数据类型是否正确,⽐如数值型、⽂本型等。(2)设置字段的显⽰格式,⽐如百分⽐、千分⽐等。(3)检查字段的默认汇总⽅式,⽐如求和、计数、不汇总等。(4)检查字段的数据类别,⽐如地理字段,可以设置为国家、城市、经纬度等。 - 2 计算列
计算列也是⼀个字段,但它不是从原始数据加载进来的,⽽是在数据模型中使⽤DAX新建的列。计算列仅当刷新表数据时才执⾏计算所使⽤的DAX,计算列的⽣成值存储在数据模型中,占⽤内存,如果在很⼤的表中添加列可能会对数据模型的内存⼤⼩产⽣显著影响,所以⾮必需的情况下,⼀般不建议使⽤计算列。计算列不涉及⽤⼾交互。 - 3 度量值
度量值是⼀个公式,与计算列⼀样是使⽤DAX建⽴的,但它不属于任何表。新建的度量值保持休眠状态,不执⾏计算,直到其被⽤于视觉对象中。度量值计算出的结果是动态的,在不同的上下⽂中执⾏不同的计算,所以也被称为移动的公式。它可以响应⽤⼾交互,可以快速重新计算,但不将输出存储在数据模型中,因此对数据模型的物理⼤⼩没有影响。单击功能区中的“新建度量值”,即可在编辑框中输⼊DAX建⽴度量值。
简单来说,度量值是⽤DAX创建⼀个虚拟的数据值,它不改变源数据,也不改变数据模型,如果不在图表上使⽤它,甚⾄不知道它是什么样⼦的,⽽⼀旦被拖曳到图表上,它便发挥巨⼤的作⽤。它可以随着切⽚器的筛选快速显⽰所需要的动态结果,所以度量值⼀般在图表交互时使⽤。
度量值被称为移动的公式,随着上下⽂环境的不同⽽展⽰不同的数据。度量值另外还有如下两个主要特征。(1)度量值不浪费内存,只有被拖到图表上才执⾏运算,如果数据量⾮常⼤的时候这点⾮常有利。(2)度量值可以循环使⽤。
度量值可以直接调⽤之前建⽴好的度量值,所以在模型中新建度量值的时候,推荐从最简单的度量值开始分级建⽴。度量值并不属于某个表,如果要基于模型中的不同维度执⾏同样的运算,度量值就⾮常合适。 - 4 DAX
DAXDAX(Data Analysis Expression)是数据分析表达式,是⼀种专⻔为计算数据模型中的商业逻辑⽽设计的语⾔,是Power BI中数据建模语⾔。计算列和度量值都是⽤DAX⽣成的。 - 5 上下⽂
上下⽂就是DAX所处的外部环境,它⼜分为筛选上下⽂和⾏上下⽂。计算列和度量值的区别之⼀就是所处的上下⽂不同。度量值的动态计算也是由于上下⽂的切换。 - 6 事实表
事实表,⼜叫明细表,表⽰业务开展⽽产⽣的结果记录;⼀个事实表最好只包含⼀种业务记录。 - 7 维度表维度表,⼜叫查找表。通常⽤来作为分析问题的⻆度
- 8 关系
两个表之间的联系称为关系,它是数据建模最基础也是最重要的概念。从建模视图直观来看,关系就是⼀条线,关系线的中间带有箭头,两端还有1或者*的符号,这些都是关系的属性。 - 9 基数与交叉筛选器方向
基数是两个表的对应关系,关系是有次序的,分为左表和右表,两个表之间有多对⼀、⼀对⼀、⼀对多和多对多四种关系。
交叉筛选器⽅向表⽰数据筛选的流向,在关系线上⽤箭头标⽰,有如下两种类型。单⼀:单项关系,⼀个表会沿着箭头的⽅向对另⼀个表筛选,⽽不能反向。两个:双向关系,两个表可以互相筛选。 - 10 数据模型
关于数据模型的结构有很多种,这⾥介绍⼀个最适合Power BI的模型:星形模型。
星形模型的特征如下。(1)事实表居于中央,维度表环于周围。(2)关系的最⼤深度为1。
星形模型的好处是两个表之间不会有循环关系,⼀个表到另⼀个表只有⼀条路径,这样模型会由较少的表和较少的关系来建⽴,更便于理解,性能上也更优。星形模型因为维度表环于四周,形状像星星⼀样⽽得名,但只要符合以上特征的就是星形模型,⽽并不总是像⼀个星形。Power BI数据分析语言:DAX
- 认识DAX
DAX(Data Analysis Expression)即数据分析表达式,DAX的主要功能正是筛选和计算,DAX的查询函数负责筛选出有⽤的数据集合,然后利⽤DAX的聚合函数执⾏计算,它是Power BI数据分析的灵魂。 - 在哪⾥使⽤DAX
DAX可以在Power BI Desktop中使⽤,也可以在Excel的Power Pivot中使⽤。DAX除了可以新建度量值,还可以新建列,新建表。在模型中不仅有从数据源导⼊的表,还有利⽤DAX在模型中增加的表。 - DAX函数基本语法
(1)表达式以等号开始。(2)等号前⾯是表达式名称。(3)函数后⾯都⽤双括号括上参数,参数之间⽤逗号分割。(4)表名⽤单引号’ ‘包裹。(5)列字段⽤中括号[ ]包裹,并带上表名。(6)度量值⽤中括号[ ]包裹:因为列字段和度量值都是⽤中括号[ ]包裹,为了便于区分和增强DAX代码的可读性,列字段应始终跟随表名⼀起书写;⽽度量值始终不要带表名,因为它并不依赖于任何表,它是独⽴的存在,可以单独书写。
另外,DAX函数不区分⼤⼩写,这⽅⾯⽐M函数要灵活很多,不过为了DAX的简洁和统⼀,建议DAX函数都⽤⼤写字⺟。 - DAX格式规范
(1)如果函数只有1个参数,则和函数放在同⼀⾏。(2)如果函数具有2个或更多参数,则将每1个参数都另起⼀⾏。(3)如果函数及其参数写在多⾏上。①左括号”(“与函数在同⼀⾏。②参数是新⾏,从该函数对⻬位开始缩进4字符。③右括号”)”与函数开头对⻬。④分隔两个参数的逗号位于前⼀个参数的同⼀⾏。⑤如果必须将表达式拆分为更多⾏,则运算符作为新⾏中的⾸字符。 - DAX常⽤的函数
1.聚合函数:
SUM、AVERAGE、MIN、MAX。DAX中还有⼀类特有的函数⾮常有⽤,和这⼏个函数很像,只是在后⾯加了⼀个 X,具体如下:SUMX、AVERAGEX、MINX、MAXX、RANKX这⼏个函数可以循环访问表的每⼀⾏,并执⾏计算,所以也被称为迭代函数。
常⻅的聚合函数及功能如下:COUNT:计数;COUNTROWS:计算⾏数;DISTINCTCOUNT:计算不重复值的个数。
2.时间智能函数: PREVIOUSYEAR/Q/M/D:上⼀年/季/⽉/⽇; NEXTYEAR/Q/M/D:下⼀年/季/⽉/⽇; TOTALYTD/QTD/MTD:年/季/⽉初⾄今; SAMEPERIODLASTYEAR:上年同期;PARALLELPERIOD:上⼀期;DATESINPERIOD:指定期间的⽇期;DATEADD:移动⼀定间隔的⽇期
3.筛选函数:FILTER:筛选;ALL:所有值,可以清除筛选;ALLEXCEPT:保留指定列;VALUES:返回不重复值。Power BI中重要的函数CALCULATE
CALCULATE函数从第⼆个参数开始,所有过滤条件的交集形成最终的筛选数据集合,对最终的筛选数据集合执⾏第⼀个参数的聚合运算后,返回运算结果。
CALCULATE唯⼀的必需参数就是第⼀个参数,后⾯的参数均是可选的。常用的DAX函数
- 1 FILTER函数
语法很简单,只有两个参数:FILTER(表,筛选条件)它的第⼀个参数⼀定是表,是不能放⼊列或者值的;第⼆个参数是筛选条件,如果是多条件筛选,可以⽤&&符号或者||符号连接起来。它返回的也是⼀个表,所以不能直接⽤于建⽴度量值,但可以新建表,最常⽤的就是作为CALCULATE的参数,返回表中符合筛选条件的⾏,然后交给CALCULATE的第⼀个参数执⾏聚合运算。 - 2 ALL函数
它的参数可以是⼀个表,也可以是⼀个或多个列,不过它返回的数据类型都是表。ALL函数更常⽤的功能,作为度量值中的参数,清除外部上下⽂,它可以帮我们灵活地操控外部上下⽂,不想被筛选就可以不被筛选。 - 3 VALUES函数
VALUES函数的语法⼗分简单,参数只有⼀个,即表的⼀列,但返回的数据类型是表,为该列的不重复值的列表。度量值是⼀个值,只有返回值的函数才能⽤于度量值,⽽返回表的函数不能⽤于度量值(除⾮是⼀⾏⼀列的表)。 - 4 HASONEVALUE函数
has one value的英⽂意思是“有⼀个值”,它的参数为表的列。IF和HASONEVALUE函数组合可以拦截错误的效果。 - 5 时间智能函数
时间智能函数时间智能函数不是⼀个函数,⽽是⼀类函数的统称,在进⾏时间相关的分析时⼗分有⽤
时间智能函数 (DAX) - DAX | Microsoft Learn
时间智能函数与普通的时间或者⽇期函数的区别是,⽇期函数直接依赖当前⾏上下⽂,⼀般作为新建列使⽤,⽐如YEAR函数,提取⽇期列的年度;时间智能函数会重置上下⽂,⼀般新建度量值时使⽤,可以快速移动到指定区间。
为了正确使⽤时间智能函数,⾸要是建⽴⼀个规范的⽇期表,并将⽇期列与事实表的⽇期列建⽴关联。规范的⽇期表具备以下特征。● 起⽌⽇期涵盖事实表的所有⽇期。● ⽇期列包含完整年度。● ⽇期是连续且不重复的。● 不包含空值。认识VAR变量
VAR是VARIABLE的缩写,意思为变量。VAR的语法规范很简单,就是把⼀个表达式定义为⼀个名称:VAR 变量名=表达式其中变量名不能和模型中现有的表名、字段名相同,也不能使⽤数字作为第⼀个字符,不能使⽤空格、不能使⽤中⽂等,这个不⽤刻意记,如果提⽰变量名不符合规范,重新命名⼀下就可以了。定义变量是为了使⽤,是要返回结果的,这个操作由RETURN来完成。常⽤的数据分析
- 1 占⽐问题
计算总体,我们前⾯提到过,可以⽤ALL函数计算出汇总数据作为分⺟,这⾥依然⽤ALL函数,以及ALL函数家族的另外⼀个函数:ALLSELECTED。ALLSELECTED函数可以获取外部筛选器(如切⽚器)的选择项⽬,返回给查询函数,计算出我们想要的结果。 - 2 排名问题
计算排名主要使⽤RANKX函数;ALLEXCEPT函数,它可以忽略除第⼆个参数以外的其他上下⽂。 - 3 分组问题
(1)利⽤计算列进⾏分组统计:使⽤IF函数或者SWITCH函数。
(2)利⽤度量值进⾏分组统计:采⽤度量值的⽅式要⾸先定义好分组的类别和标准,然后把需要分组的数据分别统计到指定的分组中。
新建列的⾏上下⽂是确定的,可以直接使⽤⾏字段,⽽度量值的外部上下⽂是动态的,所以⽆法直接和某个具体指标匹配,这时就要⽤到SELECTEDVALUE函数,它根据外部上下⽂的环境来进⾏动态匹配运算。利⽤度量值的另外⼀个优势是,可以在不对源数据进⾏任何修改的情况下进⾏分析,这和新建列需要在源数据中新增加⼀列相⽐有更⼤的灵活性。区分计算列和度量值
计算列和度量值⼀样都是使⽤DAX来创建的,DAX的计算逻辑在它们之间并没有不同,导致计算列和度量值差异的是上下⽂。
在计算列中,其上下⽂是明确的,就是当前⾏,可以根据需要,利⽤DAX缩⼩为当前⾏的某⼀列。计算列的DAX写好之后会⽴即计算,它的上下⽂是固定的,所以计算结果也是固定的,不受外部筛选器的影响,不能与⽤⼾交互。⽽度量值编写时并没有明确的上下⽂,度量值写好之后不会⽴即计算,只有放到上下⽂中时,才进⾏计算并返回结果。它可以放在任意的上下⽂环境中,执⾏不同的计算,可以与⽤⼾交互。
在Power BI中,除了计算列和度量值,还有个地⽅可以⽤到DAX,就是计算表。计算表就是使⽤DAX⽣成⼀个表。计算表不依赖任何的外部上下⽂,它返回的表都是在DAX中内部构造,这个表是确定的,不受外部筛选器的影响,不能与⽤⼾交互。计算表主要⽤于构建维度表。
● 计算列使⽤当前⾏上下⽂。
● 计算表使⽤DAX构建上下⽂。
● 度量值最灵活,先不管上下⽂,写好DAX公式之后,给什么上下⽂,就执⾏什么运算,或者需要什么计算,就给度量值提供什么上下⽂。
其他⼏项主要区别如下。(1)⽤⼾交互计算列和计算表不受外部筛选器影响,不能与⽤⼾交互。度量值受外部筛选器影响,可以与⽤⼾交互。(2)计算时间计算列和计算表会⽴即计算,以及在数据刷新时计算,其结果⽴即可⻅。度量值建⽴时不会⽴即计算,⽽是放到可视化对象时计算,之后才能看得到结果。(3)存储位置计算列和计算表计算的结果存储在数据模型中,如果数据量⽐较⼤,可能会对数据模型的内存产⽣明显影响,进⽽影响性能。度量值在图表中计算,不会输出数据到数据模型,因此对数据模型的⼤⼩没有影响,不会影响性能。Power BI数据分析,不仅仅是DAX
Power BI数据分析的基本步骤如下。(1)理清需求。(2)准备数据。(3)建⽴模型。(4)选择⽅式(度量值还是新建列等)。(5)编写DAX。(6)测试结果。第4章 Power BI数据可视化
Power BI⽣成图表的基本步骤:根据数据的属性和展现的需要,选择合适的图表类型,把需要的字段拖曳进去,然后进⾏各项格式的美化调整即可。学会使⽤内置的可视化对象
1 折线图
2 瀑布图:(Waterfall Plot)也被称为阶梯图,常⻅的有组成瀑布图和变化瀑布图。
3 卡片图:也被称为⼤数字磁贴
4 树状图:严格来说,应该称为矩形树图。
5 散点图
6 矩阵学会使用自定义视觉对象
使⽤⾃定义视觉对象,有以下两种⽅式。1.从⽂件导⼊先去官⽹下载,然后导⼊到Power BI中。2.从AppSource导⼊,⽆须单独下载,在Power BI中就可以完成。对于导⼊的⾃定义视觉对象,右键单击该对象,可以选择将其固定到可视化效果窗格常用的自定义图表
把⾃定义图表固定以后,下次再打开Power BI时,就不⽤重新导⼊了。需要注意的是,第⼆种⽅式需要登录才能使⽤,所以使⽤者⾸先应该拥有⼀个Power BI账⼾。
1 旭日图:旭⽇图(Sunburst Chart)是饼图的变形,也可以看作是多级饼图,它可以展⽰多个层次的⽐例结构,并能够清晰展⽰出不同层次数据间的关系。
2 ⽢特图:(Gantt)不同于其他图表的地⽅是,它不只是⼀种图表,它本⾝还是⼀个管理⼯具。
3 雷达图:(Radar Chart)雷达图也被称为蜘蛛图、⽹络图、极坐标图等。通过雷达图,可以清晰地看出⽐较对象的特点,在某⼀个⽅⾯的突出优势和劣势。
4 词云图:(Word Cloud)⽐较常⻅,它以⼀种直观有趣的⽅式展现⽂本内容,⽤⼾可以快速从中获取⾼频的关键词。
5 ⼦弹图:(Bullet Chart)因其外形像⼀颗射出的⼦弹⽽得名,主要⽤于考核实际数据与⽬标的差异情况,在各种KPI分析中经常可以看到。
6 盒须图:(Box Whisker Chart)也被称为箱线图、盒图等,它可以⽤来反映⼀组或者多组数据的分布情况,因形状像⻓着胡须的盒⼦⽽得名。盒须图被⼴泛⽤于统计分布的信息,⽐如观察员⼯薪资分布、单笔订单⾦额分布或者⼈⼝年龄分布等。
7 动画条形图:动画条形图(Animated Bar Chart Race)是在社交媒体上很流⾏的⼀种数据展现⽅式,⼀般⽤于动态排名。
8 华夫饼图(Waffle Chart)也称为直⻆饼图,包含10×10的图标⽹格,每个格⼦代表1%,它可以直观地表⽰原始数据值并将其作为百分⽐进⾏⽐较。常用的控件
1 Timeline SlicerTimeline Slicer即时间线切⽚器,它是⼀个图形⽇期范围选择器,⽤作Power BI中的过滤组件。
2 Time Brush Slicer:可让⽤⼾通过直接拖动或刷过感兴趣的时间段来过滤基于时间的数据
3 Chiclet SlicerChiclet Slicer是由按钮制成的切⽚器,能以紧凑形式的矩阵排列,可以作为其他视觉效果的画布内过滤器,还可以在切⽚器中为不同的类别添加图标。
4 Text FilterText Filter提供⼀个搜索框,可⽤于搜索包含指定字段的⽂本,这使⽤⼾可以通过关键字搜索快速查找报表上显⽰的特定内容
5 Play Axis,是⼀个播放器,它可以在没有任何⽤⼾交互的情况下激活其他功能的视觉效果。
6 HTML ContentHTML Content能以HTML或纯⽂本精美地呈现数据,允许以原始样式显⽰HTML⽂本字符串以及使⽤换⾏格式化。另外,这个控件还可以作为多媒体播放控件,在Power BI中播放⾳频和视频。第5章 熟悉Power BI丰富的交互方式
Power BI的图表都是可以动态交互的,可以引导⽤⼾⼀步步深⼊探索数据,可视化的过程也是分析推理过程,它的可视化⽐⽣成普通图表的意义要⼤得多。Power BI可视化与传统图表的⼀⼤区别就是它的可视化分析是动态的,可以通过⻚⾯上筛选、钻取、突出显⽰等交互功能快速发现数据背后的规律。但是,不必要的交互会将优异的分析变成⽆⽤分析 - Power BI的工具提示
⼯具提⽰功能允许⽤⼾将⾃⼰的可视化作品放置到⼯具提⽰中,通过⿏标悬停的⽅式来展⽰它们。⼯具提⽰实际上是先制作⼀个单独的可视化⻚⾯,通过相应的设置使其展⽰在提⽰中。
使⽤⼯具提⽰的好处:1.节省⻚⾯空间;2.保持⻚⾯整洁;3.满⾜不同层次⽤⼾的需求。 - Power BI的钻取
当图表中的数据存在层级结构时,可以在图表上直接钻取展⽰下⼀层级的数据,最常⻅的层级结构就是⽇期数据,从年度、季度、⽉份到⽇期,甚⾄到⼩时、分钟和秒,只要具体的时间数据的层次结构⾜够详细即可。 - Power BI的书签
它可以记录报表⻚⾯的位置,利⽤它可以快速跳转到想看的⻚⾯。灵活使⽤书签,Power BI报表的交互性会⼤⼤增强。在Power BI操作界⾯编辑状态下,需要按住Ctrl键,再单击图标才能跳转。将报表发布到Web的情况下,⽆须按Ctrl键,可以直接单击⿏标进⾏交互。书签除了可以跳转到指定的⻚⾯,还可以通过⼀定的设置,实现更有趣、更丰富的交互,⽐如动态切换图表。 - Power BI的参数
可以使⽤参数,以切⽚器的形式来控制变量,与其他指标进⾏交互,进⽽完成动态分析。 - 同步切⽚器
利⽤ Power BI的同步切⽚器功能,不同⻚⾯也可以设置同步响应。同步就是在该⻚⾯中是否响应切⽚器,⽽可⻅是指是否在该⻚显⽰切⽚器。第6章 Power BI动态交互技巧
1 动态切换数据单位
只能⽤千、百万等英美的习惯单位来显⽰,⽽没有我们中⽂所习惯的万、亿等单位。制作思路:单击切⽚器,如果选择以“万”为单位显⽰,就让度量值除以10000,如果以“亿”为单位,就让度量值除以100000000。
2 动态指标分析
根据需要动态切换显⽰的指标数据;利⽤度量值进⾏分析指标的动态切换;关键是切⽚器、SWITCH函数和SELECTEDVALUE函数的相互配合使⽤。
3 动态坐标轴
提⽰:在Power BI中建⽴两个表之间的关系,不仅是在建模视图中,通过连线建⽴关系,还可以⽤DAX函数,在表达式内部建⽴虚拟的关系,TREATAS函数就是建⽴虚拟关系的函数,它可以在不改变数据模型的前提下,更灵活地处理数据。
4 动态图表标题
设置折线图的标题,选择“条件格式”,在弹出的窗⼝中,选择格式模式为“字段值”,依据字段选择刚建⽴的度量值“动态标题”。
5 动态显示度量值
①需要将动态展⽰度量值名放到⼀列中,作为⽣成切⽚器的字段,并⽤此列与维度列⽣成笛卡⼉积。②将属性的值全部整合为⼀个字段或者⼀个度量值。③利⽤矩阵和切⽚器进⾏动态显⽰。
6 图表的动态配色
Power BI中有专⻔进⾏图表动态配⾊的功能,利⽤“字段值”就可以轻松做到。第7章 Power BI应用:学习Power BI不是目的,解决问题才是真
- 帕累托分析
各种复杂现象的背后,其实都是受关键的少数因素和普通的⼤多数因素所影响,把主要精⼒放在关键的少数因素上,就能达到事半功倍的效果。这就是⼤家常说的⼆⼋原则,也称为帕累托原则,是由意⼤利经济学家V.Pareto(帕累托)提出的。
⽤帕累托图进⾏分析也称为帕累托分析,或者ABC分析。其实帕累托分析也是分组分析的特例,将数据按重要程度分类为20%和80%两类,或者分为A、B、C三个类别。新建列的⽅式称为静态帕累托分析;度量值实现⽅式称为动态帕累托分析。帕累托图实际上就是⼀个折线图和柱形图的组合,因此使⽤默认的可视化对象,折线和堆积柱形图或者折线和簇状柱形图都可以。 - 产品关联分析
1.数据建模
两个表之间只能有⼀条实线关系,但可以有多条虚线关系,激活虚线关系时,实线关系⾃动变为⾮激活状态。虚线关系可以⽤USERELATIONSHIP函数来激活。提⽰:数据分析的步骤并不是严格按照先设置度量值,然后在画布上做可视化。设置度量值时,⼀定要有上下⽂的概念,如果读者没有这个概念,读者完全可以先把上下⽂放到画布上,这样就有实际的上下⽂了,简单地根据这个上下⽂来写度量值就⾏了。并且度量值写出来,可以直接放置到这个上下⽂中展现和验证结果,更便于理解和调试DAX。
2.客⼾关联度分析
3.销售⾦额关联性分析
4.关联度四象限分析
利⽤散点图就可以轻松制作四象限分析图。为了实现四象限的效果,需要将图表区分成四个部分,选中散点图,在“分析”功能区,添加平均值线。
当然,这个模型挖掘的关联产品只是初步结果,还应对这个结果进⾏进⼀步验证,避免因偶然或⼈为因素导致的⾼关联性,⽐如是否有某两种商品的捆绑销售活动等。关联分析是⾮常有⽤的数据挖掘⽅式,能够帮助企业进⾏精准产品营销、产品组合以及发现更多潜在客⼾,真正地利⽤数据为企业创造价值。第8章 Power BI报表设计
⾊彩篇
Power BI主题:主题可以控制整个报表的配⾊、默认视觉样式以及字体等,这⾥只说最直观的配⾊。在Power BI中,主题分为两种:内置主题和⾃定义主题。内置主题提供了随Power BI Desktop软件安装时⼀起预先导⼊的配⾊⽅案,可以在“视图”功能中查看到这些主题,选好并单击某个主题,就会在整个报告中快速应⽤这个配⾊⽅案,每⻚报表都焕然⼀新。Power BI主题库提供了很多的⾃定义主题,主题的格式是json,把它下载到本地以后,通过“浏览主题”来快速导⼊外部的主题⽂件。这些主题,还可以进⼀步编辑,对某⼏个颜⾊单独更改,单击“⾃定义当前主题”,就会弹出编辑窗⼝。通过主题的⾃定义编辑,可以⾃定义⼀套专属于⾃⼰公司的个性化配⾊或者与LOGO协调的配⾊,可以把这个主题导出来,应⽤于其他的报表。关于数据图表的⾊彩可以参考如下原则。差异化:为了更易于识别不同的数据,不要使⽤过于接近的颜⾊;也不要使⽤过多的⾊彩,这样会看起来很混乱。布局篇
⼀致性:同样的维度,在不同的图表中,⾊彩应保持⼀致,这样⽤⼾看⼀次图例,就知道每种颜⾊代表什么数据,减少认知成本,快速传达信息。选中需要设置的可视化对象,上⽅就会出现“格式”功能区,可以设置需要的排列⽅式。整体⻚⾯的尺⼨、背景等元素通过画布设置来完成,单击画布的空⽩位置(不选择任何可视化对象),单击右侧的格式栏,就可以进⾏画布设置。⼀般情况下,同⼀个报表3〜5个图表最佳。
两种经典的布局⽅式。(1)切⽚器/导航栏放置在报表左侧(2)切⽚器/导航栏放置在报表上⽅。
制作完成报表之后,默认是适应计算机端的,为了使移动端查看时以适应移动设备的尺⼨来响应,可以制作移动⻚⾯布局,在“视图”中可以切换到移动布局导航篇
在Power BI中,导航⼀般是通过书签来实现的。⼀个分析报告,⼀般都有⼀个封⾯⻚,来统筹导航到各明细⻚。还有⼀种导航⽅式,不需要使⽤书签,只需要按钮。这是Power BI在2020年初新增加的功能,在⻚⾯左侧的导航栏插⼊三个按钮,单击插⼊的按钮,在操作类型中选择“⻚导航”,并设定跳转的⽬标⻚,利⽤按钮导航⽅式不需要单独建书签,制作起来更加便捷。第9章 P ower BI分析完整案例:从数据到可视化报告
利⽤⾃定义函数批量提取多个⽹⻚数据。List.Numbers是⼀个M函数,⽤于⽣成⼀列数据,第⼀个参数是初始值,第⼆个参数为⽣成数据的数⽬,第三个参数为数据间隔(如果忽略,默认为1)。List.Numbers(0,10,25)的意思是从0开始,后续的数字递增25,⽣成 10个数字。