什么是MaxCompute:
大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案。
当今社会数据收集手段不断丰富,行业数据大量积累,数据规模已增长到了传统软件行业无法承载的海量数据(百TB、PB、EB)级别。MaxCompute致力于批量结构化数据的存储和计算,提供海量数据仓库的解决方案及分析建模服务。
由于单台服务器的处理能力有限,海量数据的分析需要分布式计算模型。分布式的计算模型对数据分析人员要求较高且不易维护:数据分析人员不仅需要了解业务需求,同时还需要熟悉底层分布式计算模型。MaxCompute为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和维护细节,便可轻松完成大数据分析。
什么是数据质量:
数据是组织最具价值的资产之一。企业的数据质量与业务绩效之间存在着直接联系,高质量的数据可以使公司保持竞争力并在经济动荡时期立于不败之地。有了普遍深入的数据质量,企业在任何时候都可以信任满足所有需求的所有数据。
数据优势:
降低成本更高效地运作提高 IT 部门工作效率降低风险如何使用MaxCompute进行数据质量核查:点击这里
(数据质量问题一直是大数据分析系统关注的重点,如何发现数据质量问题,提升数据质量,一直是各生产及业务系统的追求点。通过此课程,可迅速掌握发现数据质量问题的方法,解决数据质量问题)
课程主要内容:
数据质量基本介绍介绍什么是数据质量,数据质量对于数据分析、应用的重要性。
数据质量影响因素介绍可能会影响到数据质量的因素,以及这些因素分别会如何影响数据质量。
数据质量问题类型常见的数据质量问题的类型,以及各自的特点和影响。
阿里云相关产品介绍介绍本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
阿里云相关产品基本操作演示演示本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
电商分析平台数据质量核查介绍项目背景、项目实施流程以及其中的关键步骤和技术。
【在线实验】MaxCompute 数据质量核查本实验通过MaxCompute对一家销售公司的经营数据进行监控,并最终输出数据质量监控报告。