微软推出一个称为Fabric的端到端统一分析平台,其整合了各种资料和分析工具,将Azure Data Factory、Azure Synapse Analytics和Power BI技术都汇集到同一个平台中,并且以多云资料湖OneLake储存分析服务需要用到的所有资料。
微软强调Fabric是一个完整的分析平台,所有资料分析专案需要用到的工具,全部被整合到同一个产品。Fabric针对团队中不同的角色,提供特定的功能体验,因此资料工程师、资料科学家甚至是业务,都能够以熟悉的工作方式使用Fabric。Fabric的核心工作负载包括Data Factory、Synapse Data Engineering、Synapse Data Warehousing、Synapse Real-Time Analytics和Power BI等。
这些核心工作负载需要用到的资料,皆来自多云资料湖OneLake,微软解释,这样的概念就与Microsoft 365应用程式都会连接到OneDrive相同,资料会在同一处被组织并自动索引,供後续探索、共享、治理、法遵目的使用。
每个Fabric租户皆使用OneLake,以避免因不同使用者配置产生资料孤岛,OneLake向所有用户提供统一的储存系统,并且统一应用策略和安全配置,进而使资料能够更简单地探索和共享。
在API层,OneLake建立在Azure Data Lake Storage Gen2(ADLSg2)之上,因此可接上ADLSg2既有的应用程式、工具和开发人员生态系。OneLake有一个称为Shortcuts的重要功能,能够虚拟化ADLSg2、Amazon S3和Google云端储存的资料湖,供开发人员跨云组合和分析资料,并让用户和应用程式更简单地共用资料。
OneLake采用以Parquet为基础的开源档案格式Delta,而这也是Fabric所有工作负载预设使用的格式,因此一旦资料被载入到OneLake中,所有工作负载就可直接操作该资料,不需要执行额外的撷取工作。
Fabric还对OneLake应用通用安全模型,所有引擎在处理查询和执行任务时,都将统一受该模型控制。Fabric大量整合Azure OpenAI服务Copilot,使用户可以透过自然语言,创建资料流和资料工作管线,甚至生成程式码和建置机器模型等工作。