数据架构师,想从事人工智能领域吗?这篇文章可以是一个很好的起点给你。


我的目标是提高读者的数据素养和智力。我撰写了几本行业白皮书、学术论文,并出版了该领域的技术书籍。


在本文中,我根据从许多成功和失败的项目获得的架构经验,对大数据管理生命周期提供了实用的架构概述,涵盖了不同的阶段和基本定义,并考虑了关键的解决方案。


我了解到,以严谨的态度务实地构建大数据解决方案生命周期,可以大大有助于提供高质量的人工智能 (AI) 和认知解决方案,尤其是在企业现代化和数字化转型计划中。这些变革性计划由大数据和 AI 授权,与其他新兴技术领域(例如云、边缘、物联网、区块链和移动技术)集成。


让我们记住本文中的上下文是 大数据架构师, 不是数据科学家 因此 前期,我希望读者从解决方案架构师的角度而不是从数据科学家的角度来回顾内容并理解关键信息。大数据架构师和数据科学家在大数据生命细胞中的角色完全不同,需要不同的参与。但是,我欢迎数据科学家的意见来扩展主题并突出他们对于大数据解决方案架构师的期望,因为这种扩展视图可以协同作用。


作为人工智能、认知计算和人工智能子集(如机器学习、深度学习、专家系统和神经网络)的关键推动者,大数据解决方案是全球一级以业务为中心的关键领域。因此,了解大数据生命周期和以务实的严谨性构建大数据解决方案,对于人工智能专业人员和 AI 业务利益相关者来说是一个极具吸引力的能力。


为了保持清晰度,我想从在高级别上定义数据架构开始。您可以在知识、教科书和用户生成内容的数据管理机构中找到数据架构的各种定义。


数据架构是数据科学学科的既定领域。在本文中,我会提供适合我预期消息的上下文、内容和目的的解释。在最高级别, 数据架构是利用已建立的框架和模型收集来自多个数据源的数据,并利用已建立的框架和模型从当前状态到未来状态操纵数据集、实践和平台的过程。


数据管理的架构框架包括描述源数据的结构、其操作过程以及未来使用的目标数据的结构,以便从数据解决方案中创建业务见解。建筑术语"描述"是此定义中的关键词:因此,构建数据解决方案需要理解。


建筑描述是指描述数据的收集、处理、存储、使用和存档方式的生命周期。大数据解决方案架构师可以承担从当前状态创建架构描述到目标状态的责任。


"操纵"一词也至关重要。它是指移动数据、更改数据结构、数据项目、数据组和数据存储的过程。操作过程还包括主要的建筑活动,如将数据人工制品集成到应用图景、通信、交互、数据流、分析、源和目标位置以及数据消耗配置文件。


让我们了解什么是大数据

一个重要的事实是,大数据无处不在。大数据不同于传统数据。主要区别来自数据生态系统中数据集的体积、速度、多样性、真实性、值和整体复杂性等特征。了解这些 V 字有助于深入了解大数据的本质。


大数据在行业和学术界有许多定义:然而,我同意的最简洁但最全面的定义来自 Gartner:"大数据是高容量、高速和高品种的信息资产,需要具有成本效益的创新信息处理形式,以便增强洞察力和决策能力"。此定义中唯一缺少的关键字是"真实性"。我还要补充一点,这些特征是相互关联和相互依存的。


让我提供这些 V 字的简要定义,这些 V 字是大数据域的新成员。


体积是指 TB、PETB 或外形数据集的大小或数量。但是,没有确定大数据卷阈值的具体定义。


速度是指生成数据的速度。大数据源生成来自实时设备(如手机、社交媒体、物联网传感器、边缘网关和云基础设施)的高速数据流。


品种是指多个数据源。数据源包括结构化事务数据、半结构化(如网站或系统日志)以及非结构化(如视频、音频、动画、图片)。


真实性意味着数据的质量。由于大数据中的体积和速度是巨大的,保持真实性可能非常具有挑战性。必须拥有高质量的输出,以便了解数据以获得业务见解。


以真实性为主要目的的大数据的价值。大数据解决方案的目标是创建业务洞察并获得业务价值。通过大数据解决方案的所有利益相关者的投入,可以通过创新和创造性的架构方法创建价值。


大数据的整体复杂性是指由于体积大、种类繁多、速度大以及创造所需业务价值所需的真实性,数据属性较多,难以提取所需价值。


尽管大数据在结构上与传统数据相似,但需要较新的方法和工具来处理这些特定特性。必须强调,传统方法和工具不足以处理大数据。


在此背景下,该过程是指从多个来源捕获大量数据,存储、分析、搜索、传输、共享、更新、可视化和管理大量数据,这些数据以 petab 字节甚至外形显示在相当大的商业组织中。


具有讽刺意味的是,大数据的主要关注点或目标不是数据量,而是更先进的分析技术,以从这些复杂而大量的数据中产生业务价值。在此背景下,高级分析是指描述性、预测性、规范性和诊断性分析等方法。


在最高级别上,描述性分析处理的情况,例如当前根据传入的数据发生的情况。预测分析是指将来可能发生的情况。规范性分析涉及要采取的行动。诊断分析询问了为什么会发生某些事情的问题。每个分析类型都提供不同的方案和使用案例。


数据逐层进行架构和管理

作为大数据架构师,我们使用自上而下的方法逐层启动解决方案描述。我们需要从建筑学的角度考虑三层:概念、逻辑和物理。


描述的第一层是 概念,代表业务实体的数据。


第二层是 逻辑,描述对象之间的关系。


第三层是 物理的,表示数据机制和功能。


现在,让我们来看看覆盖这些层的生命周期管理。


大数据生命周期管理概述

作为大数据解决方案的架构师,我们必须了解生命周期,因为我们作为技术领导者参与了生命周期的所有阶段。我们的角色和责任可能在不同的阶段有所不同:然而,我们需要从端到尾的视角来管理生命周期。


从架构解决方案的角度来看,根据我的经验和从行业出版物获得的输入,一个典型的大数据解决方案,类似于传统的数据生命周期,可以包括整体数据生命周期解决方案中的十几个不同的阶段。


大数据解决方案架构师参与生命周期的所有阶段,为每个阶段提供不同的输入并产生不同的输出。这些阶段可以在不同的数据解决方案团队中以不同名称实施。由于该领域仍在发展,因此对大数据生命周期没有严格的通用系统方法。传统数据管理的学习对于特定的解决方案使用案例进行了转移和增强。


为了提高对有抱负的大数据架构师的认识和指导目的,我提出了以下不同的阶段:


第一阶段:基础

第 2 阶段:收购

第 3 阶段:准备

阶段 4:输入和访问

第 5 阶段:处理

第6阶段:输出和解释

第 7 阶段:存储

第 8 阶段:集成

第 9 阶段:分析和维苏化

第10阶段:消费

第 11 阶段:保留、备份和存档

第12阶段:销毁

让我为您提供每个阶段的概况,并给出一些指导点。您可以根据大数据解决方案的要求和组织数据实践定制这些阶段的名称。关键是它们不是一石二箭之地。


第一阶段:基础

在数据管理过程中,基础阶段包括理解和验证数据要求、解决方案范围、角色和责任、数据基础设施准备、技术和非技术考虑以及理解组织中的数据规则等各个方面。


这一阶段需要由数据解决方案项目经理提供详细的计划,并从大数据解决方案架构师和一些数据领域专家那里获得大量投入。


大数据解决方案项目包括计划、资金、广告、资源、风险、假设、问题和项目定义报告中的依赖性等详细信息。项目经理编制和编写《PDR》;但是,此关键人工制品中的解决方案概述由大数据架构师提供。


第 2 阶段:数据采集

数据采集是指收集数据。数据集可以从各种来源获取。这些来源可以是商业组织的内部和外部来源。数据源可以以结构化形式传输,例如从数据仓库、数据市场、各种交易系统或半结构化源(如 Weblogs、系统日志)或非结构化源(如来自由视频、音频和图片组成的媒体文件)传输的数据源。


尽管数据收集由各种数据专家和数据库管理员进行,但大数据架构师在最佳促进这一阶段方面发挥着重要作用。例如,数据治理、安全性、隐私和质量控制从数据收集阶段开始。因此,大数据架构师在这一阶段采取技术和架构领导。


领先的大数据解决方案架构师与企业和业务架构师合作,领导并记录这一阶段的数据收集策略、用户要求、架构决策、使用案例和技术规范。对于大型商业组织的全面解决方案,领先的大数据架构师可以将其中一些活动委托给不同的领域架构师和数据专家。


第 3 阶段:数据准备

在数据准备阶段,收集的数据 (以原始格式) 被清理或清洗 - 这两个术语可互换地用于不同业务组织的不同数据实践。


在数据准备阶段,会严格检查数据是否不一致、错误和重复。冗余、重复、不完整和不正确的数据将被删除。目标是拥有干净和可使用的数据集。


大数据解决方案架构师为这一阶段提供了便利。但是,由于活动的粒度,大多数数据清理任务都可以通过接受数据准备和清洁技术培训的数据专家执行。


第 4 阶段:数据输入和访问

数据输入是指向计划的目标数据存储库、系统或应用程序发送数据。例如,我们可以将干净的数据发送到已确定的目的地,如 CRM(客户关系管理)应用程序、数据科学家的数据湖或供特定部门使用的数据仓库。在此阶段,数据专家将原始数据转换为可使用的格式。


数据访问是指使用各种方法访问数据。这些方法可以包括使用关系数据库、平面文件或 NoSQL。NoSQL 更相关,并广泛应用于各种业务组织的大数据解决方案。


即使大数据解决方案架构师领导这一阶段;他们通常将详细的活动委托给数据专家和数据库管理员,他们可以在此阶段执行输入和访问要求。


第 5 阶段:数据处理

数据处理阶段从处理原始数据形式开始。然后,我们将数据转换为可读格式,为其提供表单和上下文。此活动完成后,我们可以使用业务组织中选定的数据分析工具对数据进行解释。


我们可以使用常见的大数据处理工具,如哈杜普地图减少,伊帕拉,蜂巢,猪和火花SQL。在我大多数解决方案中,最常见的实时数据处理工具是 HBase,而近实时数据处理工具是 Spark 流。市场上有许多开源和专有工具。


数据处理还包括数据注释、数据集成、数据聚合和数据表示等活动。让我为你的意识总结一下它们。


数据注释是指给数据贴上标签。例如,一旦数据集被标记,它们就可以为机器学习活动做好准备。


数据集成旨在整合不同来源中存在的数据,旨在为数据消费者提供统一的数据视图。


数据表示是指数据的处理、传输和存储方式。这三个基本函数描绘了生命周期中数据的表示。


数据聚合旨在将数据库中的数据汇编到用于数据处理的合并数据集中。


在数据处理阶段,数据可能会根据消费者需求更改其格式。处理后的数据可用于数据湖、企业网络和连接设备中的各种数据输出。


我们可以使用各种工具(如火花 MLib、火花图形X 和其他几种机器学习工具)进一步分析用于高级处理技术的数据集。


大数据处理需要具有不同技能组合的不同团队成员的参与。虽然领先的大数据解决方案架构师引领了处理阶段,但大多数任务由数据专家、数据管理员、数据工程师和数据科学家执行。大数据解决方案架构师为这一阶段的端到端流程提供便利。


第 6 阶段:数据输出和解释

在数据输出阶段,数据的格式已准备好供业务用户使用。我们可以将数据转换为可使用的格式,如纯文本、图表、经过处理的图像或视频文件。


输出阶段宣布数据已准备好使用,并将数据发送到下一阶段进行存储。在这个阶段,在一些数据实践和业务组织中,也被称为数据摄入。例如,数据摄入过程旨在导入数据供立即使用或将来使用,或将其保留在数据库格式中。


数据摄入过程可以实时或批次格式。一些标准的大数据摄入工具,通常用于我的解决方案是Sqoop,Flume和火花流。这些都是流行的开源工具。


其中一项活动是解释摄入的数据。此活动需要分析摄入的数据并从中提取信息或意义,以回答与大数据业务解决方案相关的问题。


第 7 阶段:数据存储

完成数据输出阶段后,我们将数据存储在设计和指定的存储单元中。这些单元是数据平台和基础设施设计的一部分,考虑了所有非功能性建筑方面,如容量、可扩展性、安全性、合规性、性能和可用性。


基础设施可以包括存储区域网络 (SAN)、网络连接存储 (NAS) 或直接访问存储 (DAS) 格式。数据和数据库管理员可以管理存储的数据,并允许访问定义的用户组。


大数据存储可以包括基础技术,如数据库集群、关系数据存储或扩展数据存储,例如作为开源系统的 HDFS 和 HBASE。


此外,文件格式(如文本、二进制格式或其他类型的专业格式(如序列、Avro 和 Parquet)必须在数据存储设计阶段进行考虑。


第 8 阶段:数据集成

在传统模型中,一旦存储数据,就会结束数据管理过程。但是,对于大数据,可能需要出于各种目的将存储的数据集成到不同的系统中。


数据集成是大数据解决方案过程中一个复杂而重要的架构考虑因素。大数据架构师致力于设计和设计各种数据连接器的集成大数据解决方案。根据解决方案中使用的数据源,许多连接器(如 ODBC、JDBC、Kafka、DB2、亚马逊 S3、Netezza、Terradata、甲骨文等)可能会有使用案例和要求。


某些数据模型可能需要将数据湖泊与数据仓库或数据市场集成。大数据解决方案也可能有应用程序集成要求。


例如,某些集成活动可能包括将大数据与仪表板、Tableau、网站或各种数据可视化应用程序集成。此活动可能与下一阶段重叠,即数据分析。


第 9 阶段:数据分析和可视化

集成数据对于数据分析和可视化非常有用且富有成效。


数据分析是大数据管理流程的重要组成部分。这一阶段至关重要,因为这是从大数据解决方案获得业务价值的地方。数据可视化是这一阶段的关键功能之一。


我们可以根据解决方案的要求,使用许多生产力工具进行分析和可视化。在我的大数据解决方案中,最常用的工具是 Scala、Phyton 和 R 笔记本。Phyton 被选为最有成效的工具,几乎触及数据分析的所有方面,特别是增强机器学习主动权。


在您的业务组织中,可以有一个由首席数据科学家领导的团队负责数据分析。大数据解决方案架构师在这一阶段的作用有限,但他们与数据科学家密切合作,确保分析实践和平台与业务目标保持一致。大数据解决方案架构师需要确保以建筑的严谨性完成生命周期的阶段。


第 10 阶段:数据消耗

一旦进行数据分析,数据就会变成内部或外部用户(包括业务组织的客户)随时可以使用的信息。


数据消耗需要为政策、规则、法规、原则和指南提供架构输入。例如,数据消耗可以基于服务提供过程。数据治理机构为提供服务制定法规。


领先的大数据解决方案架构师使用业务组织中选定的架构框架领导并协助创建这些政策、规则、原则和准则。


第 11 阶段:保留、备份和存档

我们知道,关键数据必须备退以保护并满足行业合规要求。我们需要使用既定的数据备份策略、技术、方法和工具。大数据解决方案架构师必须识别、记录并获得保留、备份和存档决策的批准。


大数据解决方案架构师可能会将此阶段的详细设计委托给由多个数据、数据库、存储和恢复领域专家协助的基础设施架构师。


出于监管或其他业务原因的某些数据可能需要在一定时间内存档。数据保留战略必须由理事机构(尤其是企业建筑师)记录和批准,并由基础设施架构师和存储专家实施。


第 12 阶段:数据销毁

在一定时间后,可能会有破坏特定类型数据的监管要求。要求可能会根据商业组织所属的行业而更改。


即使生命周期管理有按时间顺序排列,用于生成大数据解决方案,某些阶段可能略有重叠,可以并行完成。


本文中提出的生命周期只是认识整个过程的准则。您可以根据数据解决方案团队的结构、独特的数据平台、数据解决方案要求、使用案例以及所有者组织、其部门或整个企业生态系统的动态定制流程。


现在,我们概述了生命周期阶段,让我来了解并提供对大数据解决方案组件的高级别了解。


大数据解决方案组件

大数据解决方案架构从对大数据过程的了解开始。了解解决方案组件可以帮助我们,而其他利益相关者可以看到大数据过程的大局。我们可以将大数据过程分为两大类。第一个是数据管理,第二个是数据分析。


数据管理包括生命周期中描述的多种活动,如数据采集、提取、清理、注释、处理、集成、聚合和表示。


数据分析包括数据建模、数据分析、数据解释和数据可视化等活动。


作为大数据解决方案架构师,我们需要了解生命周期中的关键组件,如数据类型、原理、平台、质量规范、治理、安全、隐私、分析、语义、模式、数据湖泊、数据沼泽和传统数据仓库概念。


这些都是基本原理,并且可能还有其他几个组件基于解决方案使用案例和用户要求。


让我简要地提及数据类型,作为构建大数据解决方案以提高您的意识的基本考虑因素。


数据类型

我们可以将数据类型分类为结构化、半结构化和非结构化。结构化数据传统上管理良好,相对简单,对整体数据管理流程来说不是大问题。


然而,挑战与半结构化有关,更重要的是与非结构化数据打交道有关。这两个因素是大数据解决方案的关键考虑因素。这两种数据类型可以在获取所需信息并将其用于业务洞察时增加实际业务价值。


半结构数据的主要问题是此类数据不符合标准。我们可以使用 XML(可扩展标记语言)实现半结构化数据。XML 是一种在万维网上交换数据的文本语言。XML 使用用户定义的数据标签,这些标签可以使它们成为机器可读的。


单击流数据是半结构化数据的另一个示例。例如,此类数据向网上商店提供有关用户行为及其浏览模式的综合数据集。此数据类型广泛且与大数据分析相关,可生成业务见解。


非结构化数据是文本分析的关注点,旨在从文本数据中提取所需的信息。一些文本数据示例是社交网站上的博客、文章、电子邮件、文档、新闻和其他形式的内容。


文本分析可以包括计算语言学、机器学习和传统的统计分析。文本分析侧重于将大量机器或人工生成的文本转换为有意义的结构,以创建业务见解和支持业务决策。


我们可以使用各种文本分析技术。例如,信息提取是从非结构化文本中提取结构化数据的文本分析技术之一。


文本摘要是一种常见的技术,可以自动创建文档或选定文档组的浓缩摘要。这种技术对于博客、文章、新闻、产品文档和科学论文特别有用。


NLP(自然语言处理)是一种复杂的文本分析技术,以自然语言作为问答。NLP 常用于消费产品,如苹果的 Siri 和亚马逊的 Alexa。


最近不断增长的文本分析技术之一是情绪分析。它旨在分析人们对个人、出版物、产品或服务的看法。这通常用于营销目的。情绪分析的一个例子是使用微博网站Twitter。我们可以分析大量的推文,以获得积极,消极或中立的情绪为商业产品或服务。


除了文本分析外,人类语音中还分析非结构化数据。这在某些数据管理出版物中称为语音分析或音频分析。呼叫中心通常使用人工语音来提高客户满意度并满足特定的监管要求。


另一个非结构化数据分析是图片和视频内容分析。这些还处于起步阶段,但有一种趋势,即创建新技术来分析视频的照片和内容,以获得信息洞察。机器学习和深度学习领域对这类分析有着重大的关注。


由于视频的大小相对较大,这不像文本分析那么简单。视频内容分析的关键业务应用之一是在闭路电视摄像机、自动安全性和监控系统生成的数据中常用的安全领域。


让我从建筑角度简要地提及数据原则。


数据原则

数据管理流程需要考虑既定原则。理事机构制定了国家或地理级别原则。例如,最受欢迎的是 GDPR(一般数据保护法规)和 CCPA(加州消费者隐私法)。


近年来,GDPR在媒体上变得格外受欢迎。GDPR 是欧盟法律中关于欧盟和欧洲经济区所有公民个人数据保护和隐私的法规。


为了让您了解数据管理原则,GDPR 提供了以下七项原则。这些原则听起来具有普遍性,因为它们在数据管理出版物中被广泛重复。


1. 合法性、公平性和透明度

2. 目的限制

3. 数据最小化

4. 准确性

5. 存储限制

6. 诚信和保密

7. 问责制

我们不需要在这里详细了解每个原则,因为它们可以从 GDPR 站点进行审核。这些原则是常识,数据专业人员可以直截了当地理解这些原则。


这些原则涵盖了组织中数据管理的重要方面。作为大数据架构师,我们需要考虑这些原则,并将它们应用于我们的大数据解决方案治理模式。


除了数据管理政策、流程、程序和准则之外,我们组织的理事机构还可能制定了原则。我们的大数据解决方案治理模式必须纳入这些原则。


数据质量规范

数据质量对于建筑、技术、治理、安全、合规和用户消费目的的数据使用最终目标至关重要。数据规格质量的提高可以为大数据解决方案带来更好的结果。


作为大数据架构师,我们必须考虑关键数据质量因素,如数据元素 完整、独特、当前和符合.数据质量规范可以使用系统生成的报告、审核和用户提出的问题来制定。


数据质量的完整性是指确保数据管理过程的生命周期中提供必要的数据元素。


数据的独特性是指没有数据元素的重复。


数据货币是指最新的。过时的数据毫无意义,也毫无用处。


此外,我们需要确认数据元素是针对其域的。


大数据质量可以通过相关数据源、优化分析模型来衡量,并取得有利结果,转化为企业的数据消费者体验和盈利能力。这些结果可能是有形的或无形的。


大数据解决方案的另一个重要方面是了解数据平台。


大数据平台

每个大数据解决方案都需要一个特定的平台。大数据平台由多个层组成。大数据平台的第一层是共享的操作信息区,由动态数据、静止数据和若干其他形式的数据等数据类型组成。它包括旧数据源、新数据源、主数据集线器、参考数据集线器和内容存储库。


数据平台的第二层称为处理。这一实质性层包括数据摄入、操作信息、着陆区域、分析区、存档、实时分析、勘探、集成仓库、数据湖泊、数据市场区域。此层需要有元数据目录的治理模型,包括数据安全和系统灾难恢复、存储和托管以及其他基础设施组件,如本地处理和存储以及云处理和存储。


数据平台的第三层是分析平台。它由实时分析、信息规划、预测、决策、预测分析、数据发现、可视化、仪表板和其他分析功能等功能、流程和工具组成,这些功能是特定大数据解决方案所要求的。


数据平台的第四层由业务流程、决策方案和交互点等输出组成。数据平台的这一层也需要得到很好的管理,并且需要为数据平台专业人员(如数据科学家、数据架构师、分析专家和业务用户)提供既定的控制。


数据平台的架构级别是一个关键的架构考虑因素。我们可以将架构级别分为三类,如无架构、部分结构化模式和全结构型模式。架构反映了数据和数据库的结构。我们可以将架构视为数据管理的蓝图。


没有模式的一些示例是视频、音频和图片文件:社交媒体源、部分模式(如电子邮件、即时消息日志、系统日志、呼叫中心日志);和高模式可以结构化传感器数据和关系交易数据。


数据处理级别是其他架构考虑因素。处理级别可以是原始数据、经过验证的数据、转换的数据和计算的数据。


数据平台中数据的其他结构分类与业务相关性相关。我们可以将数据的业务相关性分为外部数据、个人数据、部门数据和企业数据。


让我来谈谈大数据治理,因为这是最重要的架构考虑之一。


大数据治理

数据治理是大数据解决方案的关键因素。大数据治理系统需要考虑关键因素,如安全性、隐私性、信任性、可操作性、一致性、敏捷性、可用性、创新和数据转换。这些因素可能导致大数据解决方案架构师的相互竞争。例如,创新和整合处于光谱的两个不同方面,因此需要关键的建筑权衡。


在基本层面上,数据治理基础设施的建立和演变也至关重要,不仅在方案解决方案级别,而且在企业层面都采用。我们需要与企业架构师密切合作,解决数据治理问题。


数据治理可以考虑不同数据平台中的不同利益相关者。例如,数据架构师负责开发大数据模型的治理:数据科学家负责分析的治理。业务利益相关者负责管理业务模式,为相关数据平台生成业务结果。


大数据治理领域广泛,涵盖数据组件、范围、要求处理、战略、架构决策、设计、开发、分析、测试、处理、实施、利益相关者关系、投入、产出、业务目标、业务见解以及数据管理和分析流程的其他几个方面。


最后,我想从架构角度谈谈商业词汇对于大数据解决方案的重要性。


商务词汇

业务词汇是数据管理流程的一个关键方面。我们必须定义业务词汇,以保持对与业务分析相关的大数据的共同理解。商务词汇在某些方法中也称为商业词汇表,可以根据组织层面的各种因素进行定制。


业务词汇描述了数据模型支持的业务内容。 更重要的是,从建筑学的角度来看,这个词汇 可以是元数据目录的关键输入。


业务词汇提供一致的术语,由整个组织使用。在许多组织中,业务部门拥有业务词汇。通常,在许多组织中,商业用户保持这种词汇:然而,企业建筑师和大数据解决方案架构师领导和促进企业词汇的管理。


结论

在本文中,我提供了大数据解决方案生命周期的高级别视图和快速介绍,强调在开发业务解决方案时建筑的严谨性。大数据解决方案是人工智能 (AI) 的关键成功因素。我有足够的信心作出大胆的声明, 如果不设计具有系统严谨性、快速实用的方法构建大数据解决方案,就不可能产生有效、竞争和可持续的 AI 解决方案。


AI 解决方案在很大程度上依赖于 数据的体积、速度、多样性和真实性.大数据解决方案围绕处理这四个关键 V 特性以及生成 市场洞察和商业价值.


我在一本名为《企业建筑师的大数据》的最新著作中分享了我的大数据解决方案体验。向企业架构师介绍大数据解决方案架构师的关键作用,让他们了解该主题对快速变化的业务组织的影响和影响,这些影响和影响反映在实用和敏捷的环境中,而不是教科书中提供的传统观点和理论方法。


我计划在我即将发表的文章中涵盖人工智能数据管理实践和从认知转化计划中吸取的相关经验。同时,您为扩展本文中我提供的范围而提供的输入可能是有用和协同的。


我的目标是提高读者的数据素养和智力。

如何处理人工智能的大数据?

上一篇:【科普解答】乐鱼leyu体育官网: 什么叫人工智能、大数据? 下一篇:科普:乐鱼leyu体育官网: 大数据在疫情防控方面有什么作用

Copyright © 2024 乐鱼leyu创新科技有限公司 All Rights Reserved      豫ICP备19030965号    网站地图