欢迎来到我们的博客部分

{{brizy_dc_image_alt imageSrc=
{{brizy_dc_image_alt entityId=
我们此前已经探讨过许多现实案例,展示了各类组织如何通过特定的数据湖工具从中获益良多。 数据湖市场规模的迅速扩张,有力地证明了其对各类企业所具备的巨大实用价值。2019年,全球数据湖市场规模已达37.4亿美元;据预测,到2025年,这一数字有望攀升至176亿美元。 鉴于数据湖工具正变得日益重要,接下来让我们一同深入了解并剖析市场上的一些顶尖解决方案。 部分最佳数据湖解决方案 Azure Data Lake Storage Azure Data Lake Storage 旨在为您的数据构建一个统一的单一存储空间。它不仅能高效地实现这一目标,还能有效控制您的成本。 您将获得先进的安全功能,以及完善的数据身份验证机制;同时,数据访问权限将严格限定于特定的角色。 以下是 Azure Data Lake Storage 的一些关键特性: AWS Lake Formation AWS Lake Formation 自诩为构建数据湖最简便的解决方案之一。 鉴于 AWS Lake Formation 隶属于 AWS 的整体生态体系,因此它与基于 AWS 的分析及机器学习服务能够实现极其便捷的集成。 了解 AWS Lake Formation 的几项关键特性: AWS Lake Formation 定价信息: 使用 Lake Formation 服务本身没有明确的费用。它作为一项附加服务,可用于 AWS Glue、S3、Amazon EMR、Amazon Athena 和 Amazon […]
{{brizy_dc_image_alt entityId=
在资源管理领域,我们经常会遇到两个术语——CMDB 与资产管理。那么,企业究竟该作何选择?尽管这两个系统都旨在追踪企业的资源,但它们在运作方式上却存在着显著差异。 CMDB 与资产管理:差异详解 对于任何企业而言,资产与基础设施的管理通常都是其运营工作中的一个重要环节。这些资产既可以是软件,也可以是硬件。 随着企业规模的不断扩大,对公司内部现有的各类资源进行记录与追踪,其复杂程度也随之增加。一旦管理不善,轻则可能导致不必要的开支,重则可能因资源短缺而引发种种不便。 无论属于上述哪种情况,企业的整体运营效率都将受到阻碍。因此,对于任何组织而言,对自身资源进行妥善管理都具有至关重要的意义。 在探讨资源管理这一话题时,我们往往会遇到两个常用术语——即“资产管理”与“配置管理数据库”(CMDB)。 资产与配置项:二者是否相同? 让我们来探讨一下资产与配置项之间的区别。 “资产”一词泛指任何对公司具有财务价值的实体对象。而“配置项”(CI)则特指那些为提供各类服务所必需的实体对象。 一台服务器既可以被视为资产,也可以被视为配置项。作为资产,该服务器拥有诸如品牌、型号、内存容量、操作系统等属性;而作为配置项,它则具备所有权归属、保修信息、采购日期等属性。 凡是需要进行财务监控的配置项,均可被认定为资产。 什么是 CMDB? CMDB 负责存储和管理有关配置项(CI)的信息。为了提供特定的服务,这些配置项必须得到有效的管理与控制。 CMDB 中存储的信息涵盖了所有权、版本、类型等各类属性。凡是涉及配置项维护工作,或其过往经历的任何相关信息,均会被收录于 CMDB 之中。 此外,CMDB 还存储着各类配置项之间可能存在的相互关联信息。 什么是资产管理? 资产管理是一个比 CMDB(配置管理数据库)更为宽泛的概念。IT 资产管理涵盖了资产从始至终的整个生命周期管理过程。 IT 资产管理所涉及的对象,包括所有对公司具有财务价值的实体。具体而言,它主要负责管理那些会对企业产生业务或财务影响的资产——例如,各类合同、发票等。 CMDB 与资产管理:快速对比 正如定义所示,资产管理主要处理任何对象或资产的财务相关事宜;而 CMDB(配置管理数据库)则负责监督配置项的管理工作。 资产管理对资产进行全程追踪,涵盖从资产购置之初直至最终处置的全过程。它负责管理资产的整个生命周期。 相比之下,CMDB 本身并非一种特定的流程,而是一个系统——它将所有与对象、资产或配置项(CI)相关的信息集中存储于一处。 由于 CMDB 需要追踪与资产相关的各类问题及使用状况,因此它通常会与变更管理系统进行集成。另一方面,资产管理系统则通常与采购系统或 ERP 系统进行集成。 简而言之,资产管理是一项流程,而 CMDB 则是一种工具。不过,这两个系统都具备追踪配置历史记录的功能。 CMDB 所能产生的最大价值主要体现在满足 IT 部门的需求上。因此,对 CMDB 进行定期的维护至关重要。否则,陈旧的数据将无法提供准确的结果,进而可能给组织带来损害。 相比之下,IT 资产管理(ITAM)对于非 IT 部门的人员而言更具实用价值。他们利用这些数据来生成各类报告,以供组织内部使用。 这些报告通常包含关于资产的各类信息。此外,它们还会具体说明这些资产在帮助公司创造营收方面发挥了何种作用,或者在纯粹的财务支出层面给公司带来了多少成本。 […]
{{brizy_dc_image_alt entityId=
CDP与DMP在数据管理中的重要性 现代营销完全依赖于数据的质量与真实性。因此,企业自然而然地会借助于诸如客户数据平台(CDP)、数据管理平台(DMP)以及客户关系管理(CRM)平台之类的工具。 这些平台能够提供以客户为中心、由数据驱动的深度洞察,从而助力企业打造极具成效的营销活动。此外,这些洞察还有助于企业依据受众的互动指标,对目标受众进行精准细分。 它们还能极大地简化潜在客户的评分与培育工作。 本篇博文旨在明确区分CDP与DMP的关键要素。同时,我们还将探讨这些工具所带来的核心价值与优势。 我们相信,通过了解这些工具的差异化特征及其所带来的助益,您将能够依据自身的具体需求,做出最恰当的选择。 CDP 与 DMP:关键差异点 CDP 与 DMP 的主要目标 CDP 的主要目标是维护品牌忠诚度,并提升品牌在订阅用户群体中的形象价值。其终极目标在于通过现有客户创造更多业务收益。 营销人员常利用 DMP 来提升用户互动水平及客户转化率。从长远来看,使用 DMP 的最终目的在于降低客户获取成本。 CDP 与 DMP 的运作模式 CDP(客户数据平台)旨在提供一套系统,能够跨越所有营销工具,对贵公司的真实客户数据进行全面管理。CDP 的运作流程涵盖了客户数据的收集、在各类工具中的数据应用,以及简化整个数据管理过程。 另一方面,DMP(数据管理平台)的设计初衷则是为了服务于广告网络。这类平台会将数据库划分为第一方、第二方和第三方数据库,并据此对数据进行分类管理。 这使得营销人员能够准确判定潜在客户(Leads)在整个生命周期中所处的阶段;同时也协助他们依据这些阶段特征,实施精准的广告投放。 CDP 与 DMP 的关键关注点对比 众所周知,数据库主要分为三种类型:第一方数据库、第二方数据库和第三方数据库。 CDP(客户数据平台)主要处理第一方数据库,负责收集并归类订阅者、购买者及/或用户等群体的各类信息。 另一方面,DMP(数据管理平台)则主要侧重于第三方数据库。它通过 Cookie、像素追踪、IP 地址等技术手段进行运作。 鉴于此类数据库往往涉及隐私问题,因此对于 DMP 而言,其所处理的数据库通常是匿名的。 CDP 与 DMP 的用户画像匹配类型对比 画像匹配主要分为两大类,即: CDP(客户数据平台)使用的是第一方数据库(包含订阅者、用户、客户等数据)。因此,它掌握了关于用户的全部相关信息。这些信息涵盖了各类可识别及个性化的字段,例如用户的名字、电子邮件地址等。 营销人员可以利用这些信息进行确定性匹配,从而向用户推送个性化的内容。 相比之下,由于 DMP(数据管理平台)使用的是第三方数据库,且涉及用户的匿名性,因此营销人员在操作时往往需要进行大量的推测。借助 DMP,营销人员可以通过“重定向”(Retargeting)的方式投放精准的目标广告。利用 Google Ads 对受众进行追踪,便是 DMP 应用的最佳范例。 […]
{{brizy_dc_image_alt entityId=
负载均衡是指将流入的流量合理地分配至一组服务器上。通过这种方式,可以确保没有任何一台特定的服务器因负载过重而瘫痪,从而使各服务器均能以最高效率运行。 而“负载均衡即服务”(Load Balancer as a Service)则是指通过第三方服务提供商,在云端获取并使用这项服务。 负载均衡即服务 (Load Balanced as a Service) 的工作原理是什么? 负载均衡即服务意味着服务提供商会使用预先设定的模式来分配流量负载。 应用程序或 Web 浏览器会收到来自用户的请求,并尝试连接到服务器。 此时,负载均衡器会按照预设的模式将此请求转发到合适的服务器。 然后,服务器也会在负载均衡器的帮助下将响应返回给浏览器(或应用程序)。 负载均衡器还会承担解密 SSL 加密数据的计算密集型过程。 负载均衡即服务的优势 1. 成本效益高 作为一项服务提供的负载均衡解决方案,其成本通常低于处理入站流量的传统方法。 除了价格更实惠之外,它的实施过程也更为简便。 2. 稳定性增强 基于云平台运行的负载均衡服务,为处理应用程序或网站流量提供了一种更为稳定的解决方案。 云环境使其能够更加轻松、灵活地将流量重新分配至不同的服务器和设备上。 3. 业务连续性 对于任何企业而言,确保网站或应用程序始终保持正常运行至关重要。 在某些特定情况下(无论出于何种原因),服务器可能会发生故障;此时,负载均衡器便能发挥极大的作用。 负载均衡器能够迅速将负载切换至其他正在运行的服务器上。 主要的负载均衡即服务(LBaaS)提供商 1. Cloudflare Cloudflare 的负载均衡解决方案已覆盖全球 200 多个城市。这一覆盖范围可谓极其广泛。 该解决方案基于 DNS 架构运行,并具备抵御 DDoS 攻击的能力。 Cloudflare 负载均衡解决方案的各项关键特性: a) 它持续执行健康检查,以识别那些可能无法有效处理当前流量负载的服务器组。 b) 您可以详细了解具体是哪组服务器的利用率最高,并据此调整您的基础设施配置需求。 c) […]
{{brizy_dc_image_alt entityId=
数据湖的最佳应用场景之一是作为组织最重要的数据来源,因为它能够从各个垂直领域摄取数据。这些数据可以是结构化的,也可以是非结构化的。 如果您想对不同的数据集进行研发,数据湖中数据的原始特性将非常有用。 这种统一的数据视图有助于您更好地理解数据,从而筛选出更合适的数据。 许多云巨头,例如 AWS 和 Microsoft Azure,都提供数据湖服务,并为其客户在数据管理方面带来了显著优势。 我们将通过数据湖的应用及其对不同组织的优势来了解其应用场景。 数据湖的主要应用场景有哪些? 1. 3Victors 利用 AWS 聚合其快速增长的旅行数据 3Victors 从遍布全球各地的众多预订系统中收集数据。 不久之后,其原生数据存储单元的容量就已告罄。此外,3Victors 还致力于为营销人员提供实时旅行洞察。 面对这两大挑战,3Victors 迅速意识到云计算是未来的发展方向。他们采用了 AWS 解决方案,将数据存储在数据湖中。 AWS 数据湖解决方案确保 3Victors 能够处理来自各种平台的超过 2300 亿条已定价的行程信息。 2. Azure 帮助 Grupa Pracuj 处理海量数据,并满足所有必要的合规性和安全措施。 在线招聘服务提供商 Grupa Pracuj 一直处于中东欧新兴就业市场的前沿。Grupa Pracuj 需要打造一套定制化的求职方案。 与此同时,它还必须遵守 GDPR 和其他个人数据处理政策。 Grupa Pracuj 与合作伙伴 TIDK 和 Beyond.pl 携手合作,利用 Azure 的数据湖和其他服务。 TIDK 的首席执行官承认,Azure […]
{{brizy_dc_image_alt entityId=
业务流程重组 (BPR/BPRE) 业务流程重组 (BPRE) 是一种业务管理策略,旨在通过对业务流程进行重构,提升产品或服务质量并降低长期成本。 这项业务策略需要进行业务和工作流程分析,以识别并消除流程中的冗余环节。 业务流程管理 (BPM) 业务流程管理 (BPM) 是指制定工作流程的监督和维护策略,以提升现有业务流程和组织的整体效率。 BPM 是一系列常规且长期的流程,是企业所有业务流程的基石。 通过以下流程持续管理和改进公司整体业务流程: 业务流程重组 (BPR) 和业务流程管理 (BPM) 的相似之处 BPR 和 BPM 都通过多个步骤来提高流程效率。 它们都经历一些相似的业务流程,例如了解现有方法、识别、评估和分析。 BPR 和 BPM 的主要目标是提高业务流程的速度和质量。 这两个流程都致力于在组织内顺畅运行工作流程的同时降低成本。 BPR 和 BPM 的区别 尽管存在上述相似之处,但它们的核心功能却大相径庭。诚然,在某种程度上,业务流程重组 (BPR) 可以被视为业务流程管理 (BPM) 的一个独立组成部分或后续步骤。 然而,BPR 策略旨在提升工作流程中特定流程/步骤的效率和生产力。与此同时,BPM 则是一项着眼于整个工作流程管理的长期策略。 业务流程重组 (BPR) 和业务流程管理 (BPM) 绝不应被视为相似或相互替代。 业务流程重组与业务流程管理(表格形式) 业务流程重组 (BPR)业务流程管理 (BPM)采用全新方法重构流程。致力于监控和维护当前状态。识别并消除冗余流程。不会直接舍弃业务流程中的任何流程。采用跨职能、更具战略性的方法。采用严谨的管理方法。通过设计未来状态的流程来提高运营效率。BPR 的主要目的是重新创建流程。BPM 不会重新设计和创建组织工作流程中的任何业务流程。逐个处理流程。目标是找到更优的方法并获得更好的结果。采用一致的方法同时处理一组业务流程。任何协作都取决于具体情况。更有效地协调和整合人力资源和 IT 资源。迭代绝不可行。如果流程进行 BPR […]
{{brizy_dc_image_alt entityId=
智能字符识别(ICR)本质上是一种先进的光学字符识别(OCR)技术,旨在弥补传统OCR系统在处理各种文本解释问题方面的不足。 ICR是一种基于人工神经网络的常用文档管理系统(DMS)技术,用于识别和解读手写文字。 智能字符识别(ICR)的工作原理和优势 智能字符识别(ICR)可以通过其人工神经网络识别各种新的手写字体和样式,从而使系统能够通过每次学习经验进行自我学习。 这意味着每次 ICR 接触到新的数据类型时,它都会自动升级其识别数据库。随着数据集的积累,人工神经网络有助于系统进行预测。 借助人工神经网络,系统无需重新编程。此外,它还可以通过一组间接且复杂的数据库,改进高级光学字符识别(OCR)软件在缺失数据积累和预测方面的能力。 因此,每次运行时,人工神经网络都会将新数据与旧数据进行比较,并根据之前的格式和样式进行学习,从而达到最佳的准确率。提供的内容越多,神经网络就越精确。 ICR 首先确定一般模式,而不是识别相应的字符。 由于该过程需要通过处理多种不同的手写体来获取知识进行识别,因此在某些情况下,准确率可能并不理想。 系统使用多个读取引擎来不断提高其字母数字识别率。 ICR 与现代技术的应用 与人工智能和机器学习技术的集成使智能字符识别 (ICR) 系统能够持续优化自身,以识别结构化和非结构化的字母数字和草书手写体。 因此,智能字符识别系统已被广泛应用于多种平台和现代技术,例如机器人流程自动化 (RPA) 和光学标记识别 (OMR),以优化工作流程。 ICR 软件是电子归档(电子文档管理系统或 EDMS)和文档管理软件 (DMS) 的绝佳补充,因为它与这些系统的设计理念相辅相成。 正如 ICR 本质上是 OCR 的扩展版本一样,ICR 也有其自身的演进版本,称为 IWR。 IWR 代表智​​能单词识别,它能够识别完整的单词或短语,这与传统的 ICR 不同,传统的 ICR 只能识别印刷字符和手写文本。 IWR 的最佳应用场景是扫描和识别不受限制的手写内容。 通过结合 OCR 和 IWR 技术,企业可以简化和加速多种类型表格和文档的数字化和转录过程。 最佳智能字符识别 (ICR) 工具和软件 A2iA Mitek 数字身份验证解决方案公司 Mitek Systems […]
{{brizy_dc_image_alt entityId=
在深入了解数字资产管理之前,让我们先来了解一下数字资产。数字资产是指照片、视频、徽标、产品图片、音频、动画、创意文件、演示文稿以及其他与媒体相关的文件。 对于某些组织而言,这些文件并非普通文件,而是最具价值的资产。因此,为了集中管理这些文件,就需要使用数字资产管理工具。 数字资产管理系统(DAM)是一个用于存储、组织、共享、检索、管理数字版权并授予数字资产访问权限的系统。 它就像一个包含丰富媒体文件的宝库,需要更加细致的维护和更高的安全性。 接下来,我们将深入探讨数字资产管理的工作流程,以便从根本上理解整个流程。 数字资产管理的整个工作流程解释 数字内容创作 数字资产需要编码和解码才能创建。要在 DAM 系统中创建产品,必须首先将数据对象带入数字域。 无论如何,DAM 工具及其支持系统提供了大量服务,通过摄取内容和图形用户界面来创建数字文件。 内容创建也标志着 DAM 流程的第一步。 数字资产元数据 DAM 系统还可以使用元数据增强您的媒体文件。因此,您可以命名文件(标题)及其描述、修改日期、位置、原始创建日期、文件大小、编码、打包、访问权限等。 此过程也称为元数据管理。 此功能为用户提供了杠杆作用。让我们通过一个例子来理解这一点。 如果您在 DAM 工具中创建新资产,则大多数元数据字段都会自动填写,例如创建日期、访问权限、编码、文件大小、临时位置、磁盘或云上使用的空间等。其他字段可以由用户填写,也可以从外部应用程序获取帮助。 不同版本 DAM 还提供同一资产的多个版本。用户可以创建同一资产的多个版本并以相同的名称存储它们。 系统会根据文件类型自动排列这些文件。 例如,如果您在 DAM 工具上创建视频,系统将允许您创建不同的版本(如高质量、中质量和低质量)以及不同的媒体类型(如 MP4、3GP、OGG、WMV、WEBM 等)。 文件存储 这些文件可以存储在本地或云端。由于富媒体文件通常体积较大,因此大多数媒体文件都需要占用数据库中的大量存储空间。 在这种情况下,通常需要额外的存储设备,例如硬盘驱动器或云存储空间。数字资产管理 (DAM) 工具在这方面非常有用,因为它们提供内置的存储空间。 如今,大多数知名的数字资产管理服务提供商都会为用户提供额外的存储空间,因为他们了解并分析了存储大量文件的需求。 对您的资产进行分类 这是一项与搜索相关的功能,方便用户对文件进行排序。 这里有一个金字塔形的文件夹结构,用户可以将文件从一个文件夹拖放到另一个文件夹。 搜索功​​能位于图示顶部。 正如我在引言中所解释的,数字资产管理 (DAM) 工具使我们能够轻松地组织文件和数据。内容索引也是数据组织的一部分。 索引功能包含一个搜索栏,可以帮助用户在几秒钟内找到所需的数据和文件。 假设您正在数据库中查找动画文件,您只需在搜索栏中输入“动画”,所有动画文件的名称就会显示在建议框中。 这些建议是基于您之前的搜索记录以及数据库中已保存文件的标题。 访问控制 数字资产管理 (DAM) 系统提供访问控制和用户管理功能。每个 DAM 系统都能为您的数字资产提供内部安全保障。 访问控制是 […]
{{brizy_dc_image_alt entityId=
数据挖掘是从各种数据库中提取知识,并将其转化为有用信息的过程。 一切都始于原始数据,这些数据在我们接收或获取时处于原始状态,直到被挖掘出有用的信息。 数据挖掘对企业非常有用,因为它可以快速响应业务查询。 它还可以帮助企业根据不同的市场、消费者的品味和偏好、地理位置、消费者偏好的交易类型等因素对数据进行细分。 以下是六款最佳开源数据挖掘工具。 1. Weka Weka 是一款免费的开源数据挖掘工具,它使用机器学习算法进行数据挖掘。该工具可在 macOS、Linux 和 Windows 系统上运行。 该工具可用于多种数据挖掘场景,包括 Experimenter、Weka Knowledge Explorer、Simple CL 和 Knowledge Flow。 这些工具的功能各不相同。Explorer 用于二维可视化,而 Simple CL 则适用于大型数据集。 此外,一些采用快速原型开发方法的组织也更倾向于使用 Weka。 2. H3O 它也是一款开源数据挖掘工具,供组织机构用于分析存储在云基础设施中的数据。 H3O 使用 R 语言进行编程,但用户也可以使用 Python 构建模型。 此外,由于支持 Java 语言,因此可以轻松快速地部署到生产环境。 3. Orange Orange 是一款用 Python 语言编写的软件,是目前市场上最好的开源数据挖掘和机器学习工具之一。 它是一款基于组件的软件,以其数据可视化功能而闻名。 Orange 的界面简洁直观,易于使用,因此吸引了众多企业用户。将数据上传到 Orange 系统后,数据会自动格式化为所需的模式。 用户可以通过移动组件轻松地根据需要调整数据。Orange 还允许用户借助数据分析做出更明智的决策。 4. KNIME […]