通过 Azure SQL 上的 Microsoft Advertising 平台进行学习

时间:2021-07-15 | 标签: | 作者:Q8 | 来源:微软中国MSDN网络

小提示:您能找到这篇{通过 Azure SQL 上的 Microsoft Advertising 平台进行学习}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的通过 Azure SQL 上的 Microsoft Advertising 平台进行学习内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您!

< ">Microsoft Advertising是一个功能强大的广告平台,可帮助您将您的广告精准投放给正确的客户。在2019财年,搜索广告收入为Microsoft带来了76亿美元的收入。自2015年以来,我们一直在使用Azure SQL,回顾过去真是令人难以置信:我们的可用性、性能、可伸缩性、可靠性和效率都得到了极大的提高。Azure SQL一直是Microsoft Advertising平台赖以吸引我们数百万客户并完成数十亿美元业务的基础。在这篇博客中,我们将分享我们如何在Azure上重新设计了我们的系统,如何利用众多令人兴奋的Azure SQL功能,以及随着Azure SQL的持续提供创新和卓越表现,Microsoft Advertising平台如何实现蓬勃发展。

< font-size: 16px;">我们把时间快速退回到5年前。那时候,我们在本地运行Microsoft Advertising系统。业务的高速增长导致数据呈爆炸式增长,每秒快速查询量(QPS)增长并且业务需求日趋复杂。作为一个多租户系统,无论帐户大小如何,我们都必须良好应对。但本地数据库系统无法进行扩展并满足不断增长的需求。最重要的是,大家都知道SAN存储很难升级、维护和维修。运营成本不断增加。

< font-size: 16px;">01< ">重新构建数据层架构

< font-size: 16px;">我们意识到我们需要彻底改变架构。我们的设计理念是将特定帐户的数据分布到一组数据库服务器上。这样,数据的分布变得更加均匀,并且可以同时从多个数据库中提取服务。我们看中了Azure SQL的功能、灵活性和可操作性,选择了它作为我们的平台。

< font-size: 16px;">使用Azure SQL,我们可以快速轻松地添加/删除实例。它可以提供ACID事务处理,这对我们的应用情形很重要。我们实施了水平分区以扩展数据,这种技术称为分片;对于特定的客户,数据平均分布在N个分片上。在我们的实现中,这N个分片构成了我们所谓的分片组。随着每个分片组中数据量的增大或缩小,我们在现有分片组之间进行拆分或合并。我们的设计原则之一是,无论每个帐户大小如何,都对其进行分片,并且代码和分片逻辑之间没有耦合,服务代码假定数据库可以N种方式分片。

< font-size: 16px;">ACID

< font-size: 16px;">https://en.wikipedia.org/wiki/ACID

< font-size: 16px;">分片

< font-size: 16px;">https://en.wikipedia.org/wiki/Shard_(database_architecture)

< font-size: 16px;">受Google F1设计的启发,我们将数据库数据组织结构更改为类似于下图的层次结构.

< font-size: 16px;">Google F1

< font-size: 16px;">https://research.google/pubs/pub41344/

< font-size: 16px;">通过这种数据表示,属于客户的广告组级别数据很可能会在物理存储中被群集在一起。在我们的用例中,由于可以从磁盘上的一组连续页面中检索CustomerId的数据而无需联接其他表,因此有意在子表中引入受控的冗余并复制子表中的关键列提高了我们的性能。因此,SQL需要从磁盘加载的页面更少,从而获得更好的性能。这种技术对我们非常有效,使我们能够实现延迟目标。

< font-size: 16px;">02< ">重新构建服务层架构

< font-size: 16px;">由于数据层已经发生了巨大的变化,数据现在已采用分布式形式,因此我们也必须大力改变服务层。

< font-size: 16px;">首要原则是在设计时要考虑横向扩展。收到请求时,无论哪个服务器接收到该请求,都将成为该请求的主服务器。当主服务器估计增加的并行度将减少查询处理延迟时,它将选择分布式执行而不是集中式执行。在分布式执行的情况下,它将请求分发给其对等方,等待响应,然后合并结果。然后将最终的合并结果发送给客户。

< font-size: 16px;">

< font-size: 16px;">我们还决定,业务逻辑应尽可能驻留在服务中,而不是驻留在存储层中。这种模式非常适合我们的大规模数据处理用例。对于我们的多租户需要大量数据处理的方案,投掷大量便宜的机器来执行业务逻辑和处理已证明是非常有益的。

< font-size: 16px;">最后,由于我们的服务需要同时连接到许多数据库,因此我们与开发团队制定了新的编程范例。我们构建了负责处理SQL数据库连接重用和生命周期管理的库代码。我们告诉开发人员避免串行读取,使用批处理,使用IDataReader并行流式传输数据以仅进行正向处理(与使用DataSet和DataTable相对)。根据我们的经验,使用DataTable会降低性能,特别是在高吞吐量数据处理的情况下。因此,我们转向构建纯内存中的C#对象,而不是依靠DataTable进行内存中联接和数据处理。为了最大化性能,我们还避免使用任何对象关系映射(ORM)库,而是编写特定于场景的代码(通常使用并行运行的任务)来联接和处理所有数据。我们在整个堆栈中使用async,以避免在等待I/O时出现不必要的线程池阻塞。

< font-size: 16px;">03< ">利用Azure SQL的新功能

< font-size: 16px;">Azure SQL提供了许多很棒的功能,我们对此深表感谢。下面列举其中几个:

< font-size: 16px;">Columnstore帮助我们针对数据不经常更改的分析和审计情形优化存储。使用Columnstore而不是Rowstore表可以帮助我们节省30%到40%的空间,并且由于采用了批处理操作模式而提高了性能。对存档数据使用存档压缩使我们能够节省另外30%的空间,而不会对性能产生明显影响。

< font-size: 16px;">对于不适合使用Columnstore索引的表,页面压缩可帮助我们在应用场景中省高达50%的空间,而不会带来任代运营有哪些服务何明显的性能降级。

< font-size: 16px;">表分区,将它与常规索引维护结合使用,可帮助我们控制空间消耗。

< font-size: 16px;">AlwaysOn可用性组、活动异地复制和长期备份保留(LTR)是非常好的保持业务连续性的功能。

< font-size: 16px;">DNS别名提供了一个转换层,可以将客户端应用程序重定向到其他服务器。在灾难恢复应用情形中,这非常方便。

< font-size: 16px;">DMV、XEvents和查询存储(QDS)可提供非常出色的性能故障排除功能。

< font-size: 16px;">Columnstore

< font-size: 16px;">https://docs.microsoft.com/sql/relational-databases/indexes/columnstore-indexes-overview

< font-size: 16px;">页面压缩

< font-size: 16px;">https://docs.microsoft.com/sql/relational-databases/data-compression/page-compression-implementation

< font-size: 16px;">表分区



< font-size: 16px;">https://docs.microsoft.com/sql/relational-databases/partitions/partitioned-tables-and-indexes

< font-size: 16px;">AlwaysOn可用性组

< font-size: 16px;">https://docs.microsoft.com/azure/sql-database/sql-database-high-availability

< font-size: 16px;">活动异地复制

< font-size: 16px;">https://docs.microsoft.com/en-us/azure/sql-database/sql-database-active-geo-replication

< font-size: 16px;">长期备份保留(LTR)

< font-size: 16px;">https://docs.microsoft.com/azure/sql-database/sql-database-long-term-retention

< font-size: 16px;">DNS别名

< font-size: 16px;">https://docs.microsoft.com/azure/sql-database/dns-alias-overview

< font-size: 16px;">DMV

< font-size: 16px;">https://docs.microsoft.com/azure/sql-database/sql-database-monitoring-with-dmvs

< font-size: 16px;">XEvents

< font-size: 16px;">https://docs.microsoft.com/azure/sql-database/sql-database-xevent-db-diff-from-svr

< font-size: 16px;">查询存储(QDS)

< font-size: 16px;">https://docs.microsoft.com/sql/relational-databases/performance/monitoring-performance-by-using-the-query-store小程序开发平台小程序

< font-size: 16px;">在Azure SQL上运行的Microsoft Advertising系统在支持客户不断增长的参与方面也表现良好。尽管这些年来负载显著增加,但我们仍然达到并超过了性能SLA。我们的客户对此十分满意。我们并没有就此止步,而是坚持不懈地致力于提高系统效率。Azure SQL具有很好的灵活性,在它上面花钱可以购买一些性能,但是我们认为从我们的代码中提升性能比花大笔处理公关危机步骤钱要有趣得多。那么,我们如何支付尽可能少的费用却又能获得最高的性能呢?最好的技术就是改进我们的代码使它变得更好,这样即使在便宜的Azure SQL上运行速度也能足够快。我们的系统从P11开始,然后降级到P6;现在,在我们对代码进行了相当大的改进之后,我们在P4上运行OLTP系统。此外,我们使用以下方法来充分利用Azure SQL的所有强大功能。

< font-size: 16px;">04< ">完全利用只读副本

< font-size: 16px;">许多开发人员没有意识到,一旦为高级/业务关键数据库设置了单个异地副本,我们实际上就可以查询四个数据库副本—主数据库、主数据库的本地辅助数据库、异地辅助主数据库和异地辅助主数据库的本地辅助数据库。

< font-size: 16px;">Microsoft Advertising中的一种工作负载具有两种不同的查询模式:交互式UI调用(QPS低,但具有严格的延迟要求)和报告调用(对于大量数据而言QPS高,但是具有较低的延迟要求)。为了避免这两种类型的调用相互干扰,我们曾经还托管额外的副本,而事实证明这样做的成本非常高。本地辅助功能被证明是可以“救命”的。我们设计了一种新方案:将通过UI进行的调用同时转到两个副本:主副本+异地辅助主副本,哪个先返回便使用哪个。报表调用也会同时转到两个副本:主本地辅助副本+异地辅助本地辅助副本,哪个先返回便使用哪个。这样一来,我们将Azure SQL的这部分成本减少了一半。要注意的一件事是,有时主副本和辅助副本之间会存在复制延迟,因此请确保您的应用场景可以容忍和处理这种延迟。

< font-size: 16px;">05< ">定期清理数据以保持整洁

< font-size: 16px;">为了降低Azure SQL成本并确保出色的查询性能,对于我们来说最重要的是开发一个稳健的数据清理基础架构,用于定期清理已删除的实体和老旧审核数据。清理需要占用大量CPU和I/O,因为需要检查所有表。通过大量的调整,我们现在已经能够优化清理操作,使其对系统的影响减至最小。我们利用Azure SQL的弹性作业来清理数据。

< font-size: 16px;">06< ">负载平衡



< font-size: 16px;">负载均衡器是一项基础架构功能,可帮助我们将数据均衡分布到各数据库服务器。目的是消除热点并分散客户数据,避免增长高峰。它以在线方式将客户数据从繁忙的分片组移动到更空闲的分片组,此操作对客户的影响非常小。仅当客户活动低于阈值时才锁定和切换分区,从而将对客户的影响减至最小。如果客户仍在进行大量更改,则负载均衡器将退出并重试。它会持续运行,确保将我们的数据尽可能高效地打包。

< font-size: 16px;">07< ">结论

< font-size: 16px;">Azure SQL是云中全托管SQL的最佳选择。Microsoft Advertising非常高兴在这个梦幻般的平台上运行并实现蓬勃发展。目前,我们正在测试最新的炫酷技术—Hyperscale!它支持高达100 TB的存储,近乎即时的数据库备份,快速扩展等等。利用迁移到Hyperscale服务层的数据库,我们已经看到了显著的性能改进。我们将很快完成其余数据库的迁移。

通过 Azure SQL 上的 Microsoft Advertising 平台进行学习

上一篇:Shopify SEO指南:如何增加网站的自然流量?为Go
下一篇:如何评价AWS发布了一个基于云的工具Honeycode,能


版权声明:以上主题为“通过 Azure SQL 上的 Microsoft Advertising 平台进行学习"的内容可能是本站网友自行发布,或者来至于网络。如有侵权欢迎联系我们客服QQ处理,谢谢。
相关内容
推荐内容
扫码咨询
    通过 Azure SQL 上的 Microsoft Advertising 平台进行学习
    打开微信扫码或长按识别二维码

小提示:您应该对本页介绍的“通过 Azure SQL 上的 Microsoft Advertising 平台进行学习”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通通过 Azure SQL 上的 Microsoft Advertising 平台进行学习的相关事宜。

关键词:通过,Azure,SQL,上的,Microso

关于 | 业务 | 案例 | 免责 | 隐私
客服邮箱:sales@1330.com.cn
电话:400-021-1330 | 客服QQ:865612759
沪ICP备12034177号 | 沪公网安备31010702002418号