为数据复制达成共识:技术角度

Commun. ACM Pub Date : 2014-08-01 DOI:10.1145/2632794

P. Bernstein

{"title":"为数据复制达成共识:技术角度","authors":"P. Bernstein","doi":"10.1145/2632794","DOIUrl":null,"url":null,"abstract":"云计算系统中的数据应该具有高可用性。换言之,无论你何时接入系统,你在系统中保存的数据都应随时可用。实现该功能的标准机制——数据复制——需要维护每个用户数据的多个副本。复制数据本身并不能解决问题,因为可用的数据副本可能是过期的。具体的解释如下,假设系统维护了文件 x 的三个副本:x1, x2,和 x3。假设 x1 和 x2 当前可用, 而 x3 不可用。如果程序更新 x,则系统会把新值写入 x1 和 x2,但由于 x3 不可用,所以无法更新 x3。这不会引发问题,因为系统仍然有两个正确的副本。接下来,假设 x1 和 x2 发生故障,然后 x3 得以恢复。现在,问题出现了。如果用户读取 x, 系统能提供的最佳结果是返回 x3 的值。但是该副本是过期的——它没有包含最近的更新值。针对这一问题,早期的解决方案为多数一致。处理 x 的写入操作时,系统会分配一个单调递增的时间戳,然后在 x 的多数副本中写入 x 的值和时间戳。处理 x 的读取操作时,系统会读取 x 的多数副本,然后返回具有最大时间戳的值。由于任意两个多数副本的交集至少会包含一个副本,所以每次读操作能够返回之前在该数据上写入的值。在上文的例子中,读取操作只读取了一个副本,并非三个副本中的多数。因此,可能无法返回 x 的最新状态。如果使用了多数一致, 系统就不得不等待第二个副本变为可用,这样才能读够两个副本。接下来,它会返回在读到的两个副本中更接近当前时间的副本,因为该副本的值必定是最新的。 Gifford 把多数的概念扩展为加权多数,并将其称之为仲裁。每个副本都会被赋予权重。读取操作必须访问达到读取仲裁的副本—— 副本集合的权重至少达到 R。而写操作则必须更新达到写入仲裁的副本——副本集合的权重至少达到 W。设定 R+W 必须超过所有副本的总权重 N 后,我们可以确保每次读取均能读到在最近一次写入操作中写入的值。例如,设系统保存了 x 的四个副本,即 x1-x4。我们可以把 x1 和 x2 的权重设为 1;若 x3 和 x4 位于更可靠的服务器中,则把 x3 和 x4 的权重设为 2。这样得到 N=6。如果读取比写入更频繁,那么我们可以设 R=3,W=4,这样读取执行的任务会比写入少。因为 R+W>N,所以每次读取均能读到之前在该数据上写入的值。按理说,每次写入操作都必须更新数据的所有可用副本。但是, 读者也必须读多个副本,这颇为麻烦,因为它增加了开销和延迟。如果写入操作经常执行很快,这会特别棘手,因为在这种情况下,即使每次读取操作没有读取仲裁, 也极有可能读到最新的副本。如果读到过期数据的概率足够低,那么让读者读取少于仲裁数量的副本或许是可取的。实际上,某些云应用也正是这么做的。直到最近,这种通过猜测实现的折中方法才有所改观。原来对于读到的数据的过期性或承受某些过期风险后可期望获得的延迟减少缺乏界定。后面的论文阐述了一项突破性进展,它抛开了猜测,用名为概率有界过期性的原理分析取而代之。给定 R、W 和 N,论文的作者提出了一个公式用于计算读到的数据不属于最近 K 次写入值之一的概率。为了计算读到的数据不是在最近Δ时间单位内写入的值的概率, 他们使用了基于时间参数的蒙特卡罗模拟,且这些参数可以在运行的系统中通过测量得出。不仅如此, 他们基于开源记录管理器实现了该机制,让这种分析变得切实可行, 使得用户可以依据自己的判断对过期性和延迟进行权衡。而原先的猜测工作现在也变成了人们可以精心策划的目标。","PeriodicalId":10645,"journal":{"name":"Commun. ACM","volume":"50 1","pages":"92"},"PeriodicalIF":0.0000,"publicationDate":"2014-08-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"Getting consensus for data replication: technical perspective\",\"authors\":\"P. Bernstein\",\"doi\":\"10.1145/2632794\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"云计算系统中的数据应该具有高可用性。换言之,无论你何时接入系统,你在系统中保存的数据都应随时可用。实现该功能的标准机制——数据复制——需要维护每个用户数据的多个副本。复制数据本身并不能解决问题,因为可用的数据副本可能是过期的。具体的解释如下,假设系统维护了文件 x 的三个副本:x1, x2,和 x3。假设 x1 和 x2 当前可用, 而 x3 不可用。如果程序更新 x,则系统会把新值写入 x1 和 x2,但由于 x3 不可用,所以无法更新 x3。这不会引发问题,因为系统仍然有两个正确的副本。接下来,假设 x1 和 x2 发生故障,然后 x3 得以恢复。现在,问题出现了。如果用户读取 x, 系统能提供的最佳结果是返回 x3 的值。但是该副本是过期的——它没有包含最近的更新值。针对这一问题,早期的解决方案为多数一致。处理 x 的写入操作时,系统会分配一个单调递增的时间戳,然后在 x 的多数副本中写入 x 的值和时间戳。处理 x 的读取操作时,系统会读取 x 的多数副本,然后返回具有最大时间戳的值。由于任意两个多数副本的交集至少会包含一个副本,所以每次读操作能够返回之前在该数据上写入的值。在上文的例子中,读取操作只读取了一个副本,并非三个副本中的多数。因此,可能无法返回 x 的最新状态。如果使用了多数一致, 系统就不得不等待第二个副本变为可用,这样才能读够两个副本。接下来,它会返回在读到的两个副本中更接近当前时间的副本,因为该副本的值必定是最新的。 Gifford 把多数的概念扩展为加权多数,并将其称之为仲裁。每个副本都会被赋予权重。读取操作必须访问达到读取仲裁的副本—— 副本集合的权重至少达到 R。而写操作则必须更新达到写入仲裁的副本——副本集合的权重至少达到 W。设定 R+W 必须超过所有副本的总权重 N 后,我们可以确保每次读取均能读到在最近一次写入操作中写入的值。例如,设系统保存了 x 的四个副本,即 x1-x4。我们可以把 x1 和 x2 的权重设为 1;若 x3 和 x4 位于更可靠的服务器中,则把 x3 和 x4 的权重设为 2。这样得到 N=6。如果读取比写入更频繁,那么我们可以设 R=3,W=4,这样读取执行的任务会比写入少。因为 R+W>N,所以每次读取均能读到之前在该数据上写入的值。按理说,每次写入操作都必须更新数据的所有可用副本。但是, 读者也必须读多个副本,这颇为麻烦,因为它增加了开销和延迟。如果写入操作经常执行很快,这会特别棘手,因为在这种情况下,即使每次读取操作没有读取仲裁, 也极有可能读到最新的副本。如果读到过期数据的概率足够低,那么让读者读取少于仲裁数量的副本或许是可取的。实际上,某些云应用也正是这么做的。直到最近,这种通过猜测实现的折中方法才有所改观。原来对于读到的数据的过期性或承受某些过期风险后可期望获得的延迟减少缺乏界定。后面的论文阐述了一项突破性进展,它抛开了猜测,用名为概率有界过期性的原理分析取而代之。给定 R、W 和 N,论文的作者提出了一个公式用于计算读到的数据不属于最近 K 次写入值之一的概率。为了计算读到的数据不是在最近Δ时间单位内写入的值的概率, 他们使用了基于时间参数的蒙特卡罗模拟,且这些参数可以在运行的系统中通过测量得出。不仅如此, 他们基于开源记录管理器实现了该机制,让这种分析变得切实可行, 使得用户可以依据自己的判断对过期性和延迟进行权衡。而原先的猜测工作现在也变成了人们可以精心策划的目标。\",\"PeriodicalId\":10645,\"journal\":{\"name\":\"Commun. ACM\",\"volume\":\"50 1\",\"pages\":\"92\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2014-08-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Commun. ACM\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.1145/2632794\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Commun. ACM","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1145/2632794","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 3

摘要

云计算系统中的数据应该具有高可用性。换言之,无论你何时接入系统,你在系统中保存的数据都应随时可用。实现该功能的标准机制——数据复制——需要维护每个用户数据的多个副本。复制数据本身并不能解决问题,因为可用的数据副本可能是过期的。具体的解释如下,假设系统维护了文件 x 的三个副本:x1, x2,和 x3。假设 x1 和 x2 当前可用, 而 x3 不可用。如果程序更新 x,则系统会把新值写入 x1 和 x2,但由于 x3 不可用,所以无法更新 x3。这不会引发问题,因为系统仍然有两个正确的副本。接下来,假设 x1 和 x2 发生故障,然后 x3 得以恢复。现在,问题出现了。如果用户读取 x, 系统能提供的最佳结果是返回 x3 的值。但是该副本是过期的——它没有包含最近的更新值。针对这一问题,早期的解决方案为多数一致。处理 x 的写入操作时,系统会分配一个单调递增的时间戳,然后在 x 的多数副本中写入 x 的值和时间戳。处理 x 的读取操作时,系统会读取 x 的多数副本,然后返回具有最大时间戳的值。由于任意两个多数副本的交集至少会包含一个副本,所以每次读操作能够返回之前在该数据上写入的值。在上文的例子中,读取操作只读取了一个副本,并非三个副本中的多数。因此,可能无法返回 x 的最新状态。如果使用了多数一致, 系统就不得不等待第二个副本变为可用,这样才能读够两个副本。接下来,它会返回在读到的两个副本中更接近当前时间的副本,因为该副本的值必定是最新的。 Gifford 把多数的概念扩展为加权多数,并将其称之为仲裁。每个副本都会被赋予权重。读取操作必须访问达到读取仲裁的副本—— 副本集合的权重至少达到 R。而写操作则必须更新达到写入仲裁的副本——副本集合的权重至少达到 W。设定 R+W 必须超过所有副本的总权重 N 后,我们可以确保每次读取均能读到在最近一次写入操作中写入的值。例如,设系统保存了 x 的四个副本,即 x1-x4。我们可以把 x1 和 x2 的权重设为 1;若 x3 和 x4 位于更可靠的服务器中,则把 x3 和 x4 的权重设为 2。这样得到 N=6。如果读取比写入更频繁,那么我们可以设 R=3,W=4,这样读取执行的任务会比写入少。因为 R+W>N,所以每次读取均能读到之前在该数据上写入的值。按理说,每次写入操作都必须更新数据的所有可用副本。但是, 读者也必须读多个副本,这颇为麻烦,因为它增加了开销和延迟。如果写入操作经常执行很快,这会特别棘手,因为在这种情况下,即使每次读取操作没有读取仲裁, 也极有可能读到最新的副本。如果读到过期数据的概率足够低,那么让读者读取少于仲裁数量的副本或许是可取的。实际上,某些云应用也正是这么做的。直到最近,这种通过猜测实现的折中方法才有所改观。原来对于读到的数据的过期性或承受某些过期风险后可期望获得的延迟减少缺乏界定。后面的论文阐述了一项突破性进展,它抛开了猜测,用名为概率有界过期性的原理分析取而代之。给定 R、W 和 N,论文的作者提出了一个公式用于计算读到的数据不属于最近 K 次写入值之一的概率。为了计算读到的数据不是在最近Δ时间单位内写入的值的概率, 他们使用了基于时间参数的蒙特卡罗模拟,且这些参数可以在运行的系统中通过测量得出。不仅如此, 他们基于开源记录管理器实现了该机制,让这种分析变得切实可行, 使得用户可以依据自己的判断对过期性和延迟进行权衡。而原先的猜测工作现在也变成了人们可以精心策划的目标。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文