Amazon DataSync 的新增功能 — 在 Amazon 和 Google Cloud Storage 或 Amazon 和 Microsoft Azure 文件之间移动数据

0
0
{"value":"借助 [Amazon DataSync](https://aws.amazon.com/datasync/),可以自动化并加快将数据移入和移出 [Amazon Storage](https://aws.amazon.com/products/storage/) 服务的速度。例如,您可以使用 DataSync 将数据迁移到 Amazon,复制数据以实现业务连续性,以及移动数据以在云中进行分析和处理。您可以使用 DataSync 在 Amazon Storage 服务之间传输数据,包括 [Amazon Simple Storage Service(Amazon S3)](https://aws.amazon.com/s3/)、[Amazon Elastic File System(Amazon EFS)](https://aws.amazon.com/efs)和 [Amazon FSx](https://aws.amazon.com/fsx/)。DataSync 还与 [Amazon CloudWatch](https://aws.amazon.com/cloudwatch/) 和 [Amazon CloudTrail](https://aws.amazon.com/cloudtrail/) 集成,用于记录、监控和警报。\n\n今天,我们为 DataSync 添加了在 Amazon Storage 服务与 Google Cloud Storage 或 Microsoft Azure 文件之间迁移数据的功能。通过这种方式,您可以简化数据处理或存储整合任务。如果您需要导入、共享数据并与使用 Google Cloud Storage 或 Microsoft Azure 文件的客户、供应商或合作伙伴交换数据,这也很有帮助。DataSync 提供端到端的安全性,包括加密和完整性验证,以确保您的数据安全、完好无损并随时可用。\n\n我们来看看这些步骤的实际操作。\n\n#### **准备 DataSync 代理**\n\n首先,我需要一个 DataSync 代理来读取或写入位于 Google Cloud Storage 或 Azure 文件中的存储。我把代理部署在 [Amazon Elastic Compute Cloud(Amazon EC2)](https://aws.amazon.com/ec2/)实例上。最新的 DataSync [Amazon 机器映像(AMI)](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html)ID 存储在 [Parameter Store](https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-parameter-store.html)中,这是 [Amazon Systems Manager](https://aws.amazon.com/systems-manager/) 的一项功能。我使用 [Amazon 命令行界面(Amazon CLI)](https://aws.amazon.com/cli/)来获取 ```/aws/service/datasync/ami```参数的值:\n\n```\\naws ssm get-parameter --name /aws/service/datasync/ami --region us-east-1\\n\\n```\n```\\n{\\n \\"Parameter\\": {\\n \\"Name\\": \\"/aws/service/datasync/ami\\",\\n \\"Type\\": \\"String\\",\\n \\"Value\\": \\"ami-0e244fe801cf5a510\\",\\n \\"Version\\": 54,\\n \\"LastModifiedDate\\": \\"2022-05-11T14:08:09.319000+01:00\\",\\n \\"ARN\\": \\"arn:aws:ssm:us-east-1::parameter/aws/service/datasync/ami\\",\\n \\"DataType\\": \\"text\\"\\n }\\n}\\n```\n\n使用 [EC2 控制台](https://console.aws.amazon.com/ec2),我使用参数的```Value```\n 属性中指定的 AMI ID 启动一个 EC2 实例。对于联网,我使用公有子网和自动分配公有 IP 地址的选项。EC2 实例需要通过网络访问数据移动任务的来源和目的地。实例的另一个要求是能够从 DataSync 接收 HTTP 流量以激活代理。\n\n在基于 [Amazon VPC](https://aws.amazon.com/vpc/) 服务的虚拟私有云(VPC)中使用 Amazon DataSync 时,最佳做法是[使用 VPC 端点将代理与 DataSync 服务连接](https://docs.aws.amazon.com/datasync/latest/userguide/datasync-in-vpc.html)。在 [VPC 控制台](https://console.aws.amazon.com/vpc)中,我在导航窗格中选择 **Endpoints**(端点),然后选择 **Create endpoint**(创建端点)。我输入端点的名称并选择 **Amazon services**(Amazon 服务)类别。\n\n![image.png](https://dev-media.amazoncloud.cn/f57805652a17404c80a06e150abd29d7_image.png)\n\n我在 **Services**(服务)部分中,寻找 DataSync。\n\n![image.png](https://dev-media.amazoncloud.cn/146b31b7d77b4ee8bcfb2004cf2f0c20_image.png)\n\n然后,我选择启动 EC2 实例的相同 VPC。\n\n![image.png](https://dev-media.amazoncloud.cn/2b487ee71c3a4a5a81271a8c7aa88a62_image.png)\n\n为了减少跨可用区的流量,我选择用于 EC2 实例的相同子网。\n\n![image.png](https://dev-media.amazoncloud.cn/4e01704bb220467d825eae29c1cb1c7b_image.png)\n\n在 EC2 实例上运行的 DataSync 代理需要对 VPC 端点的网络访问权限。为简单起见,我为两者都使用了 [VPC 的默认安全组](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/default-custom-security-groups.html#default-security-group)。我创建了 VPC 端点,几分钟后就可以使用了。\n\n![image.png](https://dev-media.amazoncloud.cn/0b4b5eacf0774ba2b2a807183140d969_image.png)\n\n在 [Amazon DataSync 控制台](https://console.aws.amazon.com/datasync/)中,我从导航窗格中选择 **Agents**(代理),然后选择 **Create agent**(创建代理)。我为 **Hypervisor**(虚拟机监控器)选择了 **Amazon EC2**。\n\n![image.png](https://dev-media.amazoncloud.cn/6a028b54618a496eb45347fbb126faef_image.png)\n\n我为 **Endpoint type**(端点类型)选择了 **VPC endpoints using Amazon PrivateLink**(使用 Amazon PrivateLink 的 VPC 端点)。我选择之前创建的 **VPC endpoint**(VPC 端点)以及用于 VPC 端点的相同 **Subnet**(子网)和 **Security group**(安全组)。\n\n![image.png](https://dev-media.amazoncloud.cn/cca4e0fe57904f83a8f39b5d3b7799dc_image.png)\n\n我选择 **Automatically get the activation key**(自动获取激活密钥)选项,然后键入 EC2 实例的公有 IP。然后,我选择 **Get key**(获取密钥)。\n\n![image.png](https://dev-media.amazoncloud.cn/a282c3b53b1348599e1a40116963a012_image.png)\n\n激活 DataSync 代理后,我不再需要 HTTP 访问权限,我将其从 EC2 实例的安全组中删除。现在 DataSync 代理处于活动状态,我可以配置任务和位置来移动数据。\n\n#### ++**将数据从 Google Cloud Storage 迁移到 [Amazon S3](https://aws.amazon.com/cn/s3/?trk=cndc-detail)**++\n我在 Google Cloud Storage 存储桶中有几张图片,我想将这些文件与 S3 存储桶同步。在 Google Cloud 控制台中,我打开存储桶的设置。在那里,我创建了一个具有```Storage Object Viewer```权限的服务账户,并记下凭证(访问密钥和密钥)以编程方式访问存储桶。\n\n回到 Amazon DataSync 控制台中,我依次选择 **Tasks**(任务)和 **Create task**(创建任务)。\n\n为了配置任务的来源,我创建了一个位置。我为 **Location type**(位置类型)选择了 **Object storage**(对象存储),然后选择了我刚刚创建的代理。对于 **Server**(服务器),我使用 ```storage.googleapis.com```。然后,我输入 Google Cloud 存储桶分区的名称以及存储我的图片的文件夹。\n\n![image.png](https://dev-media.amazoncloud.cn/0a0ce057af764d998af08a58b09a226c_image.png)\n\n对于身份验证,我输入访问密钥和创建服务账户时检索到的密钥。我选择 **Next**(下一步)。\n\n![image.png](https://dev-media.amazoncloud.cn/e773a8ae9a384b50b337a884a6cee00f_image.png)\n\n为了配置任务的目的地,我创建了另一个位置。这次,我为 **Location Type**(位置类型)选择了 **[Amazon S3](https://aws.amazon.com/cn/s3/?trk=cndc-detail)**。我选择目的地 S3 存储桶并输入一个文件夹,该文件夹将用作传输到存储桶的文件的[前缀](https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-prefixes.html)。我使用 **Autogenerate**(自动生成)按钮创建 [IAM 角色](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html),该角色将授予 DataSync 访问 S3 存储桶的权限。\n\n![image.png](https://dev-media.amazoncloud.cn/799025ae9df1441b955eed08b55d7253_image.png)\n\n在下一步中,我将配置任务设置。我输入任务的名称。或者,我可以微调 DataSync 验证传输数据的完整性或为任务分配带宽的方式。\n\n![image.png](https://dev-media.amazoncloud.cn/54fe01e977da4767b37c55803c308368_image.png)\n\n我还可以选择要扫描的数据和要传输的数据。默认情况下,扫描所有源数据,只传输已更改的数据。在 **Additional settings**(其他设置)中,我禁用 **Copy object tags**(复制对象标签),因为 Google Cloud Storage 当前不支持标签。\n\n![image.png](https://dev-media.amazoncloud.cn/909483f04bde4f389f2c8d263926a961_image.png)\n\n我可以选择用于运行此任务的计划。现在,我将其保留为 **Not scheduled**(未计划),我选择手动启动。\n\n![image.png](https://dev-media.amazoncloud.cn/499b9e61eefb4b5c849c976d861fdc22_image.png)\n\n对于日志记录,我使用 **Autogenerate**(自动生成)按钮为 DataSync 创建日志组。我选择 **Next**(下一步)。\n\n![image.png](https://dev-media.amazoncloud.cn/34fba356bd7641919bb535f01a2a0097_image.png)\n\n我检查配置并创建任务。现在,我从控制台启动数据移动任务。几分钟后,这些文件将与我的 S3 存储桶同步,我可以从 [S3 控制台](https://console.aws.amazon.com/s3/)访问它们。\n\n![image.png](https://dev-media.amazoncloud.cn/f2e1e7f0bd2f4d90904d88d0e4667cdb_image.png)\n\n#### ++**将数据从 Azure 文件移动到 [Amazon FSx for Windows File Server](https://aws.amazon.com/cn/fsx/windows/?trk=cndc-detail)**++\n\n我拍了很多照片,而且在 Azure 文件共享中还有几张图片。我想将这些文件与 [Amazon FSx for Windows](https://aws.amazon.com/fsx/windows/) 文件系统同步。在 Azure 控制台中,我选择文件共享,然后选择 **Connect**(连接)按钮以生成 [PowerShell](https://docs.microsoft.com/powershell/) 脚本,用于检查是否可以通过网络访问此存储账户。\n\n```\\n\$connectTestResult = Test-NetConnection -ComputerName <SMB_SERVER> -Port 445\\nif (\$connectTestResult.TcpTestSucceeded) {\\n # Save the password so the drive will persist on reboot\\n cmd.exe /C \\"cmdkey /add:`\\"danilopsync.file.core.windows.net`\\" /user:`\\"localhost\\\\<USER>`\\" /pass:`\\"<PASSWORD>`\\"\\"\\n # Mount the drive\\n New-PSDrive -Name Z -PSProvider FileSystem -Root \\"\\\\\\\\danilopsync.file.core.windows.net\\\\<SHARE_NAME>\\" -Persist\\n} else {\\n Write-Error -Message \\"Unable to reach the Azure storage account via port 445.Check to make sure your organization or ISP is not blocking port 445, or use Azure P2S VPN, Azure S2S VPN, or Express Route to tunnel SMB traffic over a different port.\\"\\n}\\n```\n\n从这个脚本中,我获取了配置 DataSync 位置所需的信息:\n\n- SMB 服务器\n- 共享名称\n- 用户\n- 密码\n\n回到 Amazon DataSync 控制台中,我依次选择 **Tasks**(任务)和 **Create task**(创建任务)。\n\n为了配置任务的来源,我创建了一个位置。我为 **Location Type**(位置类型)选择了 **Server Message Block (SMB)**(服务器消息块(SMB)),然后选择之前创建的代理。然后,我使用在脚本中找到的信息输入用于身份验证的 **SMB Server**(SMB 服务器)地址、**Share name**(共享名称)和 **User**(用户)/**Password**(密码)。\n\n![image.png](https://dev-media.amazoncloud.cn/81395f0626b2476caf21732fa6d74b1a_image.png)\n\n要配置任务的目的地,我再次创建一个位置。这次,我为 **Location type**(位置类型)选择了 **Amazon FSx**。我选择了之前创建的 FSx for Windows 文件系统,并使用默认共享名称。我使用[默认安全组](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/default-custom-security-groups.html#default-security-group)连接到文件系统。因为我将[Amazon Directory Service for Microsoft Active Directory ](https://aws.amazon.com/directoryservice/)与 FSx for Windows File Server 一起使用,所以我使用的是 ```Amazon Delegated FSx Administrators```和 ```Domain Admins```组的用户成员的凭证。有关更多信息,请参阅文档中的[为 FSx for Windows File Server 创建位置](https://docs.aws.amazon.com/datasync/latest/userguide/create-fsx-location.html)。\n\n![image.png](https://dev-media.amazoncloud.cn/e604bbb665ea49bbb34bb51c13790fd2_image.png)\n\n在下一步中,我输入任务的名称,并将所有其他选项保留为其默认值,就像对上一个任务所做的那样。\n\n![image.png](https://dev-media.amazoncloud.cn/760ecd7d8a7d4e818c300f167c5674ed_image.png)\n\n我检查配置并创建任务。现在,我从控制台启动数据移动任务。几分钟后,这些文件将与我的 FSx for Windows 文件系统共享同步。我挂载了 Windows EC2 实例的文件系统共享,然后看到我的图片在那里。\n\n![image.png](https://dev-media.amazoncloud.cn/21bf9e87e996489ca163ef8d55fec931_image.png)\n\n创建任务时,我可以重复使用现有位置。例如,如果我想将文件从 Azure 文件同步到我的 S3 存储桶,我可以快速选择我为这篇文章创建的两个对应位置。\n\n#### ++**可用性和定价**++\n您可以使用 [Amazon DataSync 控制台](https://console.aws.amazon.com/datasync/)、[Amazon 命令行界面(CLI)](https://aws.amazon.com/cli/)或 [Amazon SDK](https://aws.amazon.com/tools/) 来移动数据,以创建在 Amazon Storage 和 Google Cloud Storage 存储桶或 Azure 文件系统之间移动数据的任务。在任务运行时,您可以通过 DataSync 控制台或使用 CloudWatch 监控进度。\n\n具备这些新功能的 [DataSync 定价](https://aws.amazon.com/datasync/pricing/)没有任何变化。将数据移入和移出 Google Cloud 或 Microsoft Azure 的费用与当前 DataSync 支持的所有其他数据来源的费用相同。\n\nGoogle Cloud 或 Microsoft Azure 可能会向您收取数据传输费用。由于 DataSync 在代理和 Amazon 之间进行复制时会压缩传输中的数据,因此您可以通过在 Google Cloud 或 Microsoft Azure 环境中部署 DataSync 代理来降低出站费用。\n\n使用 DataSync 将数据从 Amazon 移动到 Google Cloud 或 Microsoft Azure 时,您需要支付从 EC2 向互联网传输数据的费用。有关更多信息,请参阅 [Amazon EC2 定价](https://aws.amazon.com/ec2/pricing/)。\n\n++[**利用 Amazon DataSync 自动化并加快数据移动方式。**](https://aws.amazon.com/datasync/getting-started/)++\n\n— [Danilo](https://twitter.com/danilop)\n","render":"<p>借助 <a href=\\"https://aws.amazon.com/datasync/\\" target=\\"_blank\\">Amazon DataSync</a>,可以自动化并加快将数据移入和移出 <a href=\\"https://aws.amazon.com/products/storage/\\" target=\\"_blank\\">Amazon Storage</a> 服务的速度。例如,您可以使用 DataSync 将数据迁移到 Amazon,复制数据以实现业务连续性,以及移动数据以在云中进行分析和处理。您可以使用 DataSync 在 Amazon Storage 服务之间传输数据,包括 <a href=\\"https://aws.amazon.com/s3/\\" target=\\"_blank\\">Amazon Simple Storage Service(Amazon S3)</a>、<a href=\\"https://aws.amazon.com/efs\\" target=\\"_blank\\">Amazon Elastic File System(Amazon EFS)</a>和 <a href=\\"https://aws.amazon.com/fsx/\\" target=\\"_blank\\">Amazon FSx</a>。DataSync 还与 <a href=\\"https://aws.amazon.com/cloudwatch/\\" target=\\"_blank\\">Amazon CloudWatch</a> 和 <a href=\\"https://aws.amazon.com/cloudtrail/\\" target=\\"_blank\\">Amazon CloudTrail</a> 集成,用于记录、监控和警报。</p>\\n<p>今天,我们为 DataSync 添加了在 Amazon Storage 服务与 Google Cloud Storage 或 Microsoft Azure 文件之间迁移数据的功能。通过这种方式,您可以简化数据处理或存储整合任务。如果您需要导入、共享数据并与使用 Google Cloud Storage 或 Microsoft Azure 文件的客户、供应商或合作伙伴交换数据,这也很有帮助。DataSync 提供端到端的安全性,包括加密和完整性验证,以确保您的数据安全、完好无损并随时可用。</p>\n<p>我们来看看这些步骤的实际操作。</p>\n<h4><a id=\\"_DataSync__6\\"></a><strong>准备 DataSync 代理</strong></h4>\\n<p>首先,我需要一个 DataSync 代理来读取或写入位于 Google Cloud Storage 或 Azure 文件中的存储。我把代理部署在 <a href=\\"https://aws.amazon.com/ec2/\\" target=\\"_blank\\">Amazon Elastic Compute Cloud(Amazon EC2)</a>实例上。最新的 DataSync <a href=\\"https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/AMIs.html\\" target=\\"_blank\\">Amazon 机器映像(AMI)</a>ID 存储在 <a href=\\"https://docs.aws.amazon.com/systems-manager/latest/userguide/systems-manager-parameter-store.html\\" target=\\"_blank\\">Parameter Store</a>中,这是 <a href=\\"https://aws.amazon.com/systems-manager/\\" target=\\"_blank\\">Amazon Systems Manager</a> 的一项功能。我使用 <a href=\\"https://aws.amazon.com/cli/\\" target=\\"_blank\\">Amazon 命令行界面(Amazon CLI)</a>来获取 <code>/aws/service/datasync/ami</code>参数的值:</p>\\n<pre><code class=\\"lang-\\">aws ssm get-parameter --name /aws/service/datasync/ami --region us-east-1\\n\\n</code></pre>\\n<pre><code class=\\"lang-\\">{\\n &quot;Parameter&quot;: {\\n &quot;Name&quot;: &quot;/aws/service/datasync/ami&quot;,\\n &quot;Type&quot;: &quot;String&quot;,\\n &quot;Value&quot;: &quot;ami-0e244fe801cf5a510&quot;,\\n &quot;Version&quot;: 54,\\n &quot;LastModifiedDate&quot;: &quot;2022-05-11T14:08:09.319000+01:00&quot;,\\n &quot;ARN&quot;: &quot;arn:aws:ssm:us-east-1::parameter/aws/service/datasync/ami&quot;,\\n &quot;DataType&quot;: &quot;text&quot;\\n }\\n}\\n</code></pre>\\n<p>使用 <a href=\\"https://console.aws.amazon.com/ec2\\" target=\\"_blank\\">EC2 控制台</a>,我使用参数的<code>Value</code><br />\\n属性中指定的 AMI ID 启动一个 EC2 实例。对于联网,我使用公有子网和自动分配公有 IP 地址的选项。EC2 实例需要通过网络访问数据移动任务的来源和目的地。实例的另一个要求是能够从 DataSync 接收 HTTP 流量以激活代理。</p>\n<p>在基于 <a href=\\"https://aws.amazon.com/vpc/\\" target=\\"_blank\\">Amazon VPC</a> 服务的虚拟私有云(VPC)中使用 Amazon DataSync 时,最佳做法是<a href=\\"https://docs.aws.amazon.com/datasync/latest/userguide/datasync-in-vpc.html\\" target=\\"_blank\\">使用 VPC 端点将代理与 DataSync 服务连接</a>。在 <a href=\\"https://console.aws.amazon.com/vpc\\" target=\\"_blank\\">VPC 控制台</a>中,我在导航窗格中选择 <strong>Endpoints</strong>(端点),然后选择 <strong>Create endpoint</strong>(创建端点)。我输入端点的名称并选择 <strong>Amazon services</strong>(Amazon 服务)类别。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/f57805652a17404c80a06e150abd29d7_image.png\\" alt=\\"image.png\\" /></p>\n<p>我在 <strong>Services</strong>(服务)部分中,寻找 DataSync。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/146b31b7d77b4ee8bcfb2004cf2f0c20_image.png\\" alt=\\"image.png\\" /></p>\n<p>然后,我选择启动 EC2 实例的相同 VPC。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/2b487ee71c3a4a5a81271a8c7aa88a62_image.png\\" alt=\\"image.png\\" /></p>\n<p>为了减少跨可用区的流量,我选择用于 EC2 实例的相同子网。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/4e01704bb220467d825eae29c1cb1c7b_image.png\\" alt=\\"image.png\\" /></p>\n<p>在 EC2 实例上运行的 DataSync 代理需要对 VPC 端点的网络访问权限。为简单起见,我为两者都使用了 <a href=\\"https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/default-custom-security-groups.html#default-security-group\\" target=\\"_blank\\">VPC 的默认安全组</a>。我创建了 VPC 端点,几分钟后就可以使用了。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/0b4b5eacf0774ba2b2a807183140d969_image.png\\" alt=\\"image.png\\" /></p>\n<p>在 <a href=\\"https://console.aws.amazon.com/datasync/\\" target=\\"_blank\\">Amazon DataSync 控制台</a>中,我从导航窗格中选择 <strong>Agents</strong>(代理),然后选择 <strong>Create agent</strong>(创建代理)。我为 <strong>Hypervisor</strong>(虚拟机监控器)选择了 <strong>Amazon EC2</strong>。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/6a028b54618a496eb45347fbb126faef_image.png\\" alt=\\"image.png\\" /></p>\n<p>我为 <strong>Endpoint type</strong>(端点类型)选择了 <strong>VPC endpoints using Amazon PrivateLink</strong>(使用 Amazon PrivateLink 的 VPC 端点)。我选择之前创建的 <strong>VPC endpoint</strong>(VPC 端点)以及用于 VPC 端点的相同 <strong>Subnet</strong>(子网)和 <strong>Security group</strong>(安全组)。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/cca4e0fe57904f83a8f39b5d3b7799dc_image.png\\" alt=\\"image.png\\" /></p>\n<p>我选择 <strong>Automatically get the activation key</strong>(自动获取激活密钥)选项,然后键入 EC2 实例的公有 IP。然后,我选择 <strong>Get key</strong>(获取密钥)。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/a282c3b53b1348599e1a40116963a012_image.png\\" alt=\\"image.png\\" /></p>\n<p>激活 DataSync 代理后,我不再需要 HTTP 访问权限,我将其从 EC2 实例的安全组中删除。现在 DataSync 代理处于活动状态,我可以配置任务和位置来移动数据。</p>\n<h4><a id=\\"_Google_Cloud_Storage__Amazon_S3_65\\"></a><ins><strong>将数据从 Google Cloud Storage 迁移到 Amazon S3</strong></ins></h4>\n<p>我在 Google Cloud Storage 存储桶中有几张图片,我想将这些文件与 S3 存储桶同步。在 Google Cloud 控制台中,我打开存储桶的设置。在那里,我创建了一个具有<code>Storage Object Viewer</code>权限的服务账户,并记下凭证(访问密钥和密钥)以编程方式访问存储桶。</p>\\n<p>回到 Amazon DataSync 控制台中,我依次选择 <strong>Tasks</strong>(任务)和 <strong>Create task</strong>(创建任务)。</p>\\n<p>为了配置任务的来源,我创建了一个位置。我为 <strong>Location type</strong>(位置类型)选择了 <strong>Object storage</strong>(对象存储),然后选择了我刚刚创建的代理。对于 <strong>Server</strong>(服务器),我使用 <code>storage.googleapis.com</code>。然后,我输入 Google Cloud 存储桶分区的名称以及存储我的图片的文件夹。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/0a0ce057af764d998af08a58b09a226c_image.png\\" alt=\\"image.png\\" /></p>\n<p>对于身份验证,我输入访问密钥和创建服务账户时检索到的密钥。我选择 <strong>Next</strong>(下一步)。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/e773a8ae9a384b50b337a884a6cee00f_image.png\\" alt=\\"image.png\\" /></p>\n<p>为了配置任务的目的地,我创建了另一个位置。这次,我为 <strong>Location Type</strong>(位置类型)选择了 <strong>Amazon S3</strong>。我选择目的地 S3 存储桶并输入一个文件夹,该文件夹将用作传输到存储桶的文件的<a href=\\"https://docs.aws.amazon.com/AmazonS3/latest/userguide/using-prefixes.html\\" target=\\"_blank\\">前缀</a>。我使用 <strong>Autogenerate</strong>(自动生成)按钮创建 <a href=\\"https://docs.aws.amazon.com/IAM/latest/UserGuide/id_roles.html\\" target=\\"_blank\\">IAM 角色</a>,该角色将授予 DataSync 访问 S3 存储桶的权限。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/799025ae9df1441b955eed08b55d7253_image.png\\" alt=\\"image.png\\" /></p>\n<p>在下一步中,我将配置任务设置。我输入任务的名称。或者,我可以微调 DataSync 验证传输数据的完整性或为任务分配带宽的方式。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/54fe01e977da4767b37c55803c308368_image.png\\" alt=\\"image.png\\" /></p>\n<p>我还可以选择要扫描的数据和要传输的数据。默认情况下,扫描所有源数据,只传输已更改的数据。在 <strong>Additional settings</strong>(其他设置)中,我禁用 <strong>Copy object tags</strong>(复制对象标签),因为 Google Cloud Storage 当前不支持标签。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/909483f04bde4f389f2c8d263926a961_image.png\\" alt=\\"image.png\\" /></p>\n<p>我可以选择用于运行此任务的计划。现在,我将其保留为 <strong>Not scheduled</strong>(未计划),我选择手动启动。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/499b9e61eefb4b5c849c976d861fdc22_image.png\\" alt=\\"image.png\\" /></p>\n<p>对于日志记录,我使用 <strong>Autogenerate</strong>(自动生成)按钮为 DataSync 创建日志组。我选择 <strong>Next</strong>(下一步)。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/34fba356bd7641919bb535f01a2a0097_image.png\\" alt=\\"image.png\\" /></p>\n<p>我检查配置并创建任务。现在,我从控制台启动数据移动任务。几分钟后,这些文件将与我的 S3 存储桶同步,我可以从 <a href=\\"https://console.aws.amazon.com/s3/\\" target=\\"_blank\\">S3 控制台</a>访问它们。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/f2e1e7f0bd2f4d90904d88d0e4667cdb_image.png\\" alt=\\"image.png\\" /></p>\n<h4><a id=\\"_Azure__Amazon_FSx_for_Windows_File_Server_102\\"></a><ins><strong>将数据从 Azure 文件移动到 Amazon FSx for Windows File Server</strong></ins></h4>\n<p>我拍了很多照片,而且在 Azure 文件共享中还有几张图片。我想将这些文件与 <a href=\\"https://aws.amazon.com/fsx/windows/\\" target=\\"_blank\\">Amazon FSx for Windows</a> 文件系统同步。在 Azure 控制台中,我选择文件共享,然后选择 <strong>Connect</strong>(连接)按钮以生成 <a href=\\"https://docs.microsoft.com/powershell/\\" target=\\"_blank\\">PowerShell</a> 脚本,用于检查是否可以通过网络访问此存储账户。</p>\\n<pre><code class=\\"lang-\\">\$connectTestResult = Test-NetConnection -ComputerName &lt;SMB_SERVER&gt; -Port 445\\nif (\$connectTestResult.TcpTestSucceeded) {\\n # Save the password so the drive will persist on reboot\\n cmd.exe /C &quot;cmdkey /add:`&quot;danilopsync.file.core.windows.net`&quot; /user:`&quot;localhost\\\\&lt;USER&gt;`&quot; /pass:`&quot;&lt;PASSWORD&gt;`&quot;&quot;\\n # Mount the drive\\n New-PSDrive -Name Z -PSProvider FileSystem -Root &quot;\\\\\\\\danilopsync.file.core.windows.net\\\\&lt;SHARE_NAME&gt;&quot; -Persist\\n} else {\\n Write-Error -Message &quot;Unable to reach the Azure storage account via port 445.Check to make sure your organization or ISP is not blocking port 445, or use Azure P2S VPN, Azure S2S VPN, or Express Route to tunnel SMB traffic over a different port.&quot;\\n}\\n</code></pre>\\n<p>从这个脚本中,我获取了配置 DataSync 位置所需的信息:</p>\n<ul>\\n<li>SMB 服务器</li>\n<li>共享名称</li>\n<li>用户</li>\n<li>密码</li>\n</ul>\\n<p>回到 Amazon DataSync 控制台中,我依次选择 <strong>Tasks</strong>(任务)和 <strong>Create task</strong>(创建任务)。</p>\\n<p>为了配置任务的来源,我创建了一个位置。我为 <strong>Location Type</strong>(位置类型)选择了 <strong>Server Message Block (SMB)</strong>(服务器消息块(SMB)),然后选择之前创建的代理。然后,我使用在脚本中找到的信息输入用于身份验证的 <strong>SMB Server</strong>(SMB 服务器)地址、<strong>Share name</strong>(共享名称)和 <strong>User</strong>(用户)/<strong>Password</strong>(密码)。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/81395f0626b2476caf21732fa6d74b1a_image.png\\" alt=\\"image.png\\" /></p>\n<p>要配置任务的目的地,我再次创建一个位置。这次,我为 <strong>Location type</strong>(位置类型)选择了 <strong>Amazon FSx</strong>。我选择了之前创建的 FSx for Windows 文件系统,并使用默认共享名称。我使用<a href=\\"https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/default-custom-security-groups.html#default-security-group\\" target=\\"_blank\\">默认安全组</a>连接到文件系统。因为我将<a href=\\"https://aws.amazon.com/directoryservice/\\" target=\\"_blank\\">Amazon Directory Service for Microsoft Active Directory </a>与 FSx for Windows File Server 一起使用,所以我使用的是 <code>Amazon Delegated FSx Administrators</code>和 <code>Domain Admins</code>组的用户成员的凭证。有关更多信息,请参阅文档中的<a href=\\"https://docs.aws.amazon.com/datasync/latest/userguide/create-fsx-location.html\\" target=\\"_blank\\">为 FSx for Windows File Server 创建位置</a>。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/e604bbb665ea49bbb34bb51c13790fd2_image.png\\" alt=\\"image.png\\" /></p>\n<p>在下一步中,我输入任务的名称,并将所有其他选项保留为其默认值,就像对上一个任务所做的那样。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/760ecd7d8a7d4e818c300f167c5674ed_image.png\\" alt=\\"image.png\\" /></p>\n<p>我检查配置并创建任务。现在,我从控制台启动数据移动任务。几分钟后,这些文件将与我的 FSx for Windows 文件系统共享同步。我挂载了 Windows EC2 实例的文件系统共享,然后看到我的图片在那里。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/21bf9e87e996489ca163ef8d55fec931_image.png\\" alt=\\"image.png\\" /></p>\n<p>创建任务时,我可以重复使用现有位置。例如,如果我想将文件从 Azure 文件同步到我的 S3 存储桶,我可以快速选择我为这篇文章创建的两个对应位置。</p>\n<h4><a id=\\"_145\\"></a><ins><strong>可用性和定价</strong></ins></h4>\n<p>您可以使用 <a href=\\"https://console.aws.amazon.com/datasync/\\" target=\\"_blank\\">Amazon DataSync 控制台</a>、<a href=\\"https://aws.amazon.com/cli/\\" target=\\"_blank\\">Amazon 命令行界面(CLI)</a>或 <a href=\\"https://aws.amazon.com/tools/\\" target=\\"_blank\\">Amazon SDK</a> 来移动数据,以创建在 Amazon Storage 和 Google Cloud Storage 存储桶或 Azure 文件系统之间移动数据的任务。在任务运行时,您可以通过 DataSync 控制台或使用 CloudWatch 监控进度。</p>\\n<p>具备这些新功能的 <a href=\\"https://aws.amazon.com/datasync/pricing/\\" target=\\"_blank\\">DataSync 定价</a>没有任何变化。将数据移入和移出 Google Cloud 或 Microsoft Azure 的费用与当前 DataSync 支持的所有其他数据来源的费用相同。</p>\\n<p>Google Cloud 或 Microsoft Azure 可能会向您收取数据传输费用。由于 DataSync 在代理和 Amazon 之间进行复制时会压缩传输中的数据,因此您可以通过在 Google Cloud 或 Microsoft Azure 环境中部署 DataSync 代理来降低出站费用。</p>\n<p>使用 DataSync 将数据从 Amazon 移动到 Google Cloud 或 Microsoft Azure 时,您需要支付从 EC2 向互联网传输数据的费用。有关更多信息,请参阅 <a href=\\"https://aws.amazon.com/ec2/pricing/\\" target=\\"_blank\\">Amazon EC2 定价</a>。</p>\\n<p><ins><a href=\\"https://aws.amazon.com/datasync/getting-started/\\" target=\\"_blank\\"><strong>利用 Amazon DataSync 自动化并加快数据移动方式。</strong></a></ins></p>\\n<p>— <a href=\\"https://twitter.com/danilop\\" target=\\"_blank\\">Danilo</a></p>\n"}
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭