{"value":"### **0. 前言**\n嗨,大家好呀!最近我跟一个学摄影的高中朋友突然聊起天,发现摄影真的是一门我根本无法达到的艺术,我作为普通人,那只能说叫做拍照,哈哈。但给我更大的启发的是,这位朋友同时对星球星际也特别感兴趣,但正因为人类对宇宙的探索是十分有限的,我们即使通过高端的望远镜也只能领略到浩瀚宇宙的一角。有时候想到,宇宙中数十亿的星球聚集在一起,缩小到一定的比例,不就像一张由各个节点组成的网络吗?现实中我们的互联网、人体中的细胞、交际关系等,不都是这样吗?\n\n这个时候我就联想到,那如果我们做开发的时候,对于这种“关系网络”,应该如何更加优雅地去存储呢?关系型数据库显然不够优雅,毕竟谁也不想通过数量庞大地关系表来表示错综复杂的数据,而且也不直观。\n\n正因为如此,亚马逊推出了一款图数据库,用于解决这一问题。这就是大名鼎鼎的 [Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail)。Neptune 译为海王星,可以说是非常的形象了。更为重要的是,[Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail) 还支持免费试用,并且还提供了上手教程。只需要戳一下这里,就能开始使用了。[https://aws.amazon.com/cn/getting-started/databases/get-started/?nc=sn&loc=4&trk=fab55528-7c2e-4517-b90e-65b760ecfc1c&sc_channel=el](https://aws.amazon.com/cn/getting-started/databases/get-started/?nc=sn&loc=4&trk=fab55528-7c2e-4517-b90e-65b760ecfc1c&sc_channel=el)\n\n而且亚马逊这次提供的产品不仅仅只是 Neptune,亚马逊云科技提供了100余种产品免费套餐。其中,计算资源Amazon EC2首年12个月免费,750小时/月;存储资源 [Amazon S3](https://aws.amazon.com/cn/s3/?trk=cndc-detail) 首年12个月免费,5GB标准存储容量;数据库资源 [Amazon RDS](https://aws.amazon.com/cn/rds/?trk=cndc-detail) 首年12个月免费,750小时;Amazon Dynamo DB 25GB存储容量 永久免费。这边是入口:[https://aws.amazon.com/cn/free/?nc2=h_ql_pr_ft&all-free-tier.sort-by=item.additionalFields.SortRank&all-free-tier.sort-order=asc&awsf.Free%20Tier%20Types=*all&awsf.Free%20Tier%20Categories=*all&trk=e0213267-9c8c-4534-bf9b-ecb1c06e4ac6&sc_channel=el](https://aws.amazon.com/cn/free/?nc2=h_ql_pr_ft&all-free-tier.sort-by=item.additionalFields.SortRank&all-free-tier.sort-order=asc&awsf.Free%20Tier%20Types=*all&awsf.Free%20Tier%20Categories=*all&trk=e0213267-9c8c-4534-bf9b-ecb1c06e4ac6&sc_channel=el)\n### **1. [Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail) 是什么?**\n首先,我们来看亚马逊官方对 [Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail) 给的英文定义:\n\n![image.png](https://dev-media.amazoncloud.cn/1616ef9c06174007aef46889646345fb_image.png)\n\n我们将其翻译为中文:\n\n![image.png](https://dev-media.amazoncloud.cn/50870715bab44b16a56a784d8a3b1e32_image.png)\n\n通过官方定义我们了解到:[Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail) 是一款支持 Gremlin 等图形查询语言查询的图形数据库产品,并且对高数据量时性能问题进行了优化,适用于推荐引擎、欺诈检测、知识图表、药物发现和网络安全等领域。\n\n说到数据库产品,大家首先想到的可能是大名鼎鼎的关系型数据库 MySQL 。那么同为数据库,两者之间有什么区别呢?举个通俗易懂的例子,学习过关系型数据库的小伙伴应该都知道,在关系型数据库中,想要实现 用户-权限-关系 这个功能点,我们除了要设计三张主表外,还需要额外设计两张关系表,并且要通过设计复杂的外键,编写复杂的 SQL 语句,才能达到实现我们的产品,并且还要牺牲一部分性能,而 Neptune 则非常善于处理这种关系复杂的案例。这正是 Neptune 的用武之处。\n\n### **2. 案例复现 Neptune 的用武之处**\n在理解 Neptune 之前,我们先来看一下什么是图表数据库。\n\n![image.png](https://dev-media.amazoncloud.cn/b819d818e0d04810afbd8acbf6830af9_image.png)\n\n上图我们可以获得信息: Justin 的朋友是 Anna,Anna 喜欢 books 和 Movies,而 Justin 只喜欢 Movies。而从上一节我们知道,图表数据库更善于存储和查询数据项与数据项之间的关系。而对于上图,我们更加印证了这一点,想想如果用关系型数据库去表示上面的这些关系,既复杂,又不直观。\n\n上面的元素以及他们的关系,我们可以试图用更专业的词语去描述他们。比如:\n对于每个数据项,我们把他们叫做 vertices,也就是顶点。\n对于数据项之间的关系,我们把他们叫做 edges(边),每条边都有一种类型,并且由一个数据项指向另一个数据项。\n\n### **3. Neptune 可以运用于哪些领域?**\n在我们现实世界中,存在着各种各样的关系,而当我们需要描述这些关系的时候,就可以使用图表数据库。\n\n几种常见的领域:\n知识图谱:在这个领域中,我们可以将知识定义为顶点,知识的从属可以定义为边。例如 编程语言 和 Java 可以定义为顶点,Java 属于 编程语言这层关系定义为边。\n社交网络:将各种人物定义为顶点,把关系(朋友,老师,家长)定义为边。\n行车路线:把两座城市定义为顶点,把路的名称定义为边。\n物流:将货物的出发地和目的地定义为顶点,路线定义为边。\n\n### **4. 如何查询 Neptune 图数据库?**\n在第一节中,我们讲到,官方推荐我们可以使用 Gremlin 或 SPARQL 等流行的图形查询语言对 Neptune 数据库进行查询,接下来我们来演示一下。\n\n![image.png](https://dev-media.amazoncloud.cn/d545485fd64d4332bef1acea71bdfb7a_image.png)\n\n对于上图的关系,我们如果想要查询 Howard 的朋友的朋友,那么怎么编写代码呢?\nGremlin 遍历查询,返回 Howard 的朋友的朋友:\n\n```\\ng.V().has('name', 'Howard').out('friend').out('friend').values('name')\\n```\nSPARQL 遍历查询,返回 Howard 的朋友的朋友:\n```\\nprefix : <#>\\n\\n select ?names where {\\n ?howard :name \\"Howard\\" .\\n ?howard :friend/:friend/:name ?names .\\n }\\n```\n### **5. 使用 Neptune 图表笔记本**\n#### **5.1 使用方式及对比**\nNeptune 图表笔记本,顾名思义就是用于编写代码的工具,用于管理 Neptune 图数据库。亚马逊提供了两种方式使用笔记本。一种是在 **Neptune 工作台托管 Neptune 笔记本**,一种是**在本地计算机上设置图形笔记本。**\n对于使用笔记本的两种操作方式,主要的特点如下:\n\n![image.png](https://dev-media.amazoncloud.cn/0dd702d127b643d0a0db9e5dfe42e86d_image.png)\n\n通过综合对比之后发现,Neptune 工作台完全托管方式比本地安装更加方便,更加高效。\n#### **5.2 Neptune 工作台托管的使用方法**\n1、确保允许**入站规则**\n2、**登录** Amazon 管理控制台\n3、在左侧导航窗口,选择笔记本并**创建笔记本**\n\n![image.png](https://dev-media.amazoncloud.cn/1230c4d3551d432097a916726ee893bc_image.png)\n4、选择一个自己的**集群**,如果你自己没有集群的话,需要选择创建集群创建一个。\n5、创建好笔记本后选择**打开笔记本**即可。\n\n![image.png](https://dev-media.amazoncloud.cn/2456ad78a52443c4847aaeb9ab7c91da_image.png)\n\n### **6. 实验环境搭建**\n#### **6.1 实验环境搭建**\n**步骤一**:登录到 Amazon console,选择 cloudshell\n1、先进入亚马逊官网,找到 Amazon 管理控制台\n\n![image.png](https://dev-media.amazoncloud.cn/b17039e76dc74cb9b8735ef20b17eec6_image.png)\n\n2、搜索 cloudshell 服务并进入\n\n![image.png](https://dev-media.amazoncloud.cn/9d3beb8d5d564f3cb642fdd31ee2db11_image.png)\n\n将会来到一个控制台页面\n\n![image.png](https://dev-media.amazoncloud.cn/7080de6da2d14d068082c54ba2b75d01_image.png)\n\n**步骤二**:创建 S3 存储桶,取个不常见的名字,需要记住创建的名字,后面都会用到,在这个地方我将我的存储桶的名字命名为 myawsjackui,你可以任意的取一个名字。创建存储桶的命令如下:\n```\\naws s3api create-bucket --bucket 自己取个复杂点的名字 --region us-east-1\\n```\n\n你也可以使用手动的方式创建存储桶,方法如下:\n\n![image.png](https://dev-media.amazoncloud.cn/2032d6dda395409abf507ce76d33ad78_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/35b3196920a34b73a93946ed46bd0fe0_image.png)\n\n**步骤三**:创建 cloudformation\n创建 cloudformation 命令如下:\n```\\naws s3api create-bucket --bucket jack_for_test_one --region us-east-1\\n```\n创建完成后,控制台没有报错信息,此时你需要等待大约 30 分钟才能进行下一步。\n30 分钟过后,搜索 cloudformation ,找到对应的服务并打开\n\n![image.png](https://dev-media.amazoncloud.cn/d5a374b3279d4278af90f6351c94d747_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/0b4e99d4a236424dacfa86cc76aa4702_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/6b860ae2c48f40aea46708fd665997ac_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/6b702b1e27b04bbbbb773ba68499855a_image.png)\n\n#### **6.2 实验具体步骤(一)**\n**步骤一**:创建笔记本\n搜索 neptune ,打开对应的服务,找到笔记本选项,会发现目录下有一个名为aws-neptune-get-test的笔记本,打开该笔记本。\n\n![image.png](https://dev-media.amazoncloud.cn/729791aa618949e59effc1107d36518c_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/59086fab85bd4b3094bfe5857c335cd6_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/0439c4cb04cc4571959df828addd0781_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/0ba0bbf1f8b040e2939b5e0062920fb6_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/0035b65e9b4242f49203b0df78722254_image.png)\n\n步骤二:具体实验步骤\n1、运行 Neptune ML\n\n![image.png](https://dev-media.amazoncloud.cn/9ed8771de09141ad9abfbaa42851fc90_image.png)\n\n2、配置自己的存储桶及获取资源\n\n![image.png](https://dev-media.amazoncloud.cn/97c1d0af3ff14a6cbabdbe7d69f5804f_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/459eb6d29740416e86ec4fb8a0c6ad2f_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/9221aa1004254cc0b54680eb831305c6_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/912ca4f317ad4d569443bfa4711a6fb2_image.png)\n\n3、创建相关端点,等待约 5 - 10 分钟\n\n![image.png](https://dev-media.amazoncloud.cn/5305906c360e4b86ac47d9a1d7310acb_image.png)\n\n4、节点回归\n\n![image.png](https://dev-media.amazoncloud.cn/fb28ac269e714a089fdc63bde7fabb47_image.png)\n\n5、关联预测\n\n![image.png](https://dev-media.amazoncloud.cn/e543efcc687949a5a3055ad16c1135e4_image.png)\n\n#### **6.3 实验具体步骤(二)**\n\n1、项目运行流程图:\n\n![image.png](https://dev-media.amazoncloud.cn/b9bb689da25b4105a488f220bb3c575a_image.png)\n\n2、数据集包含电影、用户,以及用户对这些电影的评分信息,大致关系如下:\n\n![image.png](https://dev-media.amazoncloud.cn/38f01a72765b44b8b664bb5b11c157aa_image.png)\n\n3、同样是准备好**运行 Neptune ML**\n\n![image.png](https://dev-media.amazoncloud.cn/45f5a5a524884232bd4f2fab539e4219_image.png)\n\n4、加载数据\n\n![image.png](https://dev-media.amazoncloud.cn/f1d445a1813d4ae89143e7897f252d79_image.png)\n\n5、此时必须确认数据已经成功过加载\n\n![image.png](https://dev-media.amazoncloud.cn/32937b370f84474d808a17123bf9dd94_image.png)\n\n6、包括边缘数据\n\n![image.png](https://dev-media.amazoncloud.cn/0a718f8d52c74dccb4fe001bcaef1e13_image.png)\n\n7、导出数据\n完成数据验证操作后,我们首先需要移除一些 rated 顶点,以便构建可以预测这些缺失连接的模型。\n\n![image.png](https://dev-media.amazoncloud.cn/d70cc3aab2ec404a9eda82f43cc7c1ca_image.png)\n\n8、接下来我们需要除去这些边缘来模拟真实缺失的边缘\n\n![image.png](https://dev-media.amazoncloud.cn/65efd621fab14f1cb9f546b0c6015504_image.png)\n\n9、再一次检查数据,发现边缘已经去除\n\n![image.png](https://dev-media.amazoncloud.cn/c328c50bf1794a1a920ff74be421e136_image.png)\n\n10、导出对应的数据\n\n![image.png](https://dev-media.amazoncloud.cn/16ce77049e3943a5ab414b488db1b3e1_image.png)\n\n11、接下来要对数据进行处理、模拟训练和端点创建\n\n![image.png](https://dev-media.amazoncloud.cn/9e7216cc87f64bfcaf360971a7bd27d7_image.png)\n\n![image.png](https://dev-media.amazoncloud.cn/aaca39c7aa374d40ae14779a7bfcbfea_image.png)\n\n12、预测用户可能对哪些电影进行评论\n\n![image.png](https://dev-media.amazoncloud.cn/0fff3f17dabd4e4689d71d8a40f08d94_image.png)\n\n13、最后需要对数据进行清理\n\n![image.png](https://dev-media.amazoncloud.cn/a3d6fe495eb54556b508fe776188275e_image.png)\n\n### **7. 使用总结**\nNeptune 这款产品对我来说是眼前一亮的感觉,上手体验感非常优雅,支持常见的开放图谱 API,在安全方面方面也是提供了多级保护,并且完全托管的概念让开发者不在过多的关注如何管理数据库任务等等。\n\n[Amazon Neptune](https://aws.amazon.com/cn/neptune/?trk=cndc-detail) 的优势:\n1.使用方式十分优雅\n2.支持常见的开放图谱 API\n3.提供了多级保护的安全机制\n4.完全托管方式让操作更加方便\n5.在多级关系数据中查询效率很高\n6.解决了关系型数据库难以查询关系复杂的数据的痛点\n\n总而言之,在关系型数据库仍然占据主流的今天,很多领域,特别是大数据相关领域,对数据的查询效率要求非常高,需要更小更低的延迟,这种时候,传统的数据库从设计之初的角度就已经不够使用。你完全可以尝试使用一款全新的图数据库来更优雅地存储各种错综复杂地关系。","render":"<h3><a id=\\"0__0\\"></a><strong>0. 前言</strong></h3>\\n<p>嗨,大家好呀!最近我跟一个学摄影的高中朋友突然聊起天,发现摄影真的是一门我根本无法达到的艺术,我作为普通人,那只能说叫做拍照,哈哈。但给我更大的启发的是,这位朋友同时对星球星际也特别感兴趣,但正因为人类对宇宙的探索是十分有限的,我们即使通过高端的望远镜也只能领略到浩瀚宇宙的一角。有时候想到,宇宙中数十亿的星球聚集在一起,缩小到一定的比例,不就像一张由各个节点组成的网络吗?现实中我们的互联网、人体中的细胞、交际关系等,不都是这样吗?</p>\n<p>这个时候我就联想到,那如果我们做开发的时候,对于这种“关系网络”,应该如何更加优雅地去存储呢?关系型数据库显然不够优雅,毕竟谁也不想通过数量庞大地关系表来表示错综复杂的数据,而且也不直观。</p>\n<p>正因为如此,亚马逊推出了一款图数据库,用于解决这一问题。这就是大名鼎鼎的 Amazon Neptune。Neptune 译为海王星,可以说是非常的形象了。更为重要的是,Amazon Neptune 还支持免费试用,并且还提供了上手教程。只需要戳一下这里,就能开始使用了。<a href=\\"https://aws.amazon.com/cn/getting-started/databases/get-started/?nc=sn&loc=4&trk=fab55528-7c2e-4517-b90e-65b760ecfc1c&sc_channel=el\\" target=\\"_blank\\">https://aws.amazon.com/cn/getting-started/databases/get-started/?nc=sn&loc=4&trk=fab55528-7c2e-4517-b90e-65b760ecfc1c&sc_channel=el</a></p>\\n<p>而且亚马逊这次提供的产品不仅仅只是 Neptune,亚马逊云科技提供了100余种产品免费套餐。其中,计算资源Amazon EC2首年12个月免费,750小时/月;存储资源 Amazon S3 首年12个月免费,5GB标准存储容量;数据库资源 Amazon RDS 首年12个月免费,750小时;Amazon Dynamo DB 25GB存储容量 永久免费。这边是入口:<a href=\\"https://aws.amazon.com/cn/free/?nc2=h_ql_pr_ft&all-free-tier.sort-by=item.additionalFields.SortRank&all-free-tier.sort-order=asc&awsf.Free%20Tier%20Types=*all&awsf.Free%20Tier%20Categories=*all&trk=e0213267-9c8c-4534-bf9b-ecb1c06e4ac6&sc_channel=el\\" target=\\"_blank\\">https://aws.amazon.com/cn/free/?nc2=h_ql_pr_ft&all-free-tier.sort-by=item.additionalFields.SortRank&all-free-tier.sort-order=asc&awsf.Free%20Tier%20Types=*all&awsf.Free%20Tier%20Categories=*all&trk=e0213267-9c8c-4534-bf9b-ecb1c06e4ac6&sc_channel=el</a></p>\\n<h3><a id=\\"1__Amazon_Neptune__8\\"></a><strong>1. Amazon Neptune 是什么?</strong></h3>\\n<p>首先,我们来看亚马逊官方对 Amazon Neptune 给的英文定义:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/1616ef9c06174007aef46889646345fb_image.png\\" alt=\\"image.png\\" /></p>\n<p>我们将其翻译为中文:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/50870715bab44b16a56a784d8a3b1e32_image.png\\" alt=\\"image.png\\" /></p>\n<p>通过官方定义我们了解到:Amazon Neptune 是一款支持 Gremlin 等图形查询语言查询的图形数据库产品,并且对高数据量时性能问题进行了优化,适用于推荐引擎、欺诈检测、知识图表、药物发现和网络安全等领域。</p>\n<p>说到数据库产品,大家首先想到的可能是大名鼎鼎的关系型数据库 MySQL 。那么同为数据库,两者之间有什么区别呢?举个通俗易懂的例子,学习过关系型数据库的小伙伴应该都知道,在关系型数据库中,想要实现 用户-权限-关系 这个功能点,我们除了要设计三张主表外,还需要额外设计两张关系表,并且要通过设计复杂的外键,编写复杂的 SQL 语句,才能达到实现我们的产品,并且还要牺牲一部分性能,而 Neptune 则非常善于处理这种关系复杂的案例。这正是 Neptune 的用武之处。</p>\n<h3><a id=\\"2__Neptune__21\\"></a><strong>2. 案例复现 Neptune 的用武之处</strong></h3>\\n<p>在理解 Neptune 之前,我们先来看一下什么是图表数据库。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/b819d818e0d04810afbd8acbf6830af9_image.png\\" alt=\\"image.png\\" /></p>\n<p>上图我们可以获得信息: Justin 的朋友是 Anna,Anna 喜欢 books 和 Movies,而 Justin 只喜欢 Movies。而从上一节我们知道,图表数据库更善于存储和查询数据项与数据项之间的关系。而对于上图,我们更加印证了这一点,想想如果用关系型数据库去表示上面的这些关系,既复杂,又不直观。</p>\n<p>上面的元素以及他们的关系,我们可以试图用更专业的词语去描述他们。比如:<br />\\n对于每个数据项,我们把他们叫做 vertices,也就是顶点。<br />\\n对于数据项之间的关系,我们把他们叫做 edges(边),每条边都有一种类型,并且由一个数据项指向另一个数据项。</p>\n<h3><a id=\\"3_Neptune__32\\"></a><strong>3. Neptune 可以运用于哪些领域?</strong></h3>\\n<p>在我们现实世界中,存在着各种各样的关系,而当我们需要描述这些关系的时候,就可以使用图表数据库。</p>\n<p>几种常见的领域:<br />\\n知识图谱:在这个领域中,我们可以将知识定义为顶点,知识的从属可以定义为边。例如 编程语言 和 Java 可以定义为顶点,Java 属于 编程语言这层关系定义为边。<br />\\n社交网络:将各种人物定义为顶点,把关系(朋友,老师,家长)定义为边。<br />\\n行车路线:把两座城市定义为顶点,把路的名称定义为边。<br />\\n物流:将货物的出发地和目的地定义为顶点,路线定义为边。</p>\n<h3><a id=\\"4__Neptune__41\\"></a><strong>4. 如何查询 Neptune 图数据库?</strong></h3>\\n<p>在第一节中,我们讲到,官方推荐我们可以使用 Gremlin 或 SPARQL 等流行的图形查询语言对 Neptune 数据库进行查询,接下来我们来演示一下。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/d545485fd64d4332bef1acea71bdfb7a_image.png\\" alt=\\"image.png\\" /></p>\n<p>对于上图的关系,我们如果想要查询 Howard 的朋友的朋友,那么怎么编写代码呢?<br />\\nGremlin 遍历查询,返回 Howard 的朋友的朋友:</p>\n<pre><code class=\\"lang-\\">g.V().has('name', 'Howard').out('friend').out('friend').values('name')\\n</code></pre>\\n<p>SPARQL 遍历查询,返回 Howard 的朋友的朋友:</p>\n<pre><code class=\\"lang-\\">prefix : <#>\\n\\n select ?names where {\\n ?howard :name "Howard" .\\n ?howard :friend/:friend/:name ?names .\\n }\\n</code></pre>\\n<h3><a id=\\"5__Neptune__61\\"></a><strong>5. 使用 Neptune 图表笔记本</strong></h3>\\n<h4><a id=\\"51__62\\"></a><strong>5.1 使用方式及对比</strong></h4>\\n<p>Neptune 图表笔记本,顾名思义就是用于编写代码的工具,用于管理 Neptune 图数据库。亚马逊提供了两种方式使用笔记本。一种是在 <strong>Neptune 工作台托管 Neptune 笔记本</strong>,一种是<strong>在本地计算机上设置图形笔记本。</strong><br />\\n对于使用笔记本的两种操作方式,主要的特点如下:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0dd702d127b643d0a0db9e5dfe42e86d_image.png\\" alt=\\"image.png\\" /></p>\n<p>通过综合对比之后发现,Neptune 工作台完全托管方式比本地安装更加方便,更加高效。</p>\n<h4><a id=\\"52_Neptune__69\\"></a><strong>5.2 Neptune 工作台托管的使用方法</strong></h4>\\n<p>1、确保允许<strong>入站规则</strong><br />\\n2、<strong>登录</strong> Amazon 管理控制台<br />\\n3、在左侧导航窗口,选择笔记本并<strong>创建笔记本</strong></p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/1230c4d3551d432097a916726ee893bc_image.png\\" alt=\\"image.png\\" /><br />\\n4、选择一个自己的<strong>集群</strong>,如果你自己没有集群的话,需要选择创建集群创建一个。<br />\\n5、创建好笔记本后选择<strong>打开笔记本</strong>即可。</p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/2456ad78a52443c4847aaeb9ab7c91da_image.png\\" alt=\\"image.png\\" /></p>\n<h3><a id=\\"6__80\\"></a><strong>6. 实验环境搭建</strong></h3>\\n<h4><a id=\\"61__81\\"></a><strong>6.1 实验环境搭建</strong></h4>\\n<p><strong>步骤一</strong>:登录到 Amazon console,选择 cloudshell<br />\\n1、先进入亚马逊官网,找到 Amazon 管理控制台</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/b17039e76dc74cb9b8735ef20b17eec6_image.png\\" alt=\\"image.png\\" /></p>\n<p>2、搜索 cloudshell 服务并进入</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/9d3beb8d5d564f3cb642fdd31ee2db11_image.png\\" alt=\\"image.png\\" /></p>\n<p>将会来到一个控制台页面</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/7080de6da2d14d068082c54ba2b75d01_image.png\\" alt=\\"image.png\\" /></p>\n<p><strong>步骤二</strong>:创建 S3 存储桶,取个不常见的名字,需要记住创建的名字,后面都会用到,在这个地方我将我的存储桶的名字命名为 myawsjackui,你可以任意的取一个名字。创建存储桶的命令如下:</p>\\n<pre><code class=\\"lang-\\">aws s3api create-bucket --bucket 自己取个复杂点的名字 --region us-east-1\\n</code></pre>\\n<p>你也可以使用手动的方式创建存储桶,方法如下:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/2032d6dda395409abf507ce76d33ad78_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/35b3196920a34b73a93946ed46bd0fe0_image.png\\" alt=\\"image.png\\" /></p>\n<p><strong>步骤三</strong>:创建 cloudformation<br />\\n创建 cloudformation 命令如下:</p>\n<pre><code class=\\"lang-\\">aws s3api create-bucket --bucket jack_for_test_one --region us-east-1\\n</code></pre>\\n<p>创建完成后,控制台没有报错信息,此时你需要等待大约 30 分钟才能进行下一步。<br />\\n30 分钟过后,搜索 cloudformation ,找到对应的服务并打开</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/d5a374b3279d4278af90f6351c94d747_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0b4e99d4a236424dacfa86cc76aa4702_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/6b860ae2c48f40aea46708fd665997ac_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/6b702b1e27b04bbbbb773ba68499855a_image.png\\" alt=\\"image.png\\" /></p>\n<h4><a id=\\"62__122\\"></a><strong>6.2 实验具体步骤(一)</strong></h4>\\n<p><strong>步骤一</strong>:创建笔记本<br />\\n搜索 neptune ,打开对应的服务,找到笔记本选项,会发现目录下有一个名为aws-neptune-get-test的笔记本,打开该笔记本。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/729791aa618949e59effc1107d36518c_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/59086fab85bd4b3094bfe5857c335cd6_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0439c4cb04cc4571959df828addd0781_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0ba0bbf1f8b040e2939b5e0062920fb6_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0035b65e9b4242f49203b0df78722254_image.png\\" alt=\\"image.png\\" /></p>\n<p>步骤二:具体实验步骤<br />\\n1、运行 Neptune ML</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/9ed8771de09141ad9abfbaa42851fc90_image.png\\" alt=\\"image.png\\" /></p>\n<p>2、配置自己的存储桶及获取资源</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/97c1d0af3ff14a6cbabdbe7d69f5804f_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/459eb6d29740416e86ec4fb8a0c6ad2f_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/9221aa1004254cc0b54680eb831305c6_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/912ca4f317ad4d569443bfa4711a6fb2_image.png\\" alt=\\"image.png\\" /></p>\n<p>3、创建相关端点,等待约 5 - 10 分钟</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/5305906c360e4b86ac47d9a1d7310acb_image.png\\" alt=\\"image.png\\" /></p>\n<p>4、节点回归</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/fb28ac269e714a089fdc63bde7fabb47_image.png\\" alt=\\"image.png\\" /></p>\n<p>5、关联预测</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/e543efcc687949a5a3055ad16c1135e4_image.png\\" alt=\\"image.png\\" /></p>\n<h4><a id=\\"63__163\\"></a><strong>6.3 实验具体步骤(二)</strong></h4>\\n<p>1、项目运行流程图:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/b9bb689da25b4105a488f220bb3c575a_image.png\\" alt=\\"image.png\\" /></p>\n<p>2、数据集包含电影、用户,以及用户对这些电影的评分信息,大致关系如下:</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/38f01a72765b44b8b664bb5b11c157aa_image.png\\" alt=\\"image.png\\" /></p>\n<p>3、同样是准备好<strong>运行 Neptune ML</strong></p>\\n<p><img src=\\"https://dev-media.amazoncloud.cn/45f5a5a524884232bd4f2fab539e4219_image.png\\" alt=\\"image.png\\" /></p>\n<p>4、加载数据</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/f1d445a1813d4ae89143e7897f252d79_image.png\\" alt=\\"image.png\\" /></p>\n<p>5、此时必须确认数据已经成功过加载</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/32937b370f84474d808a17123bf9dd94_image.png\\" alt=\\"image.png\\" /></p>\n<p>6、包括边缘数据</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0a718f8d52c74dccb4fe001bcaef1e13_image.png\\" alt=\\"image.png\\" /></p>\n<p>7、导出数据<br />\\n完成数据验证操作后,我们首先需要移除一些 rated 顶点,以便构建可以预测这些缺失连接的模型。</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/d70cc3aab2ec404a9eda82f43cc7c1ca_image.png\\" alt=\\"image.png\\" /></p>\n<p>8、接下来我们需要除去这些边缘来模拟真实缺失的边缘</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/65efd621fab14f1cb9f546b0c6015504_image.png\\" alt=\\"image.png\\" /></p>\n<p>9、再一次检查数据,发现边缘已经去除</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/c328c50bf1794a1a920ff74be421e136_image.png\\" alt=\\"image.png\\" /></p>\n<p>10、导出对应的数据</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/16ce77049e3943a5ab414b488db1b3e1_image.png\\" alt=\\"image.png\\" /></p>\n<p>11、接下来要对数据进行处理、模拟训练和端点创建</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/9e7216cc87f64bfcaf360971a7bd27d7_image.png\\" alt=\\"image.png\\" /></p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/aaca39c7aa374d40ae14779a7bfcbfea_image.png\\" alt=\\"image.png\\" /></p>\n<p>12、预测用户可能对哪些电影进行评论</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/0fff3f17dabd4e4689d71d8a40f08d94_image.png\\" alt=\\"image.png\\" /></p>\n<p>13、最后需要对数据进行清理</p>\n<p><img src=\\"https://dev-media.amazoncloud.cn/a3d6fe495eb54556b508fe776188275e_image.png\\" alt=\\"image.png\\" /></p>\n<h3><a id=\\"7__220\\"></a><strong>7. 使用总结</strong></h3>\\n<p>Neptune 这款产品对我来说是眼前一亮的感觉,上手体验感非常优雅,支持常见的开放图谱 API,在安全方面方面也是提供了多级保护,并且完全托管的概念让开发者不在过多的关注如何管理数据库任务等等。</p>\n<p>Amazon Neptune 的优势:<br />\\n1.使用方式十分优雅<br />\\n2.支持常见的开放图谱 API<br />\\n3.提供了多级保护的安全机制<br />\\n4.完全托管方式让操作更加方便<br />\\n5.在多级关系数据中查询效率很高<br />\\n6.解决了关系型数据库难以查询关系复杂的数据的痛点</p>\n<p>总而言之,在关系型数据库仍然占据主流的今天,很多领域,特别是大数据相关领域,对数据的查询效率要求非常高,需要更小更低的延迟,这种时候,传统的数据库从设计之初的角度就已经不够使用。你完全可以尝试使用一款全新的图数据库来更优雅地存储各种错综复杂地关系。</p>\n"}