![知乎封面.PNG](https://dev-media.amazoncloud.cn/450d8a421494426eb1a32025f2d0a72e_%E7%9F%A5%E4%B9%8E%E5%B0%81%E9%9D%A2.PNG "知乎封面.PNG")
流处理系统(下文简称流系统)是现代数据栈中十分重要的技术方向,它们是针对流数据的实时分析而量身定做的。在过去的几十年里,研究人员和从业人员投入了大量的精力来开发大规模,高性能和高可用的流处理系统。基于这些努力,现如今,开源抑或商业化的流系统已在各大公司的技术栈中长期运行,支持着成千上万的应用,包括广告推荐、欺诈检测、物联网分析,诸如此类。
随着流处理领域取得的重大进展,越来越多的公司开始研究现代流系统,并渴望看到现代技术如何改变他们的业务。可惜的是,其中许多公司在他们的试水过程中陷入困境。他们抱怨流系统的采用成本太高,究其原因,主要有两点:
* **难以学习**。学习如何使用流系统绝非易事。与提供SQL接口的传统数据库(如MySQL和PostgreSQL)不同,绝大多数流式系统都要求用户学习一套特定平台的编程接口(很可能是Java)来处理流数据。对于非技术人员来说,掌握流系统几乎成为一项不可能完成的任务。更糟糕的是,流系统以不同于数据库的方式表示数据。用户必须编写复杂的数据处理逻辑,以能在流系统和数据库之间传输数据。
* **维护成本高昂**。如今许多流行的流系统是开源的,你可以轻易获得自动化的部署脚本和docker镜像。但开源从来都不意味着免费或实惠。在真实业务中,负载时常会因需求而突然波动。这使得企业们不得不采购大规模的机器集群来应对最坏的情况。这时部署和维护一个流系统的成本很可能超过购买机器的成本。试想,要组建一个愿意熬夜运维系统的工程师团队,这是如何令人头痛的问题。
## 平民化的流处理
流处理不应该是高门大户的特权。它不应该被当作一个只能由天才工程师才能驾驭的异类。流处理应该惠及每个人,从数据科学家到决策者,从大型企业到小型企业。在RisingWave Labs(曾用名 Singularity Data),我们致力于将流处理推广至普罗大众。我们所研发的RisingWave,一个云原生流数据库,将使流处理变得简单、实惠,并且人人都能使用。
## 简单的流处理
RisingWave是一个分布式的流数据库。它提供标准的SQL接口,兼容PostgreSQL语言标准,使其与PostgreSQL生态系统能够无缝集成,并几乎无需改动代码。RisingWave将流视作表,并允许用户以优雅的方式在流数据和历史数据之上编写复杂的查询语句。有了RisingWave,用户就可以纯粹专注于他们的查询分析逻辑,而无需学习Java或特定系统的底层API。
## 实惠的流处理
RisingWave是为云设计的。云原生架构使得RisingWave能够充分利用云平台提供的弹性资源。作为一个完全托管的服务,RisingWave可以在云上自助部署、维护和扩容,而不受琐碎细节干扰。一旦用户设定了他们的服务级别协议(SLA),RisingWave就会自动在云中组装不同层级的计算和存储资源,以最小的成本实现性能目标。RisingWave是Serverless的:用户按使用情况支付服务费用。除非使用服务,否则用户无需付费。我们还在不断优化服务,以确保RisingWave即使对小企业来说也能轻易负担。
## 开放的流处理
我们相信,一个伟大的产品,来自于一个繁荣开放的社区的集体智慧。我们并不依靠一小撮专家的经验来开发RisingWave,而是与开源社区携手一起设计和实现。我们决定以Apache 2.0许可证开源RisingWave内核,这是一个宽松的自由软件许可证。RisingWave社区是开放的:每个人都可以参与RisingWave项目路线图的设计;每个人都可以在自己的云提供商上部署分布式流数据库;每个人都可以为社区做出贡献并提供反馈。RisingWave社区是协作共赢的:我们渴望与其他社区一起构建现代实时数据基础设施栈。我们正积极与实时流平台Confluent,Redpanda以及StreamNative的社区合作,为关键业务释放生产力。