与Serverless的第一次亲密接触 | U刻
  • 与Serverless的第一次亲密接触

    栏目:技术分享

    Servrless概念
    Serverless 是一个架构上的概念,从字面上理解就是无服务器架构。Serverless最初是用于描述依赖第三方服务实现对逻辑和状态进行管理的应用,典型的例子是单页 Web 和移动 App 这种富客户端应用,他们一般都使用基于云端的数据库(例如Parse、Firebase),认证服务(Auth0、AWS congnito)等。这些第三方服务通常称为 BaaS(Backend as a Service) 。Serverless 的第二种含义,是用来描述这样一种应用架构:除了使用第三方 BaaS 服务外,一部分服务端逻辑仍然由应用的研发人员实现,但是跟传统架构不同在于,这部分服务端代码运行于无状态的容器中,可以由事件触发,短暂的,完全被第三方管理。业界对 Serverless 的热议,大部分集中第二种,因为第二种形式代码托管代表技术更新,以 FaaS(Function as a Service) 而闻名。根据第二种场景,有一个最新的定义是:Serverless 架构是基于互联网的系统,其中应用开发不使用常规的服务进程。相反,它们仅依赖于第三方服务(例如 AWS Lambda 服务),客户端逻辑和服务托管远程过程调用的组合。后面叙述都是基于第二种定义来进行,也就是基于 FaaS 函数计算服务来实现的 Serverless 应用架构,在这个定义上可以简单把 Serverless 等同 FaaS。

    Serverless 和 PaaS的关系
    FaaS 与 PaaS的概念在某些方面有许多相似的地方。人们甚至认为 FaaS 就是另一种形式的 PaaS,但是 Intent Media 的工程副总裁 Mike Roberts 提出一个微妙的差别:“大部分PaaS应用无法针对每个请求启动和停止整个应用程序,而 FaaS 平台生来就是为了实现这样的目的。” AWS 云架构战略副总裁 Adrian Cockcroft 曾经针对两者的界定给出了一个简单的方法:“如果你的PaaS 能够有效地在20毫秒内启动实例并运行半秒,那么就可以称之为 Serverless”。我理解两个人的意思,都是认为传统的 PaaS 和 FaaS 的抽象层次不一样,PaaS 是对整个应用的抽象,FaaS 是对应用逻辑的单位(函数)的抽象。举例来说,PaaS 不是针对每个请求来拉起一个服务,它是常驻的服务,而 FaaS 是根据每个请求来拉起一个容器来执行,属于更细粒度的拆分。也就是:PaaS 托管的是整个应用,而 FaaS 托管应用的某个碎片化的逻辑代码,从资源使用率和成本角度更具优势。

    Serverless 和 BaaS 的关系
    BaaS 和 Serverless 的区别主要在于,BaaS 是一般是第三方提供的后端服务,例如 AWS 提供的Congito就是典型的 BaaS 服务,业界比较成功的 BaaS 服务几乎都是为移动开发的后端云服务,例如 Facebook 的 Parese, google 的 Firebase, 国内 LeandCloud,提供的功能大同小异,都是实时数据库,消息推送等等。BaaS 的粒度介乎 PaaS 和 FaaS, PaaS 是提供了应用运行环境,而是BaaS将特定应用变成一个云服务。而应用想实施 Serverless 架构,还是需要自己的服务代码来组合这些 BaaS 服务来满足自己的业务逻辑,而且服务代码要通过 FaaS 来管理。用两张图说明两者区别,两个图是都是实现一个广告点击行为数据处理,Click Processor 是实际处理动作的服务。第一张图 Click Processor 是一个 BaaS 服务,进程常驻,每次都由这个进程处理。第二张图把它改造成 Serverless 架构,每次点击拉起一个进程执行一个函数,函数托管在 FaaS 服务中。

    与 Serverless 的第一次接触
    想象一下,你是一名 Web 开发工程师,你接到一个需求需要做一个单页面应用,上传一张图并在几秒后获得一张梵高风格化的图,像这样:

    遇到这种情况,一般…嗯……先 Google 一下,找到了这个:
    alexjc/neural-doodle
    它的效果大概是这样:

    先过一遍步骤:
    1.浏览器发请求给服务端,body 是一张图片的二进制数据;
    2.服务端从 body 中取出二进制数据,转成图片,调用 doodle.py 中的方法,转换风格存储之并返回存储位置;
    3.浏览器按位置请求图片并展示之。

    但是有几个问题,如果这个 SPA 出乎意料的受欢迎,接口负载过高呢?是不是要升级,加机器,加负载均衡?如果来了一个新需求或者简单的 bugfix,是不是又涉及到批量更新节点,这还是没有考虑日志,运维,监控等运营方面的工作量。根据前面对Serverless的介绍,这个场景很适合用Serverless产品来解决,这是一个典型的无状态服务+计算的自动扩展,这些问题交给Serverless服务提供方即可。下面我选择UCloud的Serverless产品UGC来搭建这个服务,并测试一下效果,看是否能满足我的需求。

    试用 Serverless 产品(UCloud UGC)
    根据官方的介绍,UCloud通用计算(UCloud General Compute)是分布式大规模并行计算服务。可提供数万核级的并发计算能力,系统自动完成任务调度,并按实际使用量计费。UGC充分利用一个区域内的多个可用区计算资源,提供了基于云平台的跨可用区级别的高可用性、高安全性和高并发性。UGC可满足图片处理、机器学习、大数据处理、生物数据分析等领域的计算需求。

    下图其中一个使用场景:
    UCloud基于UGC的高效并行计算能力搭建的对象存储(UFile)图片处理服务,得以轻松支持用户每天千万级别的图片处理请求,满足用户对高时效的需求。

    很适我们本次梵高风格化图片的需求。下面是我这次搭建服务过程:
    1.创建私有仓库(WEB界面)
    2.登录镜像仓库(cli)
    3.制作梵高风格转换镜像(cli)(如果你认真看文档,你会发现其实 alexjc/neural-doodle 其实是有直接提供镜像的,^_^)
    4.上传镜像(cli)
    5.查看镜像详情(WEB界面)
    6.告警模板配置(WEB界面)
    7.使用 SDK 提交任务(Python SDK)
    8.查看任务执行统计WEB界面)
    9.查看监控(WEB界面)

    下面是详细的操作步骤:
    |> 创建私有仓库

    |> 下载梵高风格转换镜像
    镜像介绍页面:https://hub.docker.com/r/alexjc/neural-doodle/
    我们直接从 Docker 官方下载它:
    docker pull alexjc/neural-doodle

    |> 修改镜像名称
    docker tag alexjc/neural-doodle cn-bj2.ugchub.service.ucloud.cn/kevingao/neural-doodle:first

    |> 登录UCloud镜像仓库
    docker login cn-bj2.ugchub.service.ucloud.cn

    |> 上传镜像
    将我们刚才下载的镜像上传到UCloud镜像仓库
    docker push cn-bj2.ugchub.service.ucloud.cn/kevingao/neural-doodle:first

    |> 查看镜像信息

    |> 告警模板配置
    目前包含超时与失败两个模板可以直接使用。

    |> 使用SDK提交风格转换任务
    在Python SDK中配置自己账号的公私钥和Docker image 路径,然后使用 Web后端调用,发布风格转换任务。
    至此我们风格转换接口就就绪了,使用相同的方法搞定打水印的镜像,我们先使用脚本测试一下接口,然后通过UCloud UGC服务后台来查看执行的情况

    |> 查看任务执行统计
    包含调用次数、成功率、结果、花费CPU时间等信息。

    下面我们就要开始前端的制作了。

    前端交互
    Web App有两个功能,打水印和梵高风格转换,
    它们的交互基本是一致的,这里我截图打水印的页面来做演示:
    第一步:选择图片

    第二步:上传图片 (也可以直接使用UGC 对象存储功能)

    第三步:输入要打的水印(镜像需要的参数)

    第四步:返回结果展示

    第五步:统计任务执行结果

    如上文所见,这个简单的Web APP完成了『图片梵高风格化』和『图片打水印』两个功能,这里它体现了UGC的两大优点:
    1.计算能力自动扩展,处理一张照片与处理100张照片的时间花费是一样的;
    2.高并发,UGC拥有多节点数万核的资源支持可以轻松支持高并发的请求。

    附UGC 官网:https://www.ucloud.cn/site/product/ugc.html

    9