中国(China)

Trip.com Group
Trip.com Group
切换到Cilium以实现可扩展的云原生网络 Trip.com集团有限公司是一家跨国旅游服务集团,为来自全球200个国家、使用40多种语言的客户提供服务。他们的业务由庞大的IT基础设施支持,部署了Kubernetes集群,包括本地部署和AWS、阿里巴巴云等云环境。平台团队有100多人,负责管理从Kubernetes到支持10,000名工程师的CI/CD等一切。 平台团队内的网络团队有9人,其中3人正在负责Cilium。这个团队管理着超过20,000个节点的部署,包括本地物理节点和阿里巴巴云和AWS上的spot实例,总共支持超过350,000个pod。 最初,Trip.com的基础设施在很大程度上依赖于基于OpenStack Neutron的内部开发的CNI。然而,随着他们的Kubernetes集群的扩大,他们遇到了一些挑战,因为他们的解决方案是针对虚拟机而不是容器和云原生的动态世界构建的。性能和稳定構成了他們遇到的問題,集中式IPAM和更改網絡設備配置的限制影響了可擴展性。他們現有的網絡設計無法支持業務的快速增長,並且核心網絡設備條目的數量接近硬件限制。在面臨這些困境的激勵下,他們開始尋找一個適合的云原生解決方案。 Trip.com評估了幾個潛在的選項,包括流行的Kubernetes網絡解決方案和他們自己內部開發的CNI。他們的標準很明確:他們需要一個能夠克服目前硬件限制、解決集中式IPAM的性能瓶頸、提高集群可擴展性、適應未來與Kubernetes整合的云原生解決方案,提供安全的網絡策略,能夠在混合雲環境中運行,並提供卓越的數據平面性能。 在評估之後,Cilium成為了理想的選擇。它的節點本地網絡模型和使用eBPF而不是iptables的方式與Trip.com的可擴展性要求完美契合。此外,Cilium的云原生和功能豐富特性正是Trip.com所追求的。Cilium背後活躍而充滿活力的社區進一步鞏固了他們的決定。 “我們嘗試過Flannel和Calico,並擴展我們自己的解決方案以支持Kubernetes,但發現Cilium以用eBPF取代iptables並刪除kube-proxy的方式創造了一個更高效和可擴展的解決方案。有了Cilium,我們擁有非常快速的IPAM,即使在集群中有數千個節點,它也能輕松擴展。” Jaff Cheng,高级软件开发人员,Trip.com Cilium的好处不仅限于网络 在选择Cilium之后,Trip.com开始将现有的网络基础架构转移到Cilium上。他们的部署策略非常全面:在私有云中,他们利用Cilium的直接路由结合Bird BGP进行路由广告,而在公有云中,他们使用相应的IPAM插件从VPC子网分配IP地址。这使得他们无论集群在何处运行,都能获得相同的网络体验。 Cilium还为他们提供了在各个云平台上一致的安全体验。安全策略通过Kubernetes联邦进行同步,并使用Cilium的主机防火墙功能在Pod和主机上执行策略。网络访问/审计事件由Hubble收集,并通过自管理的ELK堆栈显示。Hubble还用于捕获网络流事件,如TCP连接请求,并用于了解他们应用程序在某个时间点发生了什么。 “eBPF为Cilium带来了很多可能性,使其能够在其之上构建强大的功能。” Jaff Cheng,高级软件开发人员,Trip.com 通过Cilium建立统一的网络和安全解决方案 对于Trip.com的平台团队来说,转向Cilium是一个巨大的成功。它解决了他们的网络可扩展性挑战,降低了运营成本,增强了稳定性。这次转变使他们能够在整个基础设施上集中网络功能,并为未来的增长做好准备。除了网络功能之外,Cilium还使Trip.com能够观察和保护他们的应用程序。随着他们展望未来,Trip.com计划进一步利用Cilium的功能来深入了解和优化性能,确保满足旅行行业不断变化的需求。 “Cilium非常稳定。我们在生产环境中运行了将近5年,数据平面没有发生任何重大事故,这对我们的应用程序非常重要。 当你没有问题时,你就注意不到它。我们相信Cilium不仅在大规模生产环境中准备就绪,而且在性能、功能和社区方面也是最佳选择之一。” Jaff Cheng,高级软件开发人员,Trip.com 要深入了解他们对Cilium的使用技术细节,请查看以下博客: Trip.com: First Step towards Cloud Native Networking Trip.com: Stepping into Cloud Native...
September 13, 2023

中国移动
中国移动
移动云,发展最快的云 目前,移动云的公有云IaaS+PaaS市场份额国内排名第七,增速全球第一。私有云份额位列第5、政务云已进入行业前3。目前移动云已经为百万企业客户提供服务,并拥有1200多家生态合作伙伴。移动云秉承“5G时代,你身边的智慧云”理念,以云原生开源技术及标准为基础,充分发挥自身产品与技术创新优势,联合产业生态,为客户提供全栈云原生产品家族,帮助客户应用敏捷、业务智能,安全可信,面向未来持续演进。 2022年,移动云计划打造一款多集群管理平台,用于对底层的多个超大规模集群提供一个运维、管理的入口。具体来说,当时主要面临两个问题: 1. 多集群检索 2. 兼容不同版本的Kubernetes 在考虑了多种不同的解决方案之后,移动云选择了Clusterpedia。“首先,clusterpedia使用简单并且稳定。”李莉说,“因为Clusterpedia是一个比较新的项目,我们一开始是抱着尝试的态度。但通过实践证明,Clusterpedia完全能够承担起生产的重任,它至今稳定的工作着。”另外,该团队表示,Clusterpedia内部对版本兼容处理非常严谨,客户端完全不用改代码,甚至不用升级client-go,这个特点帮助他们减少了很升级多成本。 “Clusterpedia改善了我们在多集群中查询的体验” — 李莉,云原生团队leader 在引入Clusterpedia之前,没有一个合适的多集群资源检索工具,随着业务的增长,数据中心的规模在不断的扩大,快速在多集群中检索到一个特定的资源是一个急需解决的问题。“我们需要在一个面板上能检索到所有K8s集群上的资源,”李莉说,“此前,我们要详细记录每个K8s集群上运行着哪些应用,然后再基于这个记录去对应的K8s集群上查找,而现在,我们可以基于Clusterpedia做到快速的多集群资源检索,极大地提升了多集群资源查找效率”。 “Clusterpedia同时也解放了我们的运维人员,它给我们的运维人员提供了一个统一的面板,让我们的运维人员在排查问题时不再为多集群之间的切换而烦恼。” 李莉说,“Clusterpedia节省了我们的运维人员至少50%的运维时间。” “同时,Clusterpedia除了为多集群提供了一个强有力的资源检索工具,它还提供了多集群资源的Watch功能。基于此,我们实现了对多集群资源状态事件的统一汇聚,从而实现了对多集群资源状态监控和处理。” “此外,我们基于Clusterpedia成功的对一些产品组件进行了多集群能力改造,我们使用client-go的informer监控Clusterpedia的APIServer从而感知任意集群工作负载的状态,并进行相应的事件处理” “用户希望能够不改动任何代码,像是在单集群那样使用多集群,他们使用client-go、kubectl与Kubernetes交互。”李莉说,“Clusterpedia与原生Kubernetes api完全兼容,我们对Clusterpedia进行了一些小的改造,让它能够承担起多集群APIServer的角色。” “Clusterpedia是一个优秀的开源项目,我们在享受它带来的便利的同时,也一直在思考能为社区做些什么。” — 李莉,云原生团队leader “Clusterpedia是我们在CNCF发现的宝藏,在对社区索取的同时,我们也积极的参与到了对社区的贡献当中,”李莉说,“上文中提到的多集群资源的Watch功能,就是基于我们的业务需求,设计、研发、并最终回馈给社区的。在今后的工作中,我们期待和Clusterpedia社区有更深入的合作。我们计划研究一套多集群解决方案,可以让应用像运行在单集群上一样运行在多集群上,除了对多集群资源的读操作外,还有对多集群资源的增删改,另外还会涉及到多集群资源调度,多集群网络,多集群监控等领域。我们期待和社区一起成长。”
March 16, 2023

京东
京东
按营收计算,JD.com 是全球第三大互联网企业,同时也总是把自己定位为“以零售为核心业务的科技企业,”京东产品经理兼 CNCF 大使 Vivian Zhang 张丽颖 说。 京东技术架构负责开发超大规模容器化 Kubernetes 平台,支持京东业务的各个层面,包括有 3.8 亿活跃用户的网站,和当日或次日即可处理 90% 以上订单的电子商务物流基础设施。 2016 年,团队需要云原生registry,维护其镜像中心仓库。具体来说,就是平台需要解决以下问题的解决方案: 用户授权和基本认证; 授权用户的访问控制; 镜像中心的 UI 管理; 镜像漏洞扫描,实现镜像安全。 团队考察了包括Docker原生的registry在内的多个解决方案,发现原生注册表有两个主要几个问题问题:需要进行授权认证,镜像元信息需要穿越整个文件系统。这样一来,使用原生registry,“无法达到我们对性能的要求,” Vivian 说。 Harbor 是 CNCF 自2018 年开始托管的云原生注册表项目,最终成为“最适合我们的产品,” Vivian 说,“Harbor 导入数据库,加速了镜像元信息的获取,更重要的是提高了性能。” Harbor 同时整合了 Helm 的chart存储库功能,支持 Helm...
June 24, 2020

中国民生银行
中国民生银行
中国民生银行始建于1996年,是中国第一家非政府所有的国家商业银行。 Zhang Li 说民生的文化就是要敢为人先。“我们银行总是走在金融行业的技术前沿,”民生容器云技术负责人 Zhang 先生说。在两年前,这句话的意思就是“我们必须要在云原生技术上领先于他人。” 但民生所有的旧有应用程序都是用 C 和 Java 语言编写的,采用的也都是传统架构,比如核心银行系统、支付系统、渠道系统等。“我们想要做分布式应用程序,是因为我们以前的数据中心用过 VM,很贵,资源利用率也很低,” Zhang 先生说,“我们面临的最大挑战是怎么让传统的旧有应用程序能够适应云原生环境。” Zhang 先生坚信 Kubernetes 是建立云原生环境的关键,因此选择和阿里云合作。“阿里云是 Kubernetes 和其他 CNCF 项目在中国的主要贡献者,所以我们非常信任他们,”Zhang先生说。从2019年开始,“他们帮我们启动了这次转型,我们也给他们反馈意见,这样他们就能根据反馈优化其他行业的产品和服务。” 迄今为止,约有20个应用程序在 Kubernetes 平台上实现生产。30个新的应用程序在积极开发,准备采用 Kubernetes 平台。“阿里云容器服务帮助民生实现创新业务的快速增长,”阿里云容器服务Kubernetes高级架构师 Eric Li说。现在,所有用于 AI、区块链和大数据分析的应用程序都要建在平台上。 因此,开发、运营和维护效率提高了3倍,CPU 的资源利用率和存储翻了一番有余。部署时间从若干小时缩短到若干分钟。 “我们花两年时间做了大量实践,从失败和成功当中吸取经验教训,最终成为云原生。这需要我们解放思想、打开视野,去了解当今世界的状况。我们需要随时跟踪技术发展,取得其他团队的信任。” — 民生银行容器云技术负责人 ZHANG...
January 23, 2020

京东
京东
作为中国最大的零售商和全球收入第三大的互联网公司,京东的电子商务业务为三亿多活跃客户提供服务。 该公司还拥有中国最大的电子商务物流基础设施,覆盖了中国99%的人口,实现了90%以上的订单在同一天或第二天送达。 “这几年京东数据库服务最大的变化是,我们的数据变得更加广泛,我们的MySQL数据库变得更大,直接导致了性能的,运营和维护成本提高,”京东零售首席架构师刘海锋,领导技术基础设施部门,负责推动基于容器基础设施的创新以及发展超大型,容器化,基于Kubernetes的平台,赋能京东所有方面的业务。他表示:“我们需要一个解决方案,使我们能够轻松快速地扩展MySQL,方便操作和维护,并降低硬件和维护成本。” 该公司以前使用JProxy,一个基于cobar而改造的数据库中间件系统来管理MySQL数据库。经过全面的评估,海锋说:“我们最终选择了Vitess,因为它是最适合解决我们面临的最大挑战:大规模数据库服务的可伸缩管理,以及支持MySQL中复杂事务数据的在线扩展。我们现在使用Kubernetes在容器化环境中运行MySQL数据库,并使用Vitess进行可伸缩的集群管理和处理大量复杂的事务数据。” 作为Vitess的早期采用者 – 同时也是全球规模最大、最复杂的vitess使用者之一 – 也面临着一些挑战。海锋说:“重新分片的过程最初是手工的,性能很差,编排器在拥有5000多个实例的大型集群中可能会失败。” 为了确保Vitess能够在京东的规模下工作,海锋的团队进行了大量的改进和更改,包括bug修复和新的功能和特性。他们还为该公司的JDOS Kubernetes平台开发了性能优化和自动化管理工具。其中包括: JTransfer是一个在线数据同步和传输工具,可以实时将数据从京东的传统MySQL数据库迁移到Vitess集群。Vitess中的所有拓扑信息都存储在etcd中。 BinLake是一个MySQL binlog服务平台,以无状态集群化服务实时收集Vitess和传统MySQL数据库服务中的binlog,并将收集到的Binlog发布到消息队列服务(JMQ)。与Vitess集成后,“BinLake以集群的形式提供智能的、高可用、自动扩展的binlog收集服务,”海锋说:“如果在Vitess中有重新分片或故障转移,Binlake将自动调整binlog采集的目标数据库实例。” Mole是一个带有GUI控制台的Vitess管理系统,它改进了Vitess服务管理。“有了Mole,我们可以很容易地创建、重新分割、监视和备份Vitess的keyspace空间。”海锋说。 “我们的大部分改进都回馈到Vitess代码库,社区中的其他开发者可以从中受益。”海锋说。 “我们最终选择了Vitess,因为它是最适合解决我们面临的最大挑战的解决方案:大规模数据库服务的可伸缩管理。” — 京东零售首席架构师刘海锋 通过Vitess,京东看到了数据库集群的可伸缩性和弹性方面的改进。资源利用率和效率的提高,以及操作和运维职能的自动化也导致了劳动力和资源成本的降低。 此外,“Vitess帮助团队提高了他们在可伸缩管理和弹性数据库领域的技术知识和实力,”海锋说:“Vitess是一个CNCF项目的事实意味着我们可以从与最活跃、增长最快的开源社区中的大量开发者和最终用户的合作中获益。通过CNCF的支持,Vitess可以获得越来越多的关注,吸引更多的终端用户,并将开发者聚集到项目中。这对Vitess及其终端用户非常有益,这对我们很重要。” 海锋和他的团队对Vitess的未来感到兴奋。除了将系统迁移到新发布的Vitess 3.0(海锋称之为“重大改进”),他们还在为最新版本开发一些通用功能,并开发一个更完整的操作和维护监控系统。 “Vitess是一个CNCF项目的事实意味着我们可以从与最活跃、增长最快的开源社区中的大量开发者和最终用户的合作中获益。” — 京东零售首席架构师刘海锋 对于其他考虑使用Vitess的组织,海锋建议:“当Vitess与Kubernetes协同使用时,它可以产生最大的价值。在使用Vitess之前,有必要进行更多的测试和研究,以确定Vitess是否适合你的业务,并更好地理解你可能需要进行哪些调整,才能将其集成到现有系统中。” 对于京东来说,Kubernetes、Vitess和其它云原生技术已经改变了游戏规则。“现代服务平台需要可伸缩、高效和敏捷。”海锋说:“云原生技术非常适合处理这些不断变化的环境。它为软件服务提供了灵活性、效率、可伸缩性、独立性、持续集成和交付,所有这些都进一步提高了软件服务的质量和资源效率。Kubernetes已经成为事实上的标准,云原生是未来的必然选择。”
August 1, 2019

蚂蚁金服
蚂蚁金服
作为跨国集团阿里巴巴成立的分支公司,蚂蚁金服增长迅速,估值超过 1500 亿美元。 作为跨国集团阿里巴巴成立的分支公司,蚂蚁金服增长迅速,估值超过 1500 亿美元。这家金融科技创业公司于 2014 年成立,旗下包含全球最大的在线支付平台支付宝,同时还通过充分利用科技创新推出了多项其他服务。支付宝拥有 9 亿多用户,每天都有海量的交易通过其本地和全球合作伙伴达成。2017 年双十一高峰期的每秒交易量高达 256,000 笔,2018 年双十一的商品成交额更是高达 310 亿美元。蚂蚁金服以“为世界带来更多平等的机会”为使命,致力于通过科技创新能力,搭建一个开放、共享的信用体系和金融服务平台。 除了金融服务外,蚂蚁金服还运营着其他业务,例如花呗在线信用系统、借呗借款服务、以及拥有 3.5 亿用户的蚂蚁森林绿色能量移动应用。存储和计算集团产品管理负责人 Haojie Hang 对此表示,蚂蚁金服面临着“以全新方式处理数据的挑战。我们认为这一处理规模会带来三个严峻挑战:1. 如何提供实时计算、存储和处理能力,以便开展为欺诈检测提供实时建议等工作;2. 如何从这些数据中挖掘智能,尽管当前我们有很多数据,但我们并未能从中获得足够的洞察;3. 如何在应用程序级别、中间件级别、系统级别甚至是芯片级别保证安全性。” 为了应对这些挑战并为其客户提供可靠和一致的服务,蚂蚁金服在 2014 年采用了 Docker 容器化技术。但很快,他们便意识到需要一款编排解决方案,来支持公司数据中心内拥有数万个节点的集群。 该团队研究了多项技术,包括 Docker Swarm 和 Mesos 等。Hang...
July 31, 2019

中国联通
中国联通
中国联通拥有超过 3 亿用户,是中国三大电信运营商之一。 中国联通拥有超过 3 亿用户,是中国三大电信运营商之一。为了提供优质服务,该公司设立了多个数据中心,每个数据中心配有数千台服务器;此外,该公司从 2016 年起开始使用 Docker 容器化及 VMWare 和 OpenStack 基础设施。平台技术研发室主任张呈宇表示:“遗憾的是,资源利用率相对较低,我们缺乏一款能够支持我们数百个应用的云平台。” 张呈宇带领团队开展新技术和平台研发,希望获得一款理想的 IT 管理解决方案。中国联通以前是一家国有独资企业,近年开始吸收 BAT(百度、阿里巴巴、腾讯)和京东等私企的投资,如今正着手使用开源技术而非商用产品加强内部开发。有鉴于此,该团队开始为其云基础设施部署开源编排功能。 尽管中国联通已经使用 Mesos 建设其核心电信运营商系统,但该团队认为 Kubernetes 是这一全新云平台的天然之选。张呈宇表示:“Kubernetes 的主要优势是拥有成熟的社区,而且增势强劲,有助于我们充分借鉴他人的最佳实践。”中国联通还将 Istio、Envoy、CoreDNS 和 Fluentd 用于其微服务框架。 该公司支持 Kubernetes 的云平台现在托管了 50 项微服务,正助力其迈向新的发展阶段。中国联通开发人员可通过 API 轻松利用这一技术,无需自行开展开发工作。这一云平台提供了 20-30...
April 5, 2019

网易
网易
它的游戏业务是世界上最大的游戏业务之一,但这并不是网易为中国消费者提供的唯一服务。 该公司还经营电子商务、广告、音乐流媒体、在线教育和电子邮件平台。2015年,为这些业务提供基础设施的网易云团队,意识到当时的研发流程已经不能满足业务的发展需求。“我们的用户需要自己准备所有基础设施。”网易云架构师、轻舟微服务技术负责人冯常健说,“我们希望通过基于Serverless的容器服务,为他们提供一套自动化的基础设施和工具。” 在考虑建立自己的业务流程解决方案后,网易云决定将其私有云平台建立在Kubernetes上,诞生于Google的事实让网易云团队相信它可以跟上网易的规模。“经过2到3个月的评估,我们相信它可以满足我们的需求。”冯常健说。 该团队在2015年Kubernetes 1.0版本发布之前就开始使用Kubernetes,因为它相对容易使用,并且在公司启用了DevOps。“我们放弃了Kubernetes的一些概念,仅使用了标准化的框架。”冯常健说,“我们利用Kubernetes的可编程性,以便我们可以构建一个平台来满足内部客户的升级和部署需求。” 最初,网易云聚焦于构建容器平台来更好地管理资源,后续通过添加监控等工具,开始致力于提升对微服务架构的支持,这意味着网易云又集成了Prometheus,Envoy,Harbor,gRPC和Helm等CNCF项目。据冯常健介绍:“我们正在努力提供一个简单和标准的流程,以使得我们的用户可以利用我们的最佳实践”。 并且这个团队也在继续做出改进,比如电商业务需要混合部署,在过去这需要使用2套独立的平台:基础设施平台和Kubernetes平台。最近,网易云在此基础上研发了一套跨平台的应用,实现2个平台的一站式部署。 “该系统可以在一个集群中支持30,000个节点。在生产环境中,曾达到过单个集群10,000个节点的数据。内部大部分互联网业务正在使用该系统进行开发、测试和生产。” — 曾宇星,网易云架构师 目前,该系统“可以在一个集群中支持30,000个节点。”网易云架构师曾宇星说,“在生产环境中,曾达到过单个集群10,000个节点的数据。内部大部分互联网业务正在使用该系统进行开发、测试和生产。” 根据网易云团队的数据,Kubernetes使研发效率提高了100%以上,部署效率提高了280%。“在过去,如果我们想进行升级,需要与其他团队甚至其他部门的同事协作。”冯常健说,“我们需要专门的人员来准备一切,之前通常会花费大约半个小时的工作,现在5分钟内就可以完成。”新平台还支持GPU和CPU资源的混合部署,这些改进也提高了资源的利用率。 “我们利用Kubernetes的可编程性,以便我们可以构建一个平台来满足内部客户的升级和部署需求。” — 冯常健,网易云架构师、轻舟微服务技术负责人 基于内部平台的使用经验,网易云开始对外提供基于Kubernetes的云平台和面向微服务的一站式解决方案——轻舟微服务平台。冯常健说:“我们希望将这些内部业务遇到的问题和经验产品化,满足外部客户的需求。” 无论是否使用网易云产品,网易云都鼓励其他公司尝试Kubernetes。“只要公司拥有一支成熟的团队和足够的开发者,我认为Kubernetes是一种非常好的技术,可以帮助到企业。”网易云Kubernetes开发者李岚清说。 作为最终用户和云服务提供商,网易云在社区中也非常活跃,积极学习其它公司的经验,并分享其实践案例。网易云团队也一直在参与Harbor和Envoy项目的社区贡献,基于网易的规模体量提供测试反馈。冯常健说:“我们是一个专注于面向微服务解决方案的团队,通过与社区的合作,我们可以获得经验并从中受益,我们可以看到社区的关注点和面临的挑战,并参与其中。”
March 14, 2019

宜信
宜信
宜信是中国领先的金融科技企业集团,为个人客户、企业和初创企业提供多种贷款和理财服务。 公司以“宜人宜己,美好生活”为使命,致力于利用大数据金融云、物联网等技术,快速开发创新产品和服务。 在过去的12年里,随着公司的成长,它建立在VMWare Vsphere之上的传统大块头正在艰难地追赶。该公司想要解决的挑战有很多:应用程序在线花费的时间太长,而且很难确保环境的一致性。应用程序具有复杂的生命周期管理,具有多个生产和构建环境。自动缩放和快速开发是不可能的。最重要的是,使用的商业软件非常昂贵。容器云架构师陈晓宇表示:“在当前的互联网环境下,开发和交付的长周期是不合适的。” 拥抱微服务、容器化和持续交付使得“更快地完成产品迭代、发现问题和更早地解决问题成为可能,”晓宇说。但是,由于生产环境中有成千上万个容器,宜信需要一个管理系统,该系统还提供应用程序监视服务,如调用链跟踪和网络监视,以及一组支持多种语言的CI/CD系统。 在考虑了许多技术之后,宜信团队选择Kubernetes进行编排。“Kubernetes在整体架构、设计理念和社区活动方面是最好的,”晓宇说。另外,“Kubernetes由CNCF托管是非常重要的,CNCF保证了Kubernetes的中立性,这意味着它不与商业供应商绑定。对Kubernetes的跨行业投资促进了该技术的发展。” 宜信团队在迁移微服务运行在Kubernetes,已经节省了大量时间。“通过将微服务打包到容器中并使用Kubernetes,可以更快地完成应用程序更新和回滚,”晓宇说。在整个大型应用程序中,不再存在由一小段错误代码引起停机的风险。 “目前的产品迭代越来越快,因为在线交付在最短的时间内完成。” — 陈晓宇,宜信容器云架构师 “因为不同的团队可以负责不同的服务,他们可以更快地完成产品的迭代和更新,而不需要等待整个项目的发布,”晓宇补充道:“容器集群支持公司的大部分业务场景,因此,一方面,提高了开发和交付效率,另一方面,节省了商业软件的成本。” 除了Kubernetes,宜信平台还使用其它CNCF技术,包括Prometheus、Helm和Harbor。“我们使用容器镜像存储库Harbor,它在clair中执行镜像扫描,Helm作容器部署,Docker作运行时,Flannel作网络插件以及NFS作共享存储。”晓宇说。 “因为不同的团队可以负责不同的服务,他们更快地完成产品的迭代和更新,而不是等待整个项目的发布。” — 陈晓宇,宜信容器云架构师 对于其他考虑云原生架构和实践的公司,晓宇有这样的建议:“他们需要相关技术人员的参与,他们应该使用社区活动最高的项目,这样任何问题都可以及时得到解决。” 有了这两件事,宜信已经成功地过渡到云原生。“当前的产品迭代越来越快,因为在线交付在最短的时间内完成,”晓宇说:“Kubernetes将继续推动和支持公司未来更多的业务场景。”
January 29, 2019

思岚科技
思岚科技
思岚科技成立于2013年,提供服务机器人自主定位和导航解决方案。 在这个快速发展的领域,公司的成功建立在其研发团队快速引入并不断迭代其核心产品的能力之上。 为了保持这种发展速度,该公司在过去几年开始寻求建立自己稳定可靠的容器云平台来托管其物联网应用程序。在基于阿里巴巴云和VMware vSphere的遗留基础设施上,思岚科技团队已经采用了微服务架构和持续交付,用于“细粒度的按需伸缩、故障隔离、易于开发、测试和部署,以及促进高速迭代,”云计算事业部主管奔牛 奔牛说。因此,“我们对云平台的需求包括高可用性、可伸缩性和安全性;多粒度监控报警功能;对容器和微服务的友好性;完善的CI/CD支持。” 在对现有技术进行评估之后,奔牛的团队选择了Kubernetes作容器编排。“CNCF为Kubernetes带来了质量保证和完整的生态系统,这对于Kubernetes的广泛应用是非常重要的,”奔牛说。此外,“避免绑定到基础设施技术或供应商可以帮助我们确保我们的业务在跨区域环境中部署和迁移,并可以为全世界的用户提供服务。” 同时,思岚科技决定采用其它CNCF项目。“我们建立了一个基于Prometheus和Fluentd的监控和日志系统,”奔牛说:“Prometheus/Fluentd与Kubernetes的集成非常方便,具有多维度的数据监控和日志收集功能。” 该公司使用Harbor作为容器镜像存储库。“Harbor的复制功能帮助我们在私有和公共云上实现CI/CD,”奔牛说:“此外,多项目支持、认证和政策配置以及与Kubernetes的集成也是很好的功能。”Helm被用作软件包管理,团队正在评估Istio框架。“我们很高兴Kubernetes和这些框架可以无缝集成。”奔牛补充说。 “CNCF为Kubernetes带来了质量保证和完整的生态系统,这对Kubernetes的广泛应用非常重要。” — 季奔牛,思岚科技云计算事业部总监 使用这个新平台,奔牛报告说思岚科技已经经历了“18个月以上100%的稳定性!”对于用户来说,现在没有任何服务停机和无缝升级。“我们从Kubernetes提供的网络和存储抽象中获益,”奔牛说:“对外部服务的依赖可以与服务解耦,并置于集群的统一管理之下。” 使用Kubernetes和Istio“显著减少了50%的微服务配置和维护工作,”他补充说。使用Prometheus和Fluentd提供的集中度量监视和日志聚合功能,团队可以节省50%的故障排除和调试时间。Harbor复制允许生产/登台/测试环境跨公有云和私有Kubernetes集群共享同一个容器注册表,从而节省了30%的CI/CD工作。此外,奔牛补充说:“Helm通过其丰富的共享chart加速了原型开发和环境设置。” 简而言之,奔牛说,思岚科技的新平台正在帮助它实现它的一个主要目标:快速、简单地发布产品。有了多个发布模型和集中控制接口,该平台正在改善开发者的生活。思岚科技还提供了一个统一的API,用于根据用户的特定需求开发自动化部署工具。 “我们从Kubernetes提供的网络和存储抽象中获益,对外部服务的依赖可以与服务解耦,并置于集群的统一管理之下。” — 季奔牛,思岚科技云计算事业部总监 考虑到自己在云原生的成功,思岚科技有一建议给那些正在考虑跨出这一步的组织。“对于已经容器化的服务,你应该尽快将它们迁移到云原生架构,并享受云原生生态系统带来的优势,”奔牛说:“要迁移传统的、非容器化的服务,除了服务本身的体系结构更改之外,还需要充分考虑构建云原生体系结构所需的操作和维护工作负载。” 尽管如此,对思岚科技来说,成本效益分析非常简单。“云原生技术适合于微服务架构,适合于快速迭代和敏捷开发,并且它有一个相对完善的生态系统和活跃的社区,”奔牛说:“它帮助我们确保业务的高可用性,同时提高开发和测试效率,缩短研发周期,实现产品的快速交付。”
January 17, 2019