阿里云云原生

其他

技术干货:解密最受欢迎的开源 Serverless 框架弹性技术实现

数量,从而实现基于请求的自动扩缩容。图片来源:https://knative.dev/docs/serving/request-flow/基于请求数的弹性算法Autoscaler
2023年9月3日
科技

Koordinator 异构资源/任务调度实践

来分配设备,这样就导致无法获得全局最优的资源编排,也就是从根本上无法发挥资源效能。比如一个集群内有两台节点,都有相同的设备,剩余的可分配设备数量相等,但是实际上两个节点上的设备所在的硬件拓扑会导致
2023年8月3日
其他

基础篇丨链路追踪(Tracing)其实很简单

Native为了应对分布式环境下的不一致、模糊性等前文提到的各类问题问题,人们试图通过请求粒度的轨迹追踪与数据透传,实现节点间的确定性关联,分布式链路追踪技术也由此诞生。里程碑事件:Google
2023年3月22日
其他

年终盘点丨最受开发者欢迎的文章 TOP20

正式开源,形成高可用的三架马车,帮助企业构建稳定可靠的企业级生产系统,提高企业面对容灾、容错、容量等问题的稳态系统建设能力。18如何做“健康码”的性能压测随着无线设备的普及和
2022年12月30日
其他

解读 K8s Pod 的 13 种异常

仓库镜像,需配置镜像加速服务。镜像拉取超时常见于带宽不足或镜像体积太大,导致拉取超时。可以尝试在节点上手动拉取镜像,观察传输速率和传输时间,必要时可以对集群带宽进行升配,或者适当调整
2022年11月9日
其他

阿里云易立:以增效促降本,容器服务全面进入智能化时代

容器技术已经跨越鸿沟,广泛应用于金融、通讯、制造、交通等千行百业。Kubernetes支撑的工作负载也从早期单一的互联网应用发展到数据库、AI、大数据等等,并覆盖了公共云、专有云、边缘云等多样化、动态的云环境。11月5日,2022杭州
2022年11月6日
其他

K8s 有损发布问题探究

提供了延迟注册、服务预热的解决方案,功能概述如下:延迟注册功能允许用户指定一段时长,程序在启动后,会先完成设定的等待,再将服务发布到注册中心,在等待期间,程序有机会完成初始化,避免了服务请求的涌入。
2022年11月4日
其他

Koordinator 1.0 正式发布:业界首个生产可用、面向规模场景的开源混部系统

StatefulSet)即可以预留资源。资源预留在容量管理、碎片优化、调度成功率和重调度等场景有重要作用:当有重要的工作负载在未来某段时间需要资源时,可以提前预留资源满足需求。用户在
2022年11月4日
其他

阿里云张建锋:核心云产品全面 Serverless 化

的新零售代表,当发现老架构无法满足大促时流量爆炸问题,于是果断将会员系统、交易系统、支付系统等放在阿里云函数计算上处理,告别了靠扩展机器支撑大体量业务,促销准备时间从周级缩短到小时级,研发运维提效
2022年11月3日
其他

国内唯一|阿里云入选 Gartner 应用性能监控与可观测魔力象限

人的必备核心竞争力。不止于观测,可观测帮助企业分析、洞察并实现高质量的决策与业务创新。而阿里云将不断推动可观测技术演进与落地实践,帮助企业真正实现高质量数字化转型与创新。
2022年9月7日
其他

我们总结了弹性伸缩的五个条件与六个教训

不一样。总之,根据延时去做弹性策略是很危险的一种做法。3、指定单一的扩容规格扩容规格指的是资源的规格,比如在云上的场景中,对于同一种
2022年9月4日
其他

Ingress Nginx 接连披露高危安全漏洞,是否有更好的选择?

社区认识到了这个架构问题的严重性,已经开始计划做控制面和数据面的分离。若继续保持现有架构,未来可能会爆出更严重的安全漏洞。值得注意的是,这种架构除了会导致上述安全问题,还会导致容器
2022年7月21日
其他

一位 sealer maintainer 的心路历程

拉取。但这不是我们期望的,因为我们在构建阶段缓存的容器镜像就是为当前启动阶段准备的,并且在专有云交付场景下,集群网络是与外界隔离的。对于这个问题,我们最初的可选解决思路是使用
2022年7月1日
自由知乎 自由微博
其他

K8s 网关选型初判:Nginx 还是 Envoy?

就是典型的流量网关;业务网关提供独立业务域级别的、与后端业务紧耦合策略配置,随着应用架构模式从单体演进到现在的分布式微服务,业务网关也有了新的叫法
2022年5月29日
其他

成本节省 50%,10 人团队使用函数计算开发 wolai 在线文档应用

上,把所有的功能进行拆分之后,发生事故的概率大大降低。即便发生问题,我可以通过快速回滚来解决问题。现在我们的研发习惯每天至少发布一个版本,当天所有解决的问题都会发布,相比传统的软件公司来说,部署在
2022年5月21日
其他

sealer 成为 CNCF Sandbox 项目,旨在构建分布式应用交付新标准

社区版:https://github.com/alibaba/CNStackCommunityEdition欢迎钉钉扫描下方二维码或搜索群号
2022年5月9日
其他

参加 KubeVela 开源之夏,给你的云计算编程能力加个 Buff

Native结识志同道合的小伙伴,和技术大牛一起贡献开源匹配资深的开源社区导师,在为期三个月的开发周期中,导师指导进行对应项目的开发工作根据项目开发“战绩”得活动奖金及证书奖励欢迎参与
2022年4月28日
其他

从概念、部署到优化,Kubernetes Ingress 网关的落地实践

Provider。这种做法会带来新的问题,无法针对外部流量或者内部流量做精细化的流量治理,同时扩大了故障影响面。最佳的做法是针对外网、内网的场景分别独立部署
2022年4月28日
其他

资源画像,让容器资源规格的填写不再纠结

配置会远高于其实际的资源利用率,产生大量的浪费。相关统计数据表示,在大部分在线服务的生产环境中,集群的资源利用率处于相当低的水平。当集群分配率较高时,为了提升集群资源利用率,管理员会主动缩小容器的
2022年4月27日
其他

Java 定时任务技术趋势

访问,同时还有阿里云的多层安全防护,防止恶意攻击。多租户隔离机制:支持多地域、命名空间和应用级别的隔离。权限管控:支持控制台读写的权限管理,客户端接入的鉴权。企业级高可用SchedulerX2.0
2022年4月9日
其他

阿里巴巴云原生混部系统 Koordinator 正式开源

标准能力扩展而来,致力于解决多样工作负载混部在一个集群、节点场景下的调度、运行时性能以及稳定性挑战。项目包含了混合工作负载编排的一套完整解决方案,包括精细化资源调度、任务调度、差异化
2022年4月6日
其他

恭喜我的同事丁宇入选年度 IT 领军人物

领导者象限。同时,丁宇也是国内最早的云原生布道师之一,发布国内首本云原生架构白皮书,成为企业落地云原生的必备参考。丁宇也是开源文化的践行者,带领团队打造了多款云原生领域广受开发者好评的开源项目,如
2022年3月31日
其他

31 家企业入选阿里云首期云原生加速器,共建云原生行业新生态

次业务对接,开放阿里云生态和业务资源,提供技术和产品支持,链接更多资本与创投资源,与加速器成员企业共同打造云原生的新蓝图。从技术领域来看,在首批云原生加速器成员企业中,云原生
2022年3月9日
其他

深度解密|基于 eBPF 的 Kubernetes 问题排查全景图发布

CPU,这时候我们会发现这类恶意的进程创建应该被监测起来,这时候我们可以通过集成开源的进程事件检测库来是实现,但这往往需要打包、测试、发布这一整套流程,全部走完可能一个月就过去了。相比之下,eBPF
2022年3月8日
其他

AHPA:开启 Kubernetes 弹性预测之门

可以定时伸缩,看起来可以解决弹性滞后的问题,但具体定时粒度有多细、业务量有变化时需要频繁地手动调节定时弹性策略吗?如果这样做,这就会带来非常繁重的运维复杂度,也很容易出错。04AHPA
2022年3月7日
其他

在阿里巴巴,我们如何先于用户发现和定位 Kubernetes 集群问题?

链路探测:模拟广义用户行为,探测链路和系统是否异常定向检测:检查集群异常指标,发现未来存在或可能存在的风险点系统增强:发现问题提速增效,根因分析发现问题之后:后置检查和自愈,Chat-Ops
2022年3月1日
其他

最佳实践:Kubernetes 集群中 DNS 故障的可观测性与根因诊断

Log,可以帮我们我们快速地定位一些问题发生的位置,完成问题的整个定界过程。此外我们可以将日志上传到云端,做日志持久化、绘出趋势图等等,甚至我们可以做一些域名访问的审计,例如识别到集群内某一个
2022年2月28日
其他

阿里云资深专家李国强:云原生的一些趋势和新方向

架构等。最后还有一块是云原生应用的运维,当你的应用架构和系统架构变成云原生之后,它的可观测性、高可用也需要一些对应的能力,包括我们的压测能力,高可用能力等。05最全面的云原生开源贡献Cloud
2022年2月20日
其他

从中心走向边缘——深度解析云原生边缘计算落地痛点

货运物联等;产业边缘/行业云:也基于云计算能力之上,围绕行业应用及场景,提供套件产品及解决方案,比如物流云、航天云等。总的来说,基于业务定义的边缘计算,更多是面向智能设备及实体产业,对智能设备,从
2022年2月19日
其他

微服务用户为什么要用云原生网关

Ingress,可观测、安全等方面都需要二次开发再集成,这些关键短板都阻碍着技术发展。今天来看云原生网关如何助你解决这些痛点,优雅玩转云上微服务架构升级。01微服务(网关)的发展Cloud
2022年2月17日
其他

重新理解“无容灾不上云”:应用多活将成为云原生容灾新趋势

AppActive。这也是开源领域首次提出“应用多活”概念。项目地址:https://github.com/alibaba/Appactive阿里云开源业内首个应用多活项目
2022年2月10日
其他

深度解析|基于 eBPF 的 Kubernetes 一站式可观测性系统

引入的端到端复杂度复杂度是永恒的,我们只能找到方法来管理它,无法消除它,云原生技术的引入虽然减少了业务应用的复杂度,但是在整个软件栈中,他只是将复杂度下移到容器虚拟化层,并没有消除(如图
2022年2月9日
其他

KubeVela v1.2 发布:你要的图形化操作控制台 VelaUX 终于来了!

版本的发布,同时也实现了高度可扩展的应用发布工作流,它天然以混合环境架构呈现,创新性的实现了交付工作流与应用抽象相结合的工作模式,实现了面向终态的应用交付工作流,大大简化了流程编排的复杂性。时间来到
2022年2月7日
其他

技术盘点:容器技术的演进路线是什么?未来有哪些想象空间?

ChaosBlade,对容器集群的不同风险动作,注入不同的异常案例,从VM、K8s、网络、存储到应用的全方面故障模拟。精细化的流控风控:针对压测和故障演练过程中发现的异常进行防护能力建设,可以借助
2022年2月6日
其他

如何做“健康码”的性能压测

应用上挂载探针,即可自动获取应用、API、机器维度的秒级监控。对于报错的请求,可以直接定位到调用链上报错的方法堆栈,省去了大量排查问题的时间,是定位问题的“利器”。定位报错方法堆栈示例如下:成本让利
2022年1月26日
其他

阿里云开源业内首个应用多活项目 AppActive,与社区共建云原生容灾标准

日,在上海的云原生实战峰会上,阿里云智能研究员丁宇发布了“应用多活技术白皮书”,同时为了推动业界容灾的发展,建立云原生业务容灾标准,阿里云对外开源“应用多活”中间件:AppActive。01什么是
2022年1月11日
其他

如何在零停机的情况下迁移 Kubernetes 集群

导语:随着云原生理念在企业中的深入和践行,应用容器化的比例大幅提升。是否可以保证应用容器化迁移过程中的平稳切换,保证应用不停机迁移,成为影响用户业务云化的一个重要条件。本文整理自阿里云云原生团队在
2022年1月5日
其他

以一致的体验交付和管理云原生多集群应用

Operator:https://kubernetes.io/docs/concepts/extend-kubernetes/api-extension/custom-resources/[2]
2021年12月24日
其他

如何缩小安全漏洞爆炸半径,实现服务间零信任安全?

中都可用的异步私钥处理机制,应用程序软件可以提交握手私钥请求,而无需等待一个请求返回,然后才能提交另一个。反过来,一旦准备好,就会为每个请求调用一个回调。在下面,多缓冲区加密处理可以将
2021年12月12日
其他

云未来、新可能 - 绿色、无处不在、可信的计算

的演讲,分享了阿里云基于大规模云原生实践下的技术趋势判断和技术创新进展。以下为分享全文实录。易立,阿里云资深技术专家、容器服务研发负责人大家好,我是阿里云易立,目前负责容器服务产品线,也是
2021年12月10日
其他

全球地域压测,即压即用,大促压测利器来了~

1%。如果施压机和服务器在同一机房,测试出的请求响应时长(RT)会比真实情况要低,因为用户是全国分布的。对响应延迟误判低出的零点几秒,就可能会造成对大促成交额的错误预期。通过下图可以直观的看出问题:
2021年12月6日
其他

邀请函|2021 云原生实战峰会,邀请您免费现场参会报名

云原生实战峰会正式召开点击阅读原文,即可参与现场免费报名!云原生实战峰会是云原生产业发展的风向标,是企业落地云原生的最佳指南,助力企业云上创新,峰会现场
2021年12月2日
其他

如何使用 Kubernetes 监测定位慢调用

这些,通常如果错误很多的话,说明可能已经出现问题了。饱和度--就是资源水位,通常来说接近饱和的服务比较容易出现问题,比如说磁盘满了,导致日志没办法写入,进而导致服务响应。典型的那些资源有
2021年11月30日
其他

阿里巴巴服务网格技术三位一体战略背后的思考与实践

的流量打标和标签路由实现全链路灰度。微服务软件架构下,业务新功能上线前搭建完整的一套测试系统进行验证是相当费人费时的事,随着所拆分出微服务数量的不断增大其难度也愈大。基于“流量打标”和“按标路由”
2021年11月29日
其他

直播预约|云原生边缘计算开源实践

成员。拥有丰富的云原生领域经验,多年来致力于持续探索云原生技术新场景,新边界。曾主导多个大型边缘计算项目的云原生转型,整体负责阿里云边缘计算云原生产品
2021年11月25日
其他

阿里云发布云原生加速器,携手生态企业拥抱数字时代

,帮助伙伴快速成长。技术支持:阿里云云原生加速器将整合阿里云云原生技术产品线,与成员进行产品和解决方案共创,将为成员提供更高效、易用的平台和服务。入选成员还有机会成为阿里云云原生
2021年11月23日
其他

Kubernetes 已经成为云原生时代的安卓,这就够了吗?

年加入阿里巴巴后一直深度参与服务化和云原生架构的多次跨代演进,如链路跟踪、容器虚拟化、全链路压测、异地多活、中间件云产品化、云原生上云等。负责并主导了阿里巴巴在微服务、可观测性、Serverless
2021年11月22日
其他

阿里云 10 月产品技术动态 | 容器服务+服务网格

https://help.aliyun.com/document_detail/186006.html点击阅读原文查看更多!
2021年11月21日
其他

您有一份阿里云云原生直播攻略待查收

上的应用程序交付,以及改善开发者的体验。此次讨论将展示围绕运营商、混沌工程、应用交付方法和演示应用的最新发展情况。无论您是刚开始了解云原生应用交付,还是想要了解最新进展,此次讨论将基于应用交付领域的
2021年11月20日
其他

阿里大规模业务混部下的全链路资源隔离技术演进

的后台内核线程,用来当系统的内存使用量达到一定水位以后来进行异步的内存回收。但是这里有一种情况,比如当前高优业务容器的内存使用已经达到一个比较紧张的状态,但是宿主机总体的空闲内存还有很多,这样内核的
2021年11月18日