基于Loadrunner的性能分析及调优经验分享

2024-01-21

公司某个系统的微信端计划将开放给几百上千的人员登录查询,并且登录账号为同一账号多人使用。

后台服务能够支撑起多用户的并发操作以及成百上千人登录微信端对生产数据库或者登录查询的性能效率高成为交付可靠生产环境的必要条件。

因此,项目组决定提交测试,由测试人员通过自动化方式模拟并发场景,以验证程序的可靠性。

问题点描述

测试初期,随着时间的推移,Loadrunner客户端不断出现事务通过率下降的情况,或因为连接不上服务端,或因为连接超时:

现象1:大用户并发一段时间后服务器吞吐率降到0,而后所有请求出现无法连接到服务器。

现象2: 根据目标1000个并发请求进行结果验证,吞吐量在运行一段时间后,有下降趋势,最后服务端支撑不起:若干请求 failed to connected to server  ,若干请求connect timed out。

这些现象都直接说明了系统服务端暂无法支撑起大并发用户的访问。

思路和方法

我们需要进一步移位到服务端(Linux-tomcat服务器),通过性能分析手段来分析问题,并根据定位出的具体问题,来展开调优手段解决问题,主要的分析工具有:

1. Linux-top命令

一个用户程序的执行离不开管理它的操作系统,top命令是Linux操作系统下实时查看服务器资源情况的其中一种命令,它可以输出操作系统资源概况信息和进程信息。

2. Jstack工具

Jstack,这是一个在JDK5开始提供的内置工具,可以打印指定进程中线程运行的状态,包括线程数量、是否存在死锁、资源竞争情况和线程的状态等等。

以及,如netstat -anp|grep 端口号|wc -l 查询http连接数、查询数据库连接数,Ps -LF pid 查询线程情况,ps -eLo pid,stat|grep 20017|grep Sl|wc -l查询线程S1状态个数等等其他Linux命令了解当前当前服务器运行情况。

调优方案

01 现象1的性能分析过程及对应的调优手段

(一)分析过程:

使用top命令查询服务器资源结果:

CPU占用资源过大,内存、磁盘资源正常

根据top 1 占用cpu资源的排行,定位到占用资源率高的进程id(pid),进行进一步分析:

Tomcat对应的java进程程占用CPU资源率最高,记录下java进程号

top -hp 进程号 ,打印线程信息,记录下占用CPU资源异常的线程号(tid)

查看线程情况:其中某线程cpu占用率高,使用 printf "%x \n"<tid> 命令将异常线程id转成十六进制的值(thread-hex-id)

通过jstack工具输出当前的线程信息:jstack -l <pid> | grep <thread-hex-id> -A 10

thread dump文件显示出程序在执行org.apache.commons.collections.ReferenceMap..getEntry()方法时处于获取到锁资源的可运行状态;heap dump 中JVM堆中对象使用的情况正常。

过5分钟后,再次通过通过jstack工具输出当前的线程信息:jstack -l <pid> | grep <thread-hex-id> -A 10

thread dump文件显示出程序在执行org.apache.commons.collections.ReferenceMap..getEntry()方法时处于获取锁资源的可运行状态;heap dump 中JVM堆中对象使用的情况正常。

对比前后两次的线程信息,进行分析:

两个线程在长达5分钟时间里,一直在执行org.apache.commons.collections.ReferenceMap.getEntry()方法,未能释放锁,进入了死循环。而其他多线程处于等待锁资源的状态,造成了blocked阻塞。

(二)对应的调优手段:

百度查询wait to lock

(org.hibernate.util.SoftLimitMRUCache)出此类似的问题为hibernate3.1,x的bug造成了线程不安全:hashMap等线程不安全的容器,用在多线程读/写的场合,导致hashmap的方法调用造成死循环,解决方法是更换hibernate版本。

02 现象2的性能分析过程及对应的调优手段

(一)分析过程:

当前配置下,逐渐增加服务器负载,根据tps 查找最佳线程数。

500用户并发时,tps出现拐点

使用500个用户并发运行一段时间

服务器吞吐率逐渐下载,而后开始产生一些连接超时的问题,最后出现connect timeout

分析tomcat配置:连接数、线程数以及队列长度

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="2000000" redirectPort="8443" minSpareThreads="100" maxSpareThreads="500" acceptCount="1000" />

从以上信息了解到服务端采用的是tomcat BIO模式,配置中未指定最大线程数,则默认为200;未指定连接数,则Bio下 connect max connections=max thread=200;

tomcat一开始可处理

acceptCount+maxConnections的请求,已进入acceptcount但无法处理的先出现connect timeout,最后无法进入acceptcount的出现connect refuse。

(二)对应的调优手段:

根据目标支撑数,调整tomcat配置:线程数和队列长度。

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="2000000" redirectPort="8443" maxThreads="1000" acceptCount="1000" />

修改后,500个用户并发运行30min,服务器吞吐率保持稳定

继续进行100-200-300 到1000个用户并发场景,结合Loadrunner和服务端资源验证结果

原先运行10min就开始报错,现在并发运行48min期间吞吐量稳定(48min后出错是现象1的问题);服务端内存占用率稳定,tomcat配置修改有效。

总结
Loadrunner工具是以客户的角度分析应用业务是否可用,服务体验是否满意,它不需要知道系统的业务流向和系统的架构设计,但系统瓶颈分析和调优时却需要这些知识。

面对日益复杂的系统负载,系统的性能也受许多因素的影响,如处理器速度、内存容量、网络、I/O、磁盘容量、中间件连接池配置等等。

因此,要求我们对计算机硬件、操作系统和应用有相当深入的了解,我们才能合理动用脑袋中的知识库以分析和解决问题。

在分析系统瓶颈和调优问题上,本人也没有搭建起完整的知识体系框架来,在此只能分享我浅薄的几点经验:

1.了解被测项目的架构:如是否用了缓存,用了集群、负载均衡,用了哪些应用以及对应配置、特性,如redis是内存数据库,特性是占用内存会大;对磁盘资源依赖少。如常见的关系型数据库对CPU、内存、磁盘都有比较高的要求;web应用如果对文件进行操作,那可先分析磁盘I/O、内存。

2. 运用抓包、日志等工具分段定位瓶颈位置:前端页面、后台服务端还是数据库。

3. 对于测试对象是web应用类型的,经常出问题的是它中间件的配置、程序代码和其依赖的服务器资源,一般出错时有后台服务端日志可以参考。

4. 对于web应用,要了解tcp工作原理,java应用了解进程、线程状态及工作情况。

5. 优先排查应用程序问题,一般应用程序和资源表现有关系,应用服务端关注:连接模式及配置、jvm内存:泄露、溢出、应用程序逻辑。

6. 操作系统关注:包含了操作系统的系统参数、内核参数、进程参数、文件系统、磁盘IO等

7. 数据库关注:连接池、sql语句、索引、死锁

系统分析的主要目标是识别出哪些工作负荷是影响当前吞吐量的瓶颈;总体来说有很多有用的信息分析工具可以用,且分析方法并不是唯一,本次实践在物流查询系统中出现的问题也只是性能问题里的冰山一角。

通过性能分析和对应的调优手段,我们提升了系统的响应能力,为用户带来更好的使用体验。在其他场景,我们通过架构、应用逻辑上的优化,还可以不需要对硬件系统进行扩容,用更少的硬件资源,支撑更大量的业务发展,从而达到节省硬件投资的目的,性能调优带来收益是巨大的。

在性能分析手段上,本人也还在努力学习,分享以上测试经验希望大家少走弯路,希望能够帮助初学者解决一些问题,共同进步。

总结:

感谢每一个认真阅读我文章的人!!!

作为一位过来人也是希望大家少走一些弯路,如果你不想再体验一次学习时找不到资料,没人解答问题,坚持几天便放弃的感受的话,在这里我给大家分享一些自动化测试的学习资源,希望能给你前进的路上带来帮助

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于Loadrunner的性能分析及调优经验分享 的相关文章

  • GitHub:本地使用 wiki:首次推送到 GitHub wiki 时出错

    这个问题我搜索了很多次 还是无法解决 假设我从 user1 分叉了一个存储库 我们将其命名为 repo1 现在我也想分叉该存储库的 Wiki 部分 当您分叉存储库时 GitHub 不会为您做任何事情 https stackoverflow
  • Github 贡献图中未显示进度?

    我在 github 中的存储库是公开的 当我通过命令行将文件从本地系统推送到 github 时 新贡献不会显示在贡献直方图中 但是 当我将任何文件直接添加到 github 的存储库中时 贡献会显示在直方图中 这是什么原因呢 一个可能的原因是
  • 无法获取 https://gerrit.googlesource.com/git-repo/clone.bundle

    我尝试按照以下说明创建一个 git 存储库 source android com source downloading html installing repo 但是当我尝试在工作目录中初始化存储库时 使用 Ubuntu 出现以下错误 wo
  • 如何在 github 中拉取请求时忽略或排除文件

    我们有 4 个分支 1 dev 2 qa 3 staging 4 master 我们要更新并添加1 dev中的CODEOWNERS文件中的一些人 2 qa到4 master的CODEOWNER文件将被保留 因为 1 dev 有 4 个审稿人
  • Azure Pipelines 状态徽章未显示在 Markdown 中

    我已经为我的 github 存储库之一设置了 azure 管道 除了构建状态徽章之外 一切都工作正常 它没有正确显示 似乎无法加载图像 目前正在显示 Edit markdown 文件中使用的代码由 azure devops 自动生成 Bui
  • 无法在 Google Colab 中打开从 GitHub 克隆的存储库

    我想克隆 GitHub 存储库 体验 keras yolo2 https github com experiencor keras yolo2 我按照以下命令操作 git clone https github com experiencor
  • 如何修复 GitHub 拉取请求中被 git rebase 破坏的提交顺序?

    当我编写代码时 我会将其分解为小的逻辑更改 以便轻松快速地进行审查 为此 我使用git rebase i 交互式 压缩 删除和更改提交的顺序 我注意到这有时会导致 GitHub 拉取请求的提交顺序不同 尽管该顺序保留在远程分支上 例如 co
  • 如何在 Github 包中添加我的 Android 库的依赖项?

    我正在构建一个 Android 库 比如说 MyLibrary 这将被添加到我公司的其他应用程序中 该库有一些依赖项build gradle像这样的文件 dependencies implementation com alimuzaffar
  • 在 GitHub 上托管可执行文件?

    我想将可执行文件与我的源代码一起分发 我的源代码全部整齐地托管在 GitHub 上 是否可以将可执行文件和安装程序添加到我的 GitHub 项目页面 而不将它们添加到我的 git 存储库 请注意 由于某种原因 GitHub 停止了此功能 请
  • 自动更改 github 文件

    我制作了一个带有白名单的应用程序 withelist 位于 github 存储库上 只有一个文件 即 withelist 每次下载我的应用程序的用户想要被允许使用该应用程序时 都必须向我发送一个消息插入白名单 现在这个过程真的很慢 我想加快
  • Jekyll 在子网站上生成静态网站?

    是否可以将 Jekyll 放在 GitHub 上托管的网站的单个部分上 即是否可以让 example github io 成为常规站点 而 example github io blog 由 Jekyll 静态生成 我相信可以通过创建另一个名
  • 在 github 上查找强制推送的提交者

    在我们的项目 托管在 GitHub 上 中 每隔一段时间就会有人意外强制推送 master 没有人知道是否这样做 我想找出是谁干的 以及背后有什么样的错误配置的工具或坏习惯 那么问题来了 如何识别进行强制推送的用户呢 当我拉动时 我看到这样
  • 如何使用 Github Pages 分支正确提交到存储库中

    我有一个问题 情况基于gh pages https pages github com 我的项目使用预处理器和其他困难的人员 因此 我的项目结构如下所示 主分支 src node modules public js css etc index
  • 恢复后如何挑选提交?

    我正在研究我的feature branch并在审核后合并到development待部署 后来 一位同事决定发布一个版本 并将他和我的合并到master 在部署时 他意识到他的代码有错误并恢复了master 在我们的分叉和拉动流程中 这意味着
  • 无法使用 File delete() 方法删除 git repo 中的 .pack 文件

    对于我正在编写的这个方法 我使用 jgit 库克隆一个 git 存储库 然后对这些文件执行一些操作 最后我想删除该存储库 我遇到的问题是 当我在 pack 文件 位于 git objects pack 中 上调用 delete 方法时 它无
  • 由于合并而不允许 git revert 但未给出 -m 选项

    我正在尝试使用 revert 命令恢复到 git 中的某个 哈希 号 我正在使用以下命令 git revert c14609d74eec3ccebafc73fa875ec58445471765 但是 我得到以下返回 错误 提交 c14609
  • 配置 github 以使用其他文件作为 README

    由于 Eclipse 和 EGit 组织文件和目录的方式不同 我的 README md 文件并不位于 git 存储库的根目录中 而是位于更深的一个文件夹中 我怎样才能告诉github显示some folder README md作为项目的自
  • Git 子模块:[电子邮件受保护]:权限被拒绝(公钥)。致命:无法从远程存储库读取

    我有一个问题git submodule update init remote 我收到错误 权限被拒绝和克隆失败 但我将 SSH 密钥添加到了我的 github 存储库中 我可以拉 推 git 克隆 我拥有所有需要的访问权限 我使用操作系统
  • 通过 GitHub、Sonatype Maven 存储库提供 JavaDocs [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 尽管 Github 为 Java 开源项目提供了一个不错的家园 但与更成熟的开源托管场所相比 仍然缺少一些东西 到目前为止 我发现 S
  • 部署在github中的Jekyll显示index.html文件的原始文本

    我正在尝试使用来自的分叉存储库来部署 Jekyll 网站https github com cotes2020 jekyll theme chirpy https github com cotes2020 jekyll theme chirp

随机推荐