明确需要解决的问题。
如果性能下降是最近发生的,请确定系统最近的任何更改。
确定为什么该问题被认为是性能问题。
指定可用于分析性能的指标。该指标例如可以是延迟、吞吐量、同时登录的最大用户数或活动用户最大数。
使用上一步中的指标测量当前性能。
确定应用程序花费最多时间子系统。
监控系统和/或应用程序。
分析数据,分类时间花费在哪里。
调优上一步中识别的子系统。
使用与之前相同的指标重新测量当前性能,无需监控。
如果性能仍然不可接受,请从步骤 3重新开始。
在开始调优系统之前,尝试尽可能准确地描述问题。像“系统很慢!”这样的陈述不是一个有用的问题描述。例如,系统速度是否需要普遍提高,或者仅在高峰时段提高,这可能会有所不同。
此外,请确保您可以对问题应用测量,否则无法验证调优是否成功。您始终应该能够比较“之前”和“之后”。使用哪些指标取决于您正在查看的场景或应用程序。例如,相关的 Web 服务器指标可以根据以下方式表示
传递页面所需的时间
每秒提供的页面数或每秒传输的兆字节数
在仍然在可接受的延迟时间内下载页面的最大用户数
性能问题通常是由网络或硬件问题、错误或配置问题引起的。在尝试调优系统之前,请确保排除诸如以下列出的问题
检查systemd日志的输出(请参阅“参考”手册,第 11 章“journalctl:查询systemd日志”),查找异常条目。
检查(使用top或ps)某个进程是否通过占用异常多的 CPU 时间或内存而出现故障。
通过检查/proc/net/dev检查网络问题。
如果物理磁盘存在 I/O 问题,请确保它不是由硬件问题(使用smartmontools检查磁盘)或磁盘已满引起的。
确保将后台作业安排在服务器负载较低的时间执行。这些作业也应以低优先级运行(通过nice设置)。
如果机器运行多个使用相同资源的服務,请考虑将服務移动到另一台服务器。
最后,确保您的软件是最新的。
找到瓶颈是调优系统中最困难的部分。openSUSE Leap提供了许多工具来帮助您完成此任务。有关通用系统监控应用程序和日志文件分析的详细信息,请参阅第 II 部分,“系统监控”。如果问题需要长时间的深入分析,Linux 内核提供了进行此类分析的手段。请参阅第 III 部分,“内核监控”以获取覆盖范围。
收集到数据后,需要对其进行分析。首先,检查服务器的硬件(内存、CPU、总线)及其 I/O 容量(磁盘、网络)是否足够。如果满足这些基本条件,则系统可以从调优中受益。