Java线上问题 | 大Json引发的血案

news/2025/6/12 20:02:43

java

线上

问题

分析

大JSON引发的“血案”

Java线上问题之日志打好与JVM参数配好

这里想说的是打印日志的重要性，它在你定位问题时起到至关重要的作用。

分析过程

一、描述产生的问题

服务无法访问，发现CPU被打满，同时进程僵死，jstack无法打印数据（后来了解到 jstack -F 可以暴力获取，可惜没得尝试）。

二、要不先重启试试？

经常在开发中，有些神奇的现象是，重启后就好了，所以这里重启一台机器（另外一台机器保留现场），更改nginx配置去掉另一台的映射，发现并不如愿。

三、继续观察重启后进程日志

一段时间后，进程僵死，打印了java.hprof文件（7.3G），很快又被打满，无法访问；怀疑是新代码问题，版本回滚，重启。

四、走运发现了一行异常日志

继续定位问题原因；分析日志时发现有一行日志太大（128M），幸好日志打得好，入参和操作人记录了下来，直接找到对方询问。

五、分析dump日志

分析java.hprof文件，很可能是Json反序列化问题

复现问题；如愿的再次打满CPU 。

总结

我们的服务是企业内部系统，所以操作起来简单很多，有了日志追溯，进程僵死打印的java.hprof文件，极有助于本次故障的定位

本次问题的根源是依赖的上游服务返回的测试数据，大Json(128M)，在我们反序列化时候，直接致使进程僵死

所以必须做好以下准备，对应线上问题

1、依赖其他服务都必须保有不可信的心，像这样的不正常大Json，不予处理，配好告警

2、方法的出入参尽可能打印日志（如果是极高并发的系统，另当考虑）

3、JVM启动参数必须有以下配置

-XX:+HeapDumpOnOutOfMemoryError 
-XX:HeapDumpPath=/var/www/logs

Java 应用性能调优的一些实践

可视化界面在线生成JVM参数

java内存溢出问题分析过程二(附MAT超全操作文档)

使用Eclipse Memory Analyzer Tool（MAT）分析线上故障(一)

一文让你理解什么是shallow heap及retained heap

内存分析诊断系列-理解heap dump

记一次服务器被当肉鸡挖矿的经历

如何编写一个可复用的SpringBoot应用运维脚本

高效率编写Dockerfile需要绕过的一些坑

Mysql百万量级数据高效导入Redis

多线程之CountDownLatch的用法及原理笔记

我就知道你“在看”

文章来源:https://blog.csdn.net/u012811805/article/details/106547395
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://dhexx.cn/news/show-1219093.html 如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：809451989@qq.com进行投诉反馈，一经查实，立即删除！

Java线上问题 | 大Json引发的血案

相关文章

OpenStack Hacker养成指南

Microsoft Ignite 2019开发人员的5大建议

[原] KVM虚拟机网络闪断分析

python编写一个简单计算器_求用Python写一个简单的计算器!

MySQL存储过程的动态行转列

异步编程：轻量级线程同步基元对象

LInux上使用extundelete进行数据恢复

使用multipart/form-data上传文件

abstract class和interface有什么区别

Red Hat的Quarkus Java堆栈即将投入生产