了解dubbo序列化 从bug开始

    首先交代背景,前几天遇到一个小bug,由于其他系统的一个DTO子类和父类有一个字段名重复了,所以导致我set的子类字段那边拿不到值。改起来很简单嘛,让对面把子类的字段删掉就好,但是拿不到值的原因让我想了很久,很明显是序列化和反序列化的过程中这个字段的值丢失了,但是到底是在哪一步呢?还是决定看看源码给自己一个答案。

dubbo版本:2.6.7

首先先确定协议和序列化的方式:

<dubbo:protocol name="dubbo" port="${dubbo.port}" host="${dubbo.host}"/>

ok,dubbo协议,没有配序列化方式,那再来找一下dubbo默认的序列化方式:
首先找到了这个包:
《了解dubbo序列化 从bug开始》

然后在Serialization接口(实现一些自定义序列化扩展用的)中发现了默认序列化的方式是hessian2

《了解dubbo序列化 从bug开始》

然后通过Hessian2Serializationserialize方法和deserialize方法找到了Hessian2ObjectOutputHessian2ObjectInput这个两个类,之后通过里面的writeObject方法和readObject方法,找到了这两个类:JavaSerializerJavaDeserializer。就是默认的序列化器和反序列化器。

首先我们来看序列化:
构造方法:
《了解dubbo序列化 从bug开始》

我们看看他干了个什么事
首先检查了有没有writeReplace方法
然后把所有声明的字段放到数组中遍历,然后把除了transientstatic修饰的字段放到ArrayList中去
然后往上找父类执行相同操作
然后把所有符合条件的字段放到一个Field数组里面,先放基本数据类型,再放引用数据类型
最后把字段放入对应类型的序列化器中去
得到一个FieldSerializer序列化器数组

我们还是继续看writeObject方法

《了解dubbo序列化 从bug开始》

《了解dubbo序列化 从bug开始》

主要是第二张图的3个方法,做的事情大概就是循环序列化field的名和值

下面再来看看反序列化:
构造方法:

《了解dubbo序列化 从bug开始》

《了解dubbo序列化 从bug开始》

这里大概做了3个事
获取fieldMap,方法如下:

《了解dubbo序列化 从bug开始》

获取readResolve方法
获取所有构造器
遍历构造器数组找到cost最小的最佳构造器
然后用最佳构造器进行构造,方法如下:
《了解dubbo序列化 从bug开始》

先看构造器方法,基本数据类型的话返回包装类型,引用数据类型返回null

主要我们来看获取fieldMap的时候。和序列化时相同,先取子类再取父类,本来以为到这就结束了,可是看到了一行校验

fieldMap.get(field.getName()) == null

如果父类的字段名和子类字段名相同,会跳过该循环,也就是说只会有子类的值,那为什么还会覆盖?
看最后一个readMap方法:

《了解dubbo序列化 从bug开始》

debug发现值被覆盖就是在这里操作的

deser.deserialize(in, obj);

《了解dubbo序列化 从bug开始》

子类set过值以后,父类过来也会拿到子类的反序列化器,把子类的值覆盖掉。

最后,那为什么会到readMap这一步呢?

debug发现SerializerFactory拿到反序列化器后会执行一个readMap操作

《了解dubbo序列化 从bug开始》

基本上就到这里了,最主要的原因还是readMap方法,并不是很多博文说的fieldMap。如果哪里有不对的地方欢迎指出、讨论以便及时修改。

参考文档:链接描述

    原文作者:夙梦流尘
    原文地址: https://segmentfault.com/a/1190000015822481
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞