Python序列化-pickle和json模块

it2022-05-06  4

Python的“file-like object“就是一种鸭子类型。对真正的文件对象,它有一个read()方法,返回其内容。但是,许多对象,只要有read()方法,都被视为“file-like object“。许多函数接收的参数就是“file-like object“,你不一定要传入真正的文件对象,完全可以传入任何实现了read()方法的对象。

程序运行时,所有的变量都保存在内存中,程序结束后,内存回收,没有保存的变量还是原样的。

所以想要持久化变量,就需要从内存中读取,保存到磁盘上,这个过程称作序列化-pickling

反之,从磁盘读取为对象,称为反序列化-unpickling

 

pickle

Python提供的pickle模块很简单的将对象序列化为二进制类型,再进行二进制到文件的写入;

或者直接点的,直接将对象序列化后写入file-like-object

1.对象序列化为二进制,pickle.dumps()方法直接操作对象

import pickle mylist = [1,3,5,'ac'] ban = pickle.dumps(mylist) >>>ban b'\x80\x03]q\x00(K\x01K\x03K\x05X\x02\x00\x00\x00acq\x01e.' #这里得到一个二进制数据类型

1.1.pickle反序列化,pickle.loads(),主义这里loads()方法读取的是二进制数据

>>>pickle.loads(mylist) [1,3,5,'ac']

 

2.对象直接序列化为文件对象和反序列化;object--->>>file-like-object

序列化,pickle.dump()方法

import pickle mylist = [1,2,3,'abc'] f = open('mylist.txt','wb')#以二进制写入 pickle.dump(mylist,f) f.close()#文件操作完成后关闭,否则造成无法读写报错EOFError: Ran out of input

反序列化,pickle.load()方法

 

JSON

如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准格式,比如XML,但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可以被所有语言读取,也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式,并且比XML更快,而且可以直接在Web页面中读取,非常方便。

JSON表示的对象就是标准的JavaScript语言的对象,JSON和Python内置的数据类型对应如下:

JSON类型                            Python类型

{}                dict

[]                 list

"str"                                 str

123                  int或float

ture/false              Ture/False

null                None

 

使用json需要导入json模块,JSON标准规定JSON编码是UTF-8,所以我们总是能正确地在Python的str与JSON的字符串之间转换。

序列化和反序列化完全和pickle一致

序列化为file-like-object,json.dump()方法

import json mylist = [1,2,3,'abc'] f = open('mylist.txt','wb')#以二进制写入 json.dunmp(mylist,f) f.close()#文件操作完成后关闭,否则造成无法读写报错EOFError: Ran out of input

file-like-object反序列化,json.load()方法

f = open('mylist.txt','rb') #二进制打开 >>>json.load(f) [1,2,3,'abc'] >>>f.close()

 

类对象的序列化

import json class Student(object): def __init__(self,name,age): self.name = name self.age = age s = Student('tom',20) >>>json.dump(s) TypeError: <__main__.Student object at 0x10603cc50> is not JSON serializable 报错类型错误,json不可将实例Student序列化

dumps()可以提供很多参数

json.dumps(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

default参数可以增加一个函数,将Student对象转化为一个dict,dict是可以序列化的

def todict(stu): return{ 'name':stu.name, 'age':stu.age }

default参数为函数

import json class Student(object): def __init__(self,name,age): self.name = name self.age = age s = Student('tom',20) >>>json.dump(s,default=todict){'name','tom','age':20}

或者快捷方式,

import json class Student(object): def __init__(self, name, age, score): self.name = name self.age = age self.score = score s = Student('tom', 20, 88) print(json.dumps(s,default=lambda obj:obj.__dict__)){'name':'tom','age':20,'score':88}

因为通常class的实例都有一个__dict__属性,它就是一个dict,用来存储实例变量。也有少数例外,比如定义了__slots__的class。

__slots__ = (),这个方法用来限制实例的属性,作用域仅限当前的类,当父类中有__slots__属性时,子类中并没有限制,当子类中定义__slots__时,子类的实例限制就是子类本身加上父类的__slots__。

 

反序列化

json.loads(s, *, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)

json.loads()方法也object_hook提供函数参数,用来反序列化

import json class Student(object): def __init__(self, name, age, score): self.name = name self.age = age self.score = score s = Student('Bob', 20, 88) jsonstr = json.dumps(s,default=lambda obj:obj.__dict__) print(jsonstr) def dicttoobj(d): return Student(d['name'],d['age'],d['score']) print(json.loads(jsonstr,object_hook=dicttoobj)){"name": "Bob", "age": 20, "score": 88}<__main__.Student object at 0x000002518657C8D0>

得到Student对象

Python语言特定的序列化模块是pickle,但如果要把序列化搞得更通用、更符合Web标准,就可以使用json模块。

 

转载于:https://www.cnblogs.com/mzc1997/p/7651491.html


最新回复(0)