详解Python中的JSON编码模块

JSON编码支持的基本数据类型为 None ， bool ， int ， float 和 str ，以及包含这些类型数据的lists，tuples和dictionaries。对于dictionaries，keys需要是字符串类型(字典中任何非字符串类型的key在编码时会先转换为字符串)。为了遵循JSON规范，你应该只编码Python的lists和dictionaries。而且，在web应用程序中，顶层对象被编码为一个字典是一个标准做法。

详解Python中的JSON编码模块

JSON编码的格式对于Python语法而已几乎是完全一样的，除了一些小的差异之外。比如，True会被映射为true，False被映射为false，而None会被映射为null。下面是一个例子，演示了编码后的字符串效果：

>>>json.dumps(False)
'false'
>>>d={'a':True,
...'b':'Hello',
...'c':None}
>>>json.dumps(d)
'{"b":"Hello","c":null,"a":true}'
>>>

如果你试着去检查JSON解码后的数据，你通常很难通过简单的打印来确定它的结构，特别是当数据的嵌套结构层次很深或者包含大量的字段时。为了解决这个问题，可以考虑使用pprint模块的 pprint() 函数来代替普通的 print() 函数。它会按照key的字母顺序并以一种更加美观的方式输出。下面是一个演示如何漂亮的打印输出Twitter上搜索结果的例子：

>>>fromurllib.requestimporturlopen
>>>importjson
>>>u=urlopen('http://search.twitter.com/search.json?q=python&rpp=5')
>>>resp=json.loads(u.read().decode('utf-8'))
>>>frompprintimportpprint
>>>pprint(resp)
{'completed_in':0.074,
'max_id':264043230692245504,
'max_id_str':'264043230692245504',
'next_page':'?page=2&max_id=264043230692245504&q=python&rpp=5',
'page':1,
'query':'python',
'refresh_url':'?since_id=264043230692245504&q=python',
'results':[{'created_at':'Thu,01Nov201216:36:26+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:14+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:13+0000',
'from_user':...
},
{'created_at':'Thu,01Nov201216:36:07+0000',
'from_user':...
}
{'created_at':'Thu,01Nov201216:36:04+0000',
'from_user':...
}],
'results_per_page':5,
'since_id':0,
'since_id_str':'0'}
>>>

一般来讲，JSON解码会根据提供的数据创建dicts或lists。如果你想要创建其他类型的对象，可以给 json.loads() 传递object_pairs_hook或object_hook参数。例如，下面是演示如何解码JSON数据并在一个OrderedDict中保留其顺序的例子：

>>>s='{"name":"ACME","shares":50,"price":490.1}'
>>>fromcollectionsimportOrderedDict
>>>data=json.loads(s,object_pairs_hook=OrderedDict)
>>>data
OrderedDict([('name','ACME'),('shares',50),('price',490.1)])
>>>

下面是如何将一个JSON字典转换为一个Python对象例子：

>>>classJSONObject:
...def__init__(self,d):
...self.__dict__=d
...
>>>
>>>data=json.loads(s,object_hook=JSONObject)
>>>data.name
'ACME'
>>>data.shares
50
>>>data.price
490.1
>>>

最后一个例子中，JSON解码后的字典作为一个单个参数传递给 __init__() 。然后，你就可以随心所欲的使用它了，比如作为一个实例字典来直接使用它。

在编码JSON的时候，还有一些选项很有用。如果你想获得漂亮的格式化字符串后输出，可以使用 json.dumps() 的indent参数。它会使得输出和pprint()函数效果类似。比如：

>>>print(json.dumps(data))
{"price":542.23,"name":"ACME","shares":100}
>>>print(json.dumps(data,indent=4))
{
"price":542.23,
"name":"ACME",
"shares":100
}
>>>

对象实例通常并不是JSON可序列化的。例如：

>>>classPoint:
...def__init__(self,x,y):
...self.x=x
...self.y=y
...
>>>p=Point(2,3)
>>>json.dumps(p)
Traceback(mostrecentcalllast):
File"<stdin>",line1,in<module>
File"/usr/local/lib/python3.3/json/__init__.py",line226,indumps
return_default_encoder.encode(obj)
File"/usr/local/lib/python3.3/json/encoder.py",line187,inencode
chunks=self.iterencode(o,_one_shot=True)
File"/usr/local/lib/python3.3/json/encoder.py",line245,initerencode
return_iterencode(o,0)
File"/usr/local/lib/python3.3/json/encoder.py",line169,indefault
raiseTypeError(repr(o)+"isnotJSONserializable")
TypeError:<__main__.Pointobjectat0x1006f2650>isnotJSONserializable
>>>

如果你想序列化对象实例，你可以提供一个函数，它的输入是一个实例，返回一个可序列化的字典。例如：

defserialize_instance(obj):
d={'__classname__':type(obj).__name__}
d.update(vars(obj))
returnd

如果你想反过来获取这个实例，可以这样做：

#Dictionarymappingnamestoknownclasses
classes={
'Point':Point
}

defunserialize_object(d):
clsname=d.pop('__classname__',None)
ifclsname:
cls=classes[clsname]
obj=cls.__new__(cls)#Makeinstancewithoutcalling__init__
forkey,valueind.items():
setattr(obj,key,value)
returnobj
else:
returnd

下面是如何使用这些函数的例子：

>>>p=Point(2,3)
>>>s=json.dumps(p,default=serialize_instance)
>>>s
'{"__classname__":"Point","y":3,"x":2}'
>>>a=json.loads(s,object_hook=unserialize_object)
>>>a
<__main__.Pointobjectat0x1017577d0>
>>>a.x
2
>>>a.y
3
>>>

上述资讯来自网友投稿，如有侵犯了您的权益，请来信告诉我们：liujun100@vip.qq.com