我见过许多项目使用simplejson模块而不是标准库中的json模块。此外,还有许多不同的simplejson模块。为什么要使用这些替代品,而不是标准库中的替代品?


当前回答

我在寻找为Python 2.6安装simplejson时遇到了这个问题。我需要使用json.load()的'object_pairs_hook',以便将json文件加载为OrderedDict。由于熟悉Python的最新版本,我没有意识到Python 2.6的json模块不包括'object_pairs_hook',所以我不得不为此安装simplejson。从个人经验来看,这就是为什么我使用simplejson而不是标准json模块。

其他回答

所有这些答案都不是很有用,因为它们对时间很敏感。

在我自己做了一些研究之后,我发现simplejson确实比内置更快,如果你把它更新到最新版本的话。

pip/easy_install想在ubuntu 12.04上安装2.3.2,但在发现最新的simplejson版本实际上是3.3.0之后,所以我更新了它并重新运行时间测试。

Simplejson在加载时比内置json快3倍 Simplejson在转储时比内置json快30%左右

免责声明:

上面的语句在python-2.7.3和simplejson 3.3.0中(带有c加速) 为了确保我的答案也不是时间敏感的,你应该运行自己的测试来检查,因为它在不同版本之间有很大的差异;没有时间紧迫的简单答案。

如何判断simplejson中是否启用了C加速:

import simplejson
# If this is True, then c speedups are enabled.
print bool(getattr(simplejson, '_speedups', False))

更新:我最近发现了一个名为ujson的库,它在一些基本测试中执行的速度比simplejson快~3倍。

在python3中,如果你有一个b'bytes'的字符串,使用json你必须在加载它之前解码()内容。Simplejson会处理这个问题,所以你可以只做Simplejson .loads(byte_string)。

项目使用simplejson的另一个原因是内置json最初不包括它的C加速,所以性能差异是显而易见的。

simplejson模块比json快1.5倍(在我的计算机上,使用simplejson 2.1.1和Python 2.7 x86)。

如果您愿意,可以尝试基准测试:http://abral.altervista.org/jsonpickle-bench.zip 在我的电脑上,simplejson比cPickle快。我也想知道你的基准!

可能,正如Coady所说,simplejson和json之间的区别在于simplejson包含_speedps .c。 那么,为什么python开发者不使用simplejson呢?

我不同意其他答案:内置json库(在Python 2.7中)并不一定比simplejson慢。它也没有这个恼人的统一码错误。

下面是一个简单的基准:

import json
import simplejson
from timeit import repeat

NUMBER = 100000
REPEAT = 10

def compare_json_and_simplejson(data):
    """Compare json and simplejson - dumps and loads"""
    compare_json_and_simplejson.data = data
    compare_json_and_simplejson.dump = json.dumps(data)
    assert json.dumps(data) == simplejson.dumps(data)
    result = min(repeat("json.dumps(compare_json_and_simplejson.data)", "from __main__ import json, compare_json_and_simplejson", 
                 repeat = REPEAT, number = NUMBER))
    print "      json dumps {} seconds".format(result)
    result = min(repeat("simplejson.dumps(compare_json_and_simplejson.data)", "from __main__ import simplejson, compare_json_and_simplejson", 
                 repeat = REPEAT, number = NUMBER))
    print "simplejson dumps {} seconds".format(result)
    assert json.loads(compare_json_and_simplejson.dump) == data
    result = min(repeat("json.loads(compare_json_and_simplejson.dump)", "from __main__ import json, compare_json_and_simplejson", 
                 repeat = REPEAT, number = NUMBER))
    print "      json loads {} seconds".format(result)
    result = min(repeat("simplejson.loads(compare_json_and_simplejson.dump)", "from __main__ import simplejson, compare_json_and_simplejson", 
                 repeat = REPEAT, number = NUMBER))
    print "simplejson loads {} seconds".format(result)


print "Complex real world data:" 
COMPLEX_DATA = {'status': 1, 'timestamp': 1362323499.23, 'site_code': 'testing123', 'remote_address': '212.179.220.18', 'input_text': u'ny monday for less than \u20aa123', 'locale_value': 'UK', 'eva_version': 'v1.0.3286', 'message': 'Successful Parse', 'muuid1': '11e2-8414-a5e9e0fd-95a6-12313913cc26', 'api_reply': {"api_reply": {"Money": {"Currency": "ILS", "Amount": "123", "Restriction": "Less"}, "ProcessedText": "ny monday for less than \\u20aa123", "Locations": [{"Index": 0, "Derived From": "Default", "Home": "Default", "Departure": {"Date": "2013-03-04"}, "Next": 10}, {"Arrival": {"Date": "2013-03-04", "Calculated": True}, "Index": 10, "All Airports Code": "NYC", "Airports": "EWR,JFK,LGA,PHL", "Name": "New York City, New York, United States (GID=5128581)", "Latitude": 40.71427, "Country": "US", "Type": "City", "Geoid": 5128581, "Longitude": -74.00597}]}}}
compare_json_and_simplejson(COMPLEX_DATA)
print "\nSimple data:"
SIMPLE_DATA = [1, 2, 3, "asasd", {'a':'b'}]
compare_json_and_simplejson(SIMPLE_DATA)

在我的系统(Python 2.7.4, Linux 64位)上的结果:

复杂的现实数据: Json转储1.56666707993秒 Simplejson转储2.25638604164秒 Json加载2.71256899834秒 Simplejson加载1.29233884811秒 简单的数据: Json转储0.370109081268秒 Simplejson转储0.574181079865秒 Json加载0.422876119614秒 Simplejson加载0.270955085754秒

对于转储,json比simplejson更快。 对于加载,simplejson更快。

因为我目前正在构建一个web服务,所以dumps()更重要——使用标准库总是首选。

此外,在过去的4年里,csson没有更新过,所以我不会碰它。