我一直在试图找出一个在Python中加载JSON对象的好方法。 我发送这个json数据:

{'http://example.org/about': {'http://purl.org/dc/terms/title': [{'type': 'literal', 'value': "Anna's Homepage"}]}}

到后端,它将作为一个字符串接收,然后我使用json.loads(数据)来解析它。

但每次我都得到相同的异常:

ValueError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)

我谷歌了一下,但似乎没有什么工作,除了这个解决方案json.loads(json.dumps(data)),这对我个人来说似乎不是那么有效,因为它接受任何类型的数据,甚至那些不是json格式的数据。

任何建议都将不胜感激。


当前回答

这样的:

{
    'http://example.org/about': {
        'http://purl.org/dc/terms/title': [
            {'type': 'literal', 'value': "Anna's Homepage"}
        ]
     }
}

不是JSON。 这样的:

{
     "http://example.org/about": {
         "http://purl.org/dc/terms/title": [
             {"type": "literal", "value": "Anna's Homepage"}
          ]
      }
}

是JSON。

编辑: 一些评论者认为,上述内容还不够。 JSON规范- RFC7159规定字符串以引号开始和结束。这就是“。 单引号在JSON中没有语义意义,只允许在字符串中使用。

其他回答

正如它清楚地说错了,名字应该用双引号括起来,而不是单引号。您传递的字符串不是有效的JSON。它应该是这样的

{"http://example.org/about": {"http://purl.org/dc/terms/title": [{"type": "literal", "value": "Anna's Homepage"}]}}

我有这个错误试图规范化嵌套的JSON列在熊猫。正如@Reihan_amn所指出的,将所有单引号替换为双引号可能会影响实际内容。因此,当得到这个错误时,您应该只替换JSON语法中的“that are where”。你可以用下面的正则表达式来实现:

import re
import json

invalid_json = """{'http://example.org/about': {'http://purl.org/dc/terms/title': [{'type': 'literal', 'value': "Anna's Homepage"}]}}"""

valid_json = re.sub( "(?<={)\'|\'(?=})|(?<=\[)\'|\'(?=\])|\'(?=:)|(?<=: )\'|\'(?=,)|(?<=, )\'", "\"", invalid_json)

print(json.loads(valid_json))

如果唯一的问题是在原始格式错误的JSON文档中,双引号(")应该出现的地方出现了单引号('),那么这就足够了。但是,如果文档中的某个地方出现了双引号,而这些双引号也不是JSON语法的一部分,那么您仍然会得到一个错误。在这种情况下,我建议4步解决方案:

将所有作为JSON语法一部分的双引号替换为单引号(与上面的正则表达式类似,但交换了' and ')。 将所有(剩余的)双引号替换为文档中不存在的特殊字符,例如:' '。你可以用re.sub("\"", " ' ' ", x)。 使用上面给出的正则表达式,将JSON中应该是双引号的所有单引号替换为双引号。

你现在可以加载JSON文档,并通过pd.json_normalize(df["json_col"].apply(JSON .loads))将其读入Pandas DataFrame。

如果您愿意,您可以将所有' '(或您选择的特殊字符)替换回"。

x = x.replace("'", '"')
j = json.loads(x)

虽然这是正确的解决方案,但如果存在这样的JSON,可能会导致相当头痛-

{'status': 'success', 'data': {'equity': {'enabled': True, 'net': 66706.14510000008, 'available': {'adhoc_margin': 0, 'cash': 1277252.56, 'opening_balance': 1277252.56, 'live_balance': 66706.14510000008, 'collateral': 249823.93, 'intraday_payin': 15000}, 'utilised': {'debits': 1475370.3449, 'exposure': 607729.3129, 'm2m_realised': 0, 'm2m_unrealised': -9033, 'option_premium': 0, 'payout': 0, 'span': 858608.032, 'holding_sales': 0, 'turnover': 0, 'liquid_collateral': 0, 'stock_collateral': 249823.93}}, 'commodity': {'enabled': True, 'net': 0, 'available': {'adhoc_margin': 0, 'cash': 0, 'opening_balance': 0, 'live_balance': 0, 'collateral': 0, 'intraday_payin': 0}, 'utilised': {'debits': 0, 'exposure': 0, 'm2m_realised': 0, 'm2m_unrealised': 0, 'option_premium': 0, 'payout': 0, 'span': 0, 'holding_sales': 0, 'turnover': 0, 'liquid_collateral': 0, 'stock_collateral': 0}}}}

注意到“真实”的价值了吗?使用这个函数可以对布尔值进行双重检查。这将涵盖这些情况

x = x.replace("'", '"').replace("True", '"True"').replace("False", '"False"').replace("null", '"null"')
j = json.loads(x)

另外,确保你没有做出

x = json.loads(x)

它必须是另一个变量。

使用eval函数。

它处理单引号和双引号之间的差异。

我有同样的问题,我所做的是用双引号替换单引号,但更糟糕的是,当我有一个逗号的json对象的最后一个属性时,我有同样的错误。因此,在使用json.loads()函数之前,我使用python中的regex来替换它。(注意“loads”后面的s)

import re

with open("file.json", 'r') as f:
     s = f.read()
     correct_format = re.sub(", *\n *}", "}", s)
     data_json = json.loads(correct_format)

使用的正则表达式返回每个逗号后跟换行符和“}”,用“}”替换它。