有没有可以替代 parse_qs 来处理分号的方法?

2024-01-28

TL;DR

哪些库/调用可用于处理包含与 parse_qs 不同的分号的查询字符串?

>>> urlparse.parse_qs("tagged=python;ruby")
>>> {'tagged': ['python']}

完整背景

我正在使用 StackExchange API 来搜索标记的问题。

Search http://api.stackexchange.com/docs/search布局如下,标签之间用分号分隔:

/2.1/search?order=desc&sort=activity&tagged=python;ruby&site=stackoverflow http://api.stackexchange.com/2.1/search?order=desc&sort=activity&tagged=python;

与 API 交互就很好了。当我想测试调用时,特别是使用时,问题就出现了httpretty https://github.com/gabrielfalcao/HTTPretty模拟 HTTP。

在引擎盖下,httpretty正在使用urlparse.parse_qs从 python 标准库解析查询字符串。

>>> urlparse.parse_qs("tagged=python;ruby")
{'tagged': ['python']}

显然这效果不佳。这是一个小例子,这是 httpretty 的片段(在测试上下文之外)。

import requests
import httpretty

httpretty.enable()

httpretty.register_uri(httpretty.GET, "https://api.stackexchange.com/2.1/search", body='{"items":[]}')
resp = requests.get("https://api.stackexchange.com/2.1/search", params={"tagged":"python;ruby"})
httpretty_request = httpretty.last_request()
print(httpretty_request.querystring)

httpretty.disable()
httpretty.reset()

我想使用 httpretty 的机制,但需要一个解决方法parse_qs。我现在可以给 httpretty 打补丁,但很想看看还能做什么。


为了解决这个问题,我暂时修补了httpretty.core.unquote_utf8(从技术上来说httpretty.compat.unquote_utf8).

#
# To get around how parse_qs works (urlparse, under the hood of
# httpretty), we'll leave the semi colon quoted.
# 
# See https://github.com/gabrielfalcao/HTTPretty/issues/134
orig_unquote = httpretty.core.unquote_utf8
httpretty.core.unquote_utf8 = (lambda x: x)

# It should handle tags as a list
httpretty.register_uri(httpretty.GET,
                       "https://api.stackexchange.com/2.1/search",
                       body=param_check_callback({'tagged': 'python;dog'}))
search_questions(since=since, tags=["python", "dog"], site="pets")

...

# Back to normal for the rest
httpretty.core.unquote_utf8 = orig_unquote
# Test the test by making sure this is back to normal
assert httpretty.core.unquote_utf8("%3B") == ";"

这假设您不需要任何其他未引用的内容。另一种选择是仅在分号到达之前对分号进行百分比编码parse_qs.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有没有可以替代 parse_qs 来处理分号的方法? 的相关文章

随机推荐