25

我目前正在使用python(金字塔)创建一个网站,该网站需要用户注册并登录。系统允许用户选择一个用户名,该用户名可以是大写字母、小写字母和数字的混合。

当确保两个用户不会意外共享相同的用户名时,就会出现问题,即在我的系统中,“randomUser”应该与“RandomUser”或“randomuser”相同。

不幸的是(在这种情况下)因为 Mongo 将字符串存储为区分大小写,可能有许多用户具有“相同”的用户名。

我知道查询 mongo 以获取不区分大小写的字符串的方法:

db.stuff.find_one({"foo": /bar/i});

但是,这在我使用 pymongo 的查询方法中似乎不起作用:

username = '/' + str(username) + '/i'
response = request.db['user'].find_one({"username":username},{"username":1})

这是构建 pymongo 查询的正确方法吗(我假设不是)?

每当创建或登录用户帐户时都会使用此查询(因为它必须检查用户名是否存在于系统中)。我知道这不是最有效的查询,所以它是否只用于登录或帐户创建是否重要?是否更可取的是强制用户只选择小写用户名(完全不需要不区分大小写的查询)?

4

2 回答 2

54

PyMongo 使用原生 python 正则表达式,就像 mongo shell 使用原生 javascript 正则表达式一样。要编写您在上面的 shell 中编写的等效查询,您可以使用:

db.stuff.find_one({'name': re.compile(username, re.IGNORECASE)})

但是请注意,这将避免使用该name字段上可能存在的任何索引。不区分大小写的搜索或排序的常见模式是在文档中有第二个字段,例如name_lower,它总是在每次name更改时设置(在本例中为小写版本name)。然后,您将查询这样的文档,例如:

db.stuff.find_one({'name_lower': username.lower()})
于 2011-06-07T17:24:01.333 回答
6

接受的答案很危险,它会匹配任何包含用户名的字符串!安全选项是匹配确切的字符串:

import re
db.stuff.find_one({'name': re.compile('^' + username + '$', re.IGNORECASE)})

更安全的是,转义可能影响正则表达式匹配的任何特殊字符的变量:

import re
db.stuff.find_one({'name': re.compile('^' + re.escape(username) + '$', re.IGNORECASE)}) 
于 2019-03-20T22:36:21.927 回答