我试图UTF-8在外语的编码字符串中找到某个字符的索引(或索引)(例如字符:)ش。
我试过unicode.find('ش'),word.find(u'ش')和word.find(u'\\uش')正则表达式:re.compile(u'\\uش)无济于事。有趣的是,在调试模式下的 Visual Studio(我使用 IronPython 的 IDE)中,word.find(u'\\uش')在变量监视窗口中返回正确的索引,但在实际代码中却没有(返回index=-1)。
我正在使用以下命令从文件中读取字符串:
file= codecs.open(file,'r','utf-8')
有什么我想念的吗?还是有另一种方法来解决这个问题?