2

我有一堆带有特殊转义码的字符串,我想不转义地存储 - 例如,解释器显示

"\\014\"\\000\"\\016smoothing\"\\011mean\"\\022color\"\\011zero@\\016" 但我希望它(在检查时)显示为 "\014\"\000\"\016smoothing\"\011mean\"\022color\"\011zero@\016"

逃脱它们的方法是什么?我想我可以制作一个正则表达式来从每个连续的 n 个反斜杠中删除 1 个反斜杠,但是我没有很多正则表达式经验,而且似乎应该有一种“更优雅”的方式来做到这一点。

例如,当我puts MyString显示我想要的输出时,但我不知道如何将其捕获到变量中。

谢谢!

编辑添加上下文:我有这个类用于编组/恢复一些东西,但是当我恢复一些旧字符串时,它会吐出一个类型错误,我确定是因为它们不是——出于某种莫名其妙的原因-- 存储为 base64。相反,它们似乎刚刚被转义,这是我不想要的,因为尝试恢复它们同样会产生 TypeError TypeError: incompatible marshal file format (can't be read) format version 4.8 required; 92.48 given ,因为 Marshal 会查看字符串的第一个字符来确定格式。

require 'base64'
class MarshaledStuff < ActiveRecord::Base

  validates_presence_of :marshaled_obj

  def contents
    obj = self.marshaled_obj
    return Marshal.restore(Base64.decode64(obj))
  end

  def contents=(newcontents)
    self.marshaled_obj = Base64.encode64(Marshal.dump(newcontents))
  end
end

编辑 2:更改了措辞——我以为它们是“双重转义的”,但它只是单一转义的。哎呀!

4

1 回答 1

1

如果您的字符串在打印时为您提供正确的输出,那么它们已经被正确转义。您看到的额外反斜杠可能是因为您在交互式解释器中显示它们,当您显示变量时会为您添加额外的反斜杠以减少歧义。

> x
=> "\\"
> puts x
\
=> nil
> x.length
=> 1

请注意,即使 x 看起来包含两个反斜杠,字符串的长度也是一个。额外的反斜杠由解释器添加,实际上并不是字符串的一部分。

如果您仍然认为有问题,请更具体地说明您如何显示您在问题中提到的字符串。


编辑:在您的示例中,唯一需要取消转义的是八进制转义码。你可以试试这个:

x = x.gsub(/\\[0-2][0-7]{2}/){ |c| c[1,3].to_i(8).chr }
于 2010-04-08T18:48:25.890 回答