2

我在玩欧芹。这是一个简单的解析器,它向我展示了一些不明显的行为。

require 'parslet'

class Parser < Parslet::Parser
  rule(:quote) { str('"') }
  rule(:escape_char) { str('\\') }
  def quoted(term)
    quote >> term >> quote
  end
  rule(:string) {
    quoted( (escape_char >> any | quote.absent? >> any).repeat.as(:string) )
  }
end

显然,它应该解析双引号字符串。它确实如此。但以下结果对我来说似乎很奇怪。

Parser.new.string.parse '""'

此代码返回{:string=>[]}. 为什么empty array有但没有empty string?我错过了什么?

我正在使用ruby 2.1.1parslet 1.6.1

4

1 回答 1

3

TL;博士; - 通常 Parsletas用于repeat捕获匹配数组;除了所有匹配都是原始字符串的特殊情况,在这种情况下,它将它们连接起来并返回结果字符串。

在您的代码中,repeat不知道它将捕获的类型,因为没有任何类型,因此它返回空数组。

在这个例子中......空数组似乎是正确的选择。

require 'parslet'

class Parser < Parslet::Parser
  rule(:quote) { str('"') }
  rule(:escape_char) { str('\\') }
  def quoted(term)
    quote >> term >> quote
  end
  rule(:string) {
    quoted( (escape_char >> any | quote.absent? >> any).as(:char).repeat.as(:string) )
  }
end

puts Parser.new.string.parse('""').inspect # => {:string=>[]}
puts Parser.new.string.parse('"test"').inspect 
    # =>  {:string=>[{:char=>"t"@1}, {:char=>"e"@2}, {:char=>"s"@3}, {:char=>"t"@4}]}

当子节点只是字符串时,Parslet 将其连接成一个字符串。当集合中没有元素时,它默认为空集合而不是空字符串。

maybe是不同的。

来自http://kschiess.github.io/parslet/parser.html # Repetition and its Special Cases

这些都映射到 Parslet::Atoms::Repetition。请注意#maybe的这个小转折:

str('foo').maybe.as(:f).parse('') # => {:f=>nil}
str('foo').repeat(0,1).as(:f)。 parse('') # => {:f=>[]}

'nil' - #maybe 的值为 nil。这迎合了 foo.maybe 要么给我 foo 要么什么都不给我的直觉,而不是一个空数组。但随心所欲!

于 2014-09-09T00:23:52.820 回答