9

我正在使用 megaparsec 为自定义 jupter 内核编写解析器。我也能够重新使用解析器来提供补全:从 megaparsec 库生成的自定义错误消息被转换为预期符号列表。这样,每当我更改解析器时,完成都会自动调整。这是伟大的。

我唯一苦苦挣扎的是如何从可选解析器中获取信息。说明我想要实现的目标的最小示例如下:

{-# LANGUAGE OverloadedStrings #-}
module Main where

import Control.Applicative
import Text.Megaparsec
import Text.Megaparsec.Char
import qualified Text.Megaparsec.Char.Lexer as L
import Data.Monoid
import Data.Text (Text)
import Data.Set (singleton)

type Parser = Parsec MyError Text

data MyError = ExpectKeyword Text deriving (Eq, Ord, Show)

lexeme = L.lexeme sc
sc = L.space (skipSome (oneOf [' ', '\t'])) empty empty

-- | Reserved words
rword :: Text -> Parser Text
rword w = region (fancyExpect (ExpectKeyword w)) $
          lexeme (string w *> return w)

fancyExpect f e = FancyError (errorPos e) (singleton . ErrorCustom $ f)

p1 = rword "foo" <|> rword "bar"

p2 = (<>) <$> option "def" (rword "opt") <*> p1

main = do
  putStrLn . show $ parse p1 "" ("xyz" :: Text) -- shows "foo" and "bar" in errors
  putStrLn . show $ parse p2 "" ("xyz" :: Text) -- like above, no optional "opt"

在第一种情况下,解析器失败,我从所有备选方案中获得了所有错误的列表。理想情况下,在第二种情况下,我也希望看到失败的可选解析器的错误。

这个例子可以通过删除option和创建两个分支来简单地解决<|>:一个有选项,另一个没有。然而在实际情况下,可选部分是一个由几个可选部分组成的排列解析器,所以这种技巧是不可行的。

4

0 回答 0