我正在使用 megaparsec 为自定义 jupter 内核编写解析器。我也能够重新使用解析器来提供补全:从 megaparsec 库生成的自定义错误消息被转换为预期符号列表。这样,每当我更改解析器时,完成都会自动调整。这是伟大的。
我唯一苦苦挣扎的是如何从可选解析器中获取信息。说明我想要实现的目标的最小示例如下:
{-# LANGUAGE OverloadedStrings #-}
module Main where
import Control.Applicative
import Text.Megaparsec
import Text.Megaparsec.Char
import qualified Text.Megaparsec.Char.Lexer as L
import Data.Monoid
import Data.Text (Text)
import Data.Set (singleton)
type Parser = Parsec MyError Text
data MyError = ExpectKeyword Text deriving (Eq, Ord, Show)
lexeme = L.lexeme sc
sc = L.space (skipSome (oneOf [' ', '\t'])) empty empty
-- | Reserved words
rword :: Text -> Parser Text
rword w = region (fancyExpect (ExpectKeyword w)) $
lexeme (string w *> return w)
fancyExpect f e = FancyError (errorPos e) (singleton . ErrorCustom $ f)
p1 = rword "foo" <|> rword "bar"
p2 = (<>) <$> option "def" (rword "opt") <*> p1
main = do
putStrLn . show $ parse p1 "" ("xyz" :: Text) -- shows "foo" and "bar" in errors
putStrLn . show $ parse p2 "" ("xyz" :: Text) -- like above, no optional "opt"
在第一种情况下,解析器失败,我从所有备选方案中获得了所有错误的列表。理想情况下,在第二种情况下,我也希望看到失败的可选解析器的错误。
这个例子可以通过删除option
和创建两个分支来简单地解决<|>
:一个有选项,另一个没有。然而在实际情况下,可选部分是一个由几个可选部分组成的排列解析器,所以这种技巧是不可行的。