regex - 查找其他描述的语言的正则表达式

Question

令 {ab} 为字母集，写一个正则表达式：

1）a和b的个数都是奇数的所有单词的语言；

2) 所有长度为奇数且包含子串 ab 的单词的语言。

另外，如果可能的话，请帮我找到两个不同的表达方式，以帮助加强我对如何解决这些问题的理解。

score 3 · Accepted Answer

对于第一个，您可以构建一个简单的 4 态 DFA 来识别语言。然后，您可以使用可从 Kleene 定理（他说 FA 识别的所有语言都由 RE 生成的部分）中恢复的算法来获得有效的 RE……或者只是从图中推理出来。

对于第二个，您知道 (ab) 是 RE 的一部分；现在，您需要考虑所有可以添加奇数个字符（正面或背面）的独特方法，并将所有这些可能性与 + 连接起来，以获得简单、正确的 RE。

我认为没有人特别喜欢只给你答案的想法。

编辑：

所以现在已经过去了一段时间，我将完成第一个的答案，向感兴趣的读者展示如何做到这一点。

我们的第一个 FA 是这样的：

   Q s f(Q, s)
  -- - -------
  EE a     OE
  EE b     EO
  OE a     EE
  OE b     OO
  EO a     OO
  EO b     EE
  OO a     EO
  OO b     OE

我们将从这里删除状态并用正则表达式替换 s 以覆盖该状态。我们从一个简单的开始……让我们摆脱 OE。这是那个表...

   Q                  regex f(Q, s)
  -- ---------------------- -------
  EE                     aa      EE
  EE                     ab      OO
  EE                      b      EO
  EO                      a      OO
  EO                      b      EE
  OO                      a      EO
  OO                     ba      EE
  OO                     bb      OO

在继续之前说服自己这是正确的。接下来，我们摆脱 EO：

   Q                  regex f(Q, s)
  -- ---------------------- -------
  EE                  aa+bb      EE
  EE                  ab+ba      OO
  OO                  ab+ba      EE
  OO                  aa+bb      OO

为了使下一步更简单，我们引入了一个新的起始集 X 和一个新的接受状态 Y；OO 不再接受。我们消除了对 OO 的需求：

   Q                        regex f(Q, s)
  -- ---------------------------- -------
   X                        empty      EE
  EE aa+bb+(ab+ba)(aa+bb)*(ab+ba)      EE
  EE              (ab+ba)(aa+bb)*       Y

因此，最终的正则表达式是

  (aa+bb+(ab+ba)(aa+bb)*(ab+ba))*(ab+ba)(aa+bb)*

我们可以开始尝试列出生成的最小字符串，就像基本的健全性检查一样：{ab, ba, aaab, aaba, bbab, bbba, abaa, abbb, baaa, babb, ...} 对我来说看起来不错！

每个步骤的减少规则可以形式化，或者您可以仔细推理以确保您得到正确的东西。检查 Kleene 定理的证明以进行仔细分析。此外，Martin's Introduction to Formal Languages 或其他东西有很好的使用这种算法的例子。

regex - 查找其他描述的语言的正则表达式

1 回答 1

Related

Reference