1

我正在尝试将富文本字符串转换为纯文本或 html。我目前正在使用 RichTextBox.Text 功能,该功能几乎适用于所有情况,除非文本包含反斜杠,然后一些文本被删除,因为转换器认为它是 rtf 格式的一部分。有没有人知道如何让反斜杠留在那个实例中。这是我将拥有的字符串示例

{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fnil\fcharset0 Arial;}}\viewkind4\uc1\pard\fs17 Testing Export \with comments\par}

我需要的文本是“Testing Export \with comments”,而我从 rtf 转换器返回的文本是“Testing Export comments”。任何帮助将不胜感激。如果您还有其他问题,请回复。

4

1 回答 1

1

我认为转换器是正确的。RTF 文本中的真正反斜杠应该被转义(例如 to \\)。我相信,你得到的根本不是有效的 RTF。

Whist 您可以尝试通过对输入进行正则表达式替换以将不属于有效控制字的任何反斜杠加倍来修复它,这似乎非常脆弱,如果有人向文本添加有效的序列,则会出错控制字。唯一安全的方法是修复生成 RTF 的任何内容以正确转义反斜杠。

于 2010-05-15T14:10:09.980 回答