3

所以我的 ROT13 密码几乎可以做我想做的事情,但是最后命令提示符显示在与输出的最后一行相同的行上。这是我在 Assembly 中的第一个项目,所以我很不确定自己做错了什么。

4

1 回答 1

0

您的程序不会在其输出末尾打印换行符,因此光标在退出时位于非空行的末尾。shell 不知道这一点,并在那里打印下一个提示。

echo foo包含一个尾随换行符,因此当 shell 打印下一个提示时,光标已经位于新行的开头。 echo -n foo不包含尾随换行符,因此它将光标留在以 开头的行的末尾foo,并且您的提示符会附加到该行的末尾,就像您的程序一样。将这些回显命令通过管道输入hd以查看它们打印的 ASCII 字符的十六进制转储。


因此解决方案是确保您的输出以换行符结尾(ASCII 代码 = 10)。你的msg4: db 10, "Read error", 10字符串中已经有了它。(它以换行符开头并以一个结尾。)在 C 中,你会写 `"\nRead error\n",但 NASM 语法不是这样工作的。它确实支持反引号字符串中的 C 样式转义,但人们通常使用数字常量编写换行符。


您的用户输入(您从 sys_read 获得)通常应该以换行符结尾,除非用户在一行中键入 256 个字符,或者使用 ctrl-D 使 read 提前返回。(或者类似的不以换行符结尾的管道输入,因此读取命中 EOF)。

我开始遵循比较的逻辑,但很快就累了。我不确定您输入中的换行符会发生什么,但我怀疑您的代码修改了 buffer 中的换行符。您可能应该避免这种情况,并保持它们不变。我想您只需将它们添加到您的比较和分支列表中,以便不修改字符。

对于 rot13 程序来说,这可能比在缓冲区末尾添加一个额外的换行符或调用 sys_write 一次额外的时间来自己打印一个换行符更有用。


您可以测试您的程序使用strace. 例如strace ./a.out,将解码您所做的 read() 和 write() 系统调用。

标签 wiki的底部。(除此之外还有很多有用的东西)。


顺便说一句,您可以cmp al, '?'使用 SSE2 在 xmm 寄存器中并行进行所有这些比较(广播 al 到 xmm 寄存器的每个元素,以及带有常数/PMOVMSKB/test/jnz 的 PCMPEQB)。但是,在您很好地处理标量代码之前,请不要担心这一点。


避免 CMP/JCC 老鼠窝的另一种方法是将字母字符列入白名单,默认情况下不修改输入字符。

我不知道为什么你只有 blacklist '1',而不是其他号码,或者'+'but not '-',等等。


下面是我如何实现你的循环,使用一些“高级”技巧将多个相似条件折叠成单个条件。请参阅我关于如何访问 char 数组并将小写字母更改为大写字母的答案,反之亦然,以了解 isalpha() 的无符号比较技巧。

;; ROT13 alphabetic characters.  Copy others unmodified.
;;  Untested
L1_top:
    movzx   eax, [esi]              ; get a character
    inc     esi                     ; update source pointer

    mov     edx, eax                ; save a copy of the original
    or      al, 0x20                ; make it lower-case if it's a letter (but we can still detect non-letters after this)

    sub     al, 'a'                 ; chars below 'a' will wrap to a high value
    cmp     al, 'z'-'a'
    ja      .non_alpha              ; jump if the sub wrapped, or the char was greater than 'z'

    ; input char was alphabetic
    sub     dl, 13                  ; modify the original character
    sub     al, 13                  ; check if that takes us out of the alphabet.  Can be a CMP, not SUB if we want.
    jnc     .nocarry
    add     dl, 26                  ; add 26 if the subtract wrapped
    ;add     al, 26                 ; we don't care about the value in al anymore
.nocarry:

    ; dl = the ROT13'ed character, with its original case
.non_alpha:
    mov    [edi], dl
    inc    edi

    dec    ecx                      ; I'm not sure what all the cmp ecx,0  in various branches was for.  Just do it earlier if necessary.
    jnz    L1_top

最初我打算在 AL 中实际计算 ROT13 的小写字符,然后找到它与原始小写字符之间的差异,并将其应用于 DL。但后来我意识到我可以有条件地修改早期分支中的 DL。

    ;; after the or al,0x20:    mov   ah, al       ; don't over-do it with upper-half byte registers.  False dependencies on AMD, and partial-reg merging stalls or slowdowns on pre-Haswell Intel if you're not careful.

    add     al, 'a'                 ; 'a' + al is the lower-cased ROT13 of the input character
    sub     ah, al                  ; ah = lcase(orig) - lcase(rot13)
    sub     dl, ah                  ; apply that delta to the original in dl
    ; dl is the original character - 13 (plus 26 if necessary)
于 2016-09-24T08:12:37.893 回答