跳至主要内容

【转】汇编语言---套装软件制作

程式写完后,还要加工成为可执行的套装软件(Package),一般说来,即使是可以执行的程式,一点错误都没有,离套装软件的程度,却还有一段距离。
    当然,程式侦错也是必经过程之一,有时侦错与程式写作可以同时进行。但有经验的程式师,对全面有了充份的认识,往往会等到程式联接后再行侦错。
    程式完成后的全面侦错,最好不要依靠写程式的人。因为程式师经常不是使用者,他们仅在自己设计的条件下,依其理念进行侦错。当然这种错误必须更正,但最容易发生的错误,却是使用者不小心在输入时,或运用指令时,违背了程式师的理念。这种错误的发生,是不能原谅的,程式本来就是为使用者设计的,如果令使用者不便,程式就失去了应有的价值。
    程式的品管,就在于检测程式是否符合使用者的需求。一般说来,应有专人负责,也有让写作手册的人,兼做品管的工作。这样可以同时对照手册所描述的功能及操作方法,检查两者之间是否一致。
    还有一种常见的品管方式,是在产品完成时,交给完全没有参与程式设计的第三者,在客观的立场,作全面的试用,并提出测试报告或建议书。
    品管合格了,才是包装、手册等最后的工作。这并不是说包装和手册要最后才做,相反的,尤其是使用手册,经常要在程式设计的同时,准备妥当,如此程式师才不会任意所之,脱离主题。
    第一节  测试侦错

    不论使用什么工具,侦错时一定要有清晰的头脑,根据所设定的方式,一步一步地查看流程及指令。
    每个人都会有独特的习惯性错误,最好每次将自己发生的错误记下来,不仅错误会渐渐减少,且在错误发生时,很容易就能找到。
    测试侦错是非常重要的手段,有人认为第一流的程式师不应该犯错,即使犯错,也错得很少。我的看法不一样,并非因为我经常犯错,而且错得离谱。真正的理由是为了适时掌握正确的思考方向,在编程时,有意无意地忽略一些细节,这样反而能一气呵成,不致于再而竭三而衰。
    这就像画图一样,有人喜欢先作草图,有人则习惯由细部画起。不论个人的风格如何,重要的是最后的成果。
    我在写程式之前,首先考虑全体的结构,再把各处的支架备妥,然后考虑有共同特性之处,便一口气写完。而且写时力求快速,以免失去当时的感觉。等到结构大体完成了,最后才去填补一些不太重要的细节。至于正确与否,则全靠测试侦错来修正、弥补。
    这种写法要有很强的整体观念,且对每段程式的性质及功能皆�解从何下手。
    我由系统程式到应用工具,大大小小的程式写了不少,对这种写作方法有很深的体会。唯一的缺点是,程式如果太大,超过20KB,我的记忆力就难以负担。(年轻人或许不致如此)但其优点则是结构精简,制作时间极短。以我们的中文系统程式而言,8KB 的程式,连侦错在内,只花了两个月的功夫。
    然而,在训练程式师的过程中,我发现到还是循序渐进较好。每次写完了一段程式,立刻侦错,此段程式正确了,再写下一段。除非有绝对的把握,自信没有问题,否则千万不要等全部程式都写完了,再来调试。到那时,如果发现问题,在各段错综复杂的程式中,要找到错误所在,那是大海捞针了。
    程式发生「当机」的情况,常常是 PUSH 及 POP不平衡所致,也有在做回路时,计数器为负值,以致锁在其中。如果程式分「段」太多,则要特别注意各「段」改变的情况。
    诸如这些细节,最好随时把编程时的假想值记录下来,不要太过相信自己的记忆力,时间一长,程式一大,就什么都忘记了。
    还有一点,在侦错时千万要养成习惯,记录追踪的过程。因为侦错是一种很琐碎的工作,很难一次就发现问题所在,第一次应该是第二次改进的经验。如果不详加记录,每次都要从头做起,将是一种极为痛苦的事。
    不妨把侦错视为猜谜,一种智力的挑战,在遵守一定的规则下,应该是一种有趣的享受。
    第二节  研究改进

    想要把程式写好,一定要不断地研究、改进,由错误中学习,由改进中得到经验,培养出敏锐的观察能力和良好的写作习惯。
    在开始时,这种过程需要付出不少时间,但对一位程式师来说,写程式是终身职业,能不精益求精吗?
    以下举两个实例,以说明如何研究改进已完成的程式。
  1,指令的运用:
    以下面这段通讯处理程式而论,不仅语法及指令完全正确,执行时也毫无错误,是不是还可以加以改进呢?
    1-1 按照前面规定,说明项中已用简化的字串:
    SND-传送  RCV-接收  LET-左  
        RGT-右    VER-直    HOR-横
    1-2 程式师代号为'C'。
    1-3 段名省略。

    1: CSND0:
    2:        MOV    DX,03FDH      ; 输出埠
    3:        MOV    AL,80H
    4:        OUT    DX,AL          ; 输出指令
    5:        MOV    DX,03F8H      ; LSB 速度控制
    6:        MOV    AL,06H          ; 速度=19200/秒
    7:        OUT    DX,AL
    8:        MOV    DX,03F9H      ; MSB 速度控制
    9:        MOV    AL,0          ; 速度=19200/秒
   10:        OUT    DX,AL
   11:        MOV    DX,03FBH      ; 行控制暂存器
   12:        MOV    AL,03H          ; NO PARITY,1
                                      ; STOP,8
   13:        OUT    DX,AL
   14:        MOV    DX,03FCH      ; 通讯控制
   15:        OUT    DX,AL
   16:        MOV    DX,03F9H      ; 中断有效
   17:        MOV    AL,0
   18:        OUT    DX,AL
   19: CSND1:
   20:        MOV    DX,03FDH      ; 状态暂存器
   21:        IN    AL,DX
   22:        TEST    AL,10H          ; 是否可接收?
   23:        JNZ    CRCV0          ; 可
   24:        TEST    AL,20H          ; 通道已清否?
   25:        JZ    CSND1          ; 8250未清
   26:        MOV    AH,1          ; 键盘有输入?
   27:        INT    16H
   28:        CMP    AL,07H          ;  ='CTRL+G'
   29:        JE    CEND          ; 是,完毕
   30:        MOV    DX,03F8H
   31:        OUT    DX,AL          ; 送输入字符
   32:        JMP    CSND1
   33: CRCV0:                  ; 接收
   34:        MOV    DX,03FCH      ; 通讯控制
   35:        MOV    AL,08H          ; 暂停中断
   36:        OUT    DX,AL
   37:        MOV    DX,3F8H
   38:        IN    AL,DX          ; 收字符
   39:        MOV    AH,0EH
   40:        INT    10H          ; 萤屏显示
   41:        MOV    DX,03FCH
   42:        MOV    AL,0BH
   43:        OUT    DX,AL          ; 继续接受
   44:        JMP    CSND1          ; 循环工作
   45: CEND:
   46:        RET              ; 完成

    本段程式共 84 个字元,非常精简,但仍然有节省的余地,要点在DX的数值上。
    DX值由 03F8H到 03FDH,可知 DH 之值不变,只需改变 DL 即可。每改变DX一次,需要三个字元,如仅变DL,只需两个字元。这一指令共用了十一次,除第一次有必要外,其他十次就可以省下10个字元。
    再要斤斤计较,还可以榨出二个字元来,在5至8条中,若用INC  DX 只需要一个字元。
    此外,31,32及43 ,44是浪费的作法,只要在第18条加一标号,就可以省却两个字元输出的指令。另外,还有35及39两条指令,应该合并,一次即将AX设妥,于是,又省下了一个字元。
        先令 DH=3
    1: CSEND0:
    2:        MOV    DL,0FDH       ; 输出埠
    3:        MOV    AL,80H
    4:        OUT    DX,AL          ; 输出指令
    5:        MOV    DL,0F8H       ; LSB 速度控制
    6:        MOV    AL,06H          ; 速度=19200/秒
    7:        OUT    DX,AL
    8:        INC    DX          ; MSB 速度控制
    9:        SUB    AL,AL          ; 速度=19200/秒
   10:        OUT    DX,AL
   11:        MOV    DL,0FBH       ; 行控制暂存器
   12:        MOV    AL,DH          ;NO PARITY,1
                      ; STOP,8
   13:        OUT    DX,AL
   14:        INC    DX          ; 通讯控制
   15:        OUT    DX,AL
   16:        MOV    DL,0F9H       ; 中断有效
   17:        SUB    AL,AL
   18: CSNDA:
   19:        OUT    DX,AL
   20: CSND1:
   21:        MOV    DL,0FDH       ; 状态暂存器
   22:        IN    AL,DX
   23:        TEST    AL,10H          ; 是否可接收?
   24:        JNZ    CRCV0          ; 可
   25:        TEST    AL,20H          ; 通道已清否?
   26:        JZ    CSND1          ; 8250未清
   27:        MOV    AH,1          ; 键盘有输入?
   28:        INT    16H
   29:        CMP    AL,07H          ;  ='CTRL+G'
   30:        JE    CEND          ; 是,完毕
   31:        MOV    DL,0F8H
   32:        JMP    CSNDA          ; 送输入字符
   33: CRCV0:                  ; 接收
   34:        MOV    DL,0FCH       ; 通讯控制
   35:        MOV    AX,0E08H      ; 暂停中断
   36:        OUT    DX,AL          ; 及显示
   37:        MOV    DL,0F8H
   38:        IN    AL,DX          ; 收字符
   39:        INT    10H          ; 萤屏显示
   40:        MOV    DL,0FCH
   41:        MOV    AL,0BH
   42:        JMP    CSNDA          ; 循环工作
   43: CEND:
   44:        RET              ; 完成
    看来似乎这样太小气,可是所谓艺术,就要具备丝毫不苟且的态度,再说由84个字元变成66个字元,省了近百分之廿,而且,速度也快了。这种程式原本就很精简,只有训练有素,追求完美的程式师,才做得到。
    另一种做法,便是将重复的过程写成回路,约可节省廿几个字元。但是,由于时间定律限制,通讯程式颇重时效,回路是否值得,尚要多方面分析,不可轻率决定。

  2,回路的实例:
    前面曾经讨论过,程式的效率,经常决定于回路的处理方式及其技巧。其对空间上影响比较小,但是良好的设计理念,常使速度上有高达十倍,甚至百倍的差异,读者想必已经知道,但是如何能应用已知的技巧,来改进设计的程式呢?
    回路是利用计数器,反复进行相同的程序作业,这种程式,目的就是为了节省空间,相对地,时间上难免有所损失。
        因此,在设计回路时,必须先行考虑清楚: 空间的节省与时间的交换是否值得? 其次,则要充份掌握回路的特色,要用得恰到好处,不可掉以轻心。
        原则上,在回路中,指令要用得精简,流程要非常明确,尤其重要的是,应力求避免在回路中使用缓冲器,最好充份利用暂存器。如果时间效率极为重要,则不妨放弃回路方式。
        有一个显示程式,目的是要将 16*16点阵字形送到萤幕上。对象是Hercules 640*400的图形卡,计分四区交互传送,这是另一个「高科技」界的新鲜奇事,在IBM PC推出时,最高密度的图形态,只有 640X200点阵,那是迁就电视萤幕的扫描方式,先送单线的水平讯号,再送双线,故分两区。Hercules卡为了加高密度,应用Interlace 技术,又在单双水平扫描线中各加了一行,遂成了四区。
        Hercules很适宜中文的显示,如用 16X16字形,正好显示25行,每行40字,与英文完全兼容。若希望有一状态显示栏,则可用 15X15字形,留出24条线供做状态栏。
        遗憾的是在最需要中文的国内,却偏爱CGA,EGA 等密度不足的显示设备。不但售价偏高,功能也不足,弄得不伦不类。
        最理想的还是VGA 显示,计有 640X480之萤幕点阵,不仅空间大,在记忆体中,只有一区,应用非常灵活。
        下面,我们先介绍 Hercules 的显示方法,同时探讨回路的处理方式。
    1: ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    2: ;HERCULES 中文显示处理程式。            ;
    3: ;输入参数:SI=点阵字形,DI=萤幕位置。        ;
    4: ;          DS =CG,ES= 0B800H(萤幕段)。      ;
    5: ;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;
    6: Cdsp0:
    7:         MOV     CX,16       ;高16点
    8: Cdsp1:
    9:         MOVSW           ;移至萤幕上
   10:         ADD     DI,1FFEH       ;加一区,每区=2000H
   11:         JNS     Cdsp2       ;未超越区限,继续
   12:         ADD     DI,8050H       ;超越区限,换区加行
   13: Cdsp2:
   14:         LOOP    Cdsp1
   15:         RET
    程式到此结束,相当精简,技巧在第10至12条区限的检测方式。一般做法是在检查区限时,用:
         ADD     DI,1FFEH       ; 加区值
         CMP     DI,8000H       ; 最大区限值
         JB      Cdsp2       ; 未超过
         SUB     DI,8000H       ; 减去区限
    如此则多了一条4字元的指令,加上4个时钟脉冲,做16次回路就损失64个时钟脉冲值。在全萤幕显示时,以1,000 个字来算,为数就不少了。
    当然,取消了回路速度还可以加快,其结果,则要增加130 个字元,时间则快了 272个时钟脉冲,是否值得,就要看实际需要而定了。
    另一个方法,要增加2个字元,但可快上36个时钟脉冲,其法在第11条上:
   11:         JS      Cdsp3
   12:Cdsp2:
   13:         LOOP    Cdsp1
   14:         RET
   15:Cdsp3:
   16:         ADD     DI,8050H
   17:         JMP     Cdsp2
    再换一个方法,如果先使 BX 为1FFEH,DX为8050H,则在原程式中,将第10条及12条分别改为:
   10:         ADD     DI,BX
   12:         ADD     DI,DX
    这一来,时钟脉冲快了2个,16次则快更多,如果再加上取消回路,其意义更大。空间原增加 130字元,现仅94字元,时间则省下 304个时钟脉冲。如果全萤幕显示了1,000 个字,在8MHZ频率下,将会加快 1/25 秒的速度。
    在回路中,如果讲求时间效益,应极力避免使用PUSH及POP ,因PUSH需15个时钟脉冲,而POP 则要12个,两者相加是27个时钟脉冲,非常不值得。
    解决方法之一是:设法将欲保留之值贮存在没有用到的暂存器中;再若是固定的常数,也不妨在每次要用时重新置入,�不过是4个时钟而已。最麻烦是变数值,除了在设计模组之前,妥当地安排外,别无良策。
第三节  程式合并

    我所见过的各种组合程式虽不算多,但至少有百余个了。毛病最多的当然是缺乏完整的规划,其次则是信马游缰,一份不折不扣的流水帐!明明大门口在东边,程式硬要朝西,直到游完了大观园,天黑了,才出东门!
    这种程式我收集了一大叠,可是举来做例子,却心有余而力不足。原因无他,实在不耐烦照抄一遍,一见到就头痛!
    电脑最强的功能,便是处理繁杂重复的工作,为什么一般程式师居然存心与电脑争风吃醋呢?不说别的,光把程式输入到电脑中,就要花上几个月宝贵的光阴,真值得这样做吗?
    有一份程式,足足有四十多页,我只略作调整,便缩小到十页,处理速度则快了五倍。为什么会差这样远呢?很简单,有些人不喜欢用大脑,久而久之,习惯成自然,大脑就生了铁�!除了等因奉此,什么都不会想了。
    要想做一个优秀的程式师,第一个条件是不能偷懒,第二个条件则要有分析观察的习惯,第三个也是最重要的,则是要有追求完美的精神。程式师要像艺术家,不论是自己的或是别人的程式,都要一而再、再而三地玩味改良。
    我曾见过一个扫地的妇人,她不管在哪里,见不得有任何脏乱。这种人才值得尊敬,这种精神是伟大的,与她的职业丝毫无关!
    程式写得不够精简,有三个原因,第一个是程式师无能,这种程式能够写完,可以运行,已算相当难得了;第二个原因是不懂技巧,硬桥硬马的干, 不知什么是效率,也不知道如何达成。自己写的程式都不见得看得懂,遑论他人的?第三则是根本缺乏敬业精神,敷衍塞责,这种人我最瞧不起。
    写程式之初,如果把任务�解清楚,然后分析因素,分割模组。所有类似的情况都合并到一处,再以变数代替,统一执行。这原本是份内的工作,前述的情况根本不可能发生!
    问题是发生了以后怎么办呢?我建议最好重写,如果一定要改,只好采用程式合并的技巧,浓缩一下。
    合并的目的是为了增进效率,而合并的方法则因情况不同而异,就像人生了病,必须先查出病因,否则无法下药。我试着以所知道的一些例证,简要地解说如后。

一、过程的合并:

    要做过程的合并,首先要查明下列各点:
  1,首先找出过程类似的,全部移到一堆,如果找不到,那就没救了。
    然而,这种程式要就是太小,根本不可能有类似的情况,再不就是写作时杂乱无章,信马游缰。分明有类似的过程,但没有共通的原则,无从浓缩。当然,也可能有些程式,因工作量及处理的细节太多,以致无法浓缩。

  2,在类似的程式中,找寻相异的指令或流程,再若没有,那就是重复了,正宜合并。

  3,把相异的指令或流程用变数取代,或将不同程式之入口放在暂存器里。

  4,将各程式在应用该流程前,设好变数及使用的暂存器。

  5,合并相似的程式段,不同处应用变数取代之。

    下面举一实例,系一绘图程式之片断,兹改变原用标题,并将分散在各处若干不同之段,列述如下:
  189: MASK    PROC    NEAR
  190:        MOV    DX,3C4H
  191:        MOV    AL,2
  192:        OUT    DX,AL
  193:        MOV    DX,3C5H
  194:        MOV    AL,PCOLOR
  195:        OUT    DX,AL
  196:        RET
  197: MASK    ENDP
  …
  380:        MOV    DX,03CEH
  381:        MOV    AL,3
  382:        OUT    DX,AL
  383:        MOV    AL,18H
  384:        INC    DX
  385:        OUT    DX,AL
  386:        RET
  …
  490:        MOV    DX,3CEH
  491:        MOV    AL,3
  492:        OUT    DX,AL
  493:        MOV    DX,3CFH
  494:        MOV    AL,0H
  495:        OUT    DX,AL
  496:        RET
  …
  589: CROSS    PROC    NEAR
  590:        MOV    DX,3C4H
  591:        MOV    AL,2
  592:        OUT    DX,AL
  593:        INC    DX
  594:        MOV    AL,0FH
  595:        OUT    DX,AL
  596:        RET
  597: CROSS    ENDP
  …

    这样的段落有十多处,看来每个都略有不同,似乎不能合并。然而仔细分析,显然是程式师训练不够,把一个非常有规则的程式,安排得非常紊乱,以致到这个地步。
 我们先归纳问题,决定如何合并。第一,上述各段程式,应该统一作为子程式;第二,全部变数只有四个,其中两个是传送值,两个是输出入埠。后者有连续关系,等于只有一个。因此,在调用此子程式前,应先令DX为输出入埠,再将变数装入AX中,一次调用即可。此子程式如下:
  300: SUB:
  301:        OUT    DX,AL
  302:        INC    DX
  303:        MOV    AL,AH
  304:        OUT    DX,AL
  305:        RET
    这样简短的子程式,有无必要,端视时空的效益而定。不论怎样整理,都远比原来的要好。
    另外有种情况,更为可怕,就是在键盘输入后,用流程方式,一一比较输入码,再一一分别处理。
    比如说,为了检查游标键的左、右、上、下等八个方向的移动,以便作相应的处理,程式居然写成:
  100: PP1:    MOV    AH,0
  101:        INT    16H
  102:        CMP    AX,4800H    ;↑键
  103:        JNE    NEXT1
  104:        CALL    MOVDATA     ;SET BUFFERS
  105:        CALL    SETDLT        ;SET INCREMENT
  106: NXT01:
  107:        CALL    DOTUP
  108:        LOOP    NXT01
  109:        CALL    XORDOT        ;SET NEW DOT
  110:        CALL    XYDISP        ;DISP NEW XXX,YYY
  111:        JMP    PP1
  112: NEXT1:
  113:        CMP    AX,5000H    ;↓键
  114:        JNE    NEXT2
  115:        CALL    MOVDATA     ;SET BUFFERS
  116:        CALL    SETDLT        ;SET INCREMENT
  117: NXT02:
  118:        CALL    DOTDOWN
  119:        LOOP    NXT02
  120:        CALL    XORDOT        ;SET NEW DOT
  121:        CALL    XYDISP        ;DISP NEW XXX,YYY
  122:        JMP    PP1
  123: NEXT2:
  124:        CMP    AX,4B00H    ;←键
  125:        JNE    NEXT3
  …
    这段程式总共要检查八次,才能确定是否有游标移动以及哪个游标在移动。然后,还要一一检查其他变化,共有十八种有效码。我实在佩服这种程式师,不但有无比的耐性,还有非凡的想像力,居然能把一段极为简单平凡的程式,写得这样的精彩动人!
    如果是我,我会写得毫无趣味:
  100: PP1:    SUB    AH,AH
  101:        INT    16H
  102:        OR    AL,AL
  103:        JNZ    PP1        ;AL 非0无效
  104:        MOV    BH,AL
  105:        MOV    BL,AH
  106:        SUB    BL,47H        ;最小之字标键
  107:        JLE    PP1        ;非处理范围
  108:        SHL    BX,1
  109:        CALL    FUNC[BX]
  110:        JMP    PP1
    这是主流程,程式短,速度快,维护容易,一眼看过去,有什么错误立刻分明。
 …
 1000: FUNC    DW    NEXT02        ;�
 1001:        DW    NEXT0        ;↑
 1002:        DW    NEXT04        ;�
 1003:        DW    PPRET        ;无效
 1004:        DW    NEXT2        ;←
 1005:        DW    PPRET        ;无效
 1006:        DW    NEXT4        ;→
 1007:        DW    PPRET       ;无效
 1008:        DW    NEXT12        ;�
 1009:        DW    NEXT1        ;↓
 1010:        DW    NEXT14        ;�
 …
    因为这是子程式,加一段、减一段容易非常。
    即使是子程式,也有很大的考究,就以前段来说,在 104至110 之间,就值得三思。
  104:        CALL    MOVDATA     ;SET BUFFERS
  105:        CALL    SETDLT        ;SET INCREMENT
  106: NXT01:
  107:        CALL    DOTUP
  108:        LOOP    NXT01
  109:        CALL    XORDOT        ;SET NEW DOT
  110:        CALL    XYDISP        ;DISP NEW XXX,YYY
    首先,104 和105 会重复多次,109 及110 亦然,为什么不合并为一呢?这也是很常见的程式合并手法,两次调用合为一次,速度及空间都较为经济。
    在子程式 SETDLT 之前,先调用一次 MOVDATA,另XYDISP也是一样,首先备妥:
 3000: SETDATA:
 3001:        CALL    MOVDATA     ;假设本程式有他用
 3002: SETDLT:
 3003:          …
 …
 3100: XYDIDOT:
 3101:        CALL    XORDOT        ; 同上
 3102: XYDISP:
 3103:        …
 …
    再来设计NEXT0 的子程式:
  110: NEXT0:
  111:        CALL    SETDATA
  112: NXT01:
  113:        DOTUP  应搬至此,无需设为子程式。
  …
  120:        LOOP    NXT01
  121:        JMP    XYDIDOT     ; 如有必要,可先
                                    ; 设好参数
    这样合并一下,效果决不止高上十倍,等到真正学会了程式的技巧,写作时速度也可以提高数倍。

二、分支的处理:

    分支是程式中不可避免的手段,使用得好,整个程式气势一贯,有行云流水之妙。
    前面的例子根本不具分支的条件,故不能算是分支不良,而是程式师观念错误。
    下面再举一例,由于分支不良,以致程式支离破碎。这是一则计算�物线的快速程式,妙在没有用乘除法,也没有任何函数。其中有几段是这样的:
  100: BEG00:
  101:            CMP    BP,BUFY
  102:?    JLE    BE7
  103:           OR    CX,CX
  104:             JG    BE20
  105:            MOV    AX,BP
  106:?    SHL    AX,1
  107:           DEC    AX
  108:           JL    BE10
  109: BE2:
  110:             CALL    BE1
  111:            JC    BEG00
  112:          CALL    BE3
  113:            JMP    BEG00
  …
  120: BE14:
  121:?    LODSW
  122:           CMP    AH,1FH
  123:             JGE    BE141
  124:            LOOP    BE14
  125:      POP    DI
  126:          POP    CX
  127:            MOV    SI,DI
  128:              JMP    BE142
  129: BE141:
  130:            POP    DI
  131:          POP    CX
  132:          MOV    SI,DI
  …
  150: BE10:
  151:          CALL    BE1
  152:            JMP    BEG00
  153: BE20:
  154:              MOV    AX,CX
  155:?    SUB    AX,DX
  156:           SHL    AX,1
  157:             DEC    AX
  158:            JLE    BE2
  159:?    CALL    BE3
  160:           JMP    BEG00
  161: BE1:
  162:?    INC    DX
  163:           ADD    CX,DX
  164:             ADD    CX,DX
  165:            INC    CX
  166:            ADD    DI,BUFX
  167:           CMP    DI,BX
  168:             JLE    BE1RET
  169:            CALL    BE01
  170:            SUB    DI,BX
  171: BE1RET:
  172:           RET
  …
  190: BE01:
  191:?    MOV    AL,1
  192:           CMP    [SI+1],AL
  193:             JNZ    BE011
  194:            INC    BYTE PTR [SI+1]
  195:              RET
  …
  200: BE141:
  …
    全部程式并不大,不过一百多条指令,但是稍加改进,却可以省却廿多条指令,速度也会加快。重点在于106 到113 的分支错误,以致于多出BE10 BE20 BE3 BE01等段程式出来。
    照理,BE1 BE3 BE01都不该另设子程式,BE14也应改写,如此,整个程式就完全不同了。
    原来由 105为:
  105:            MOV    AX,BP     ;★无必要
  106:              SHL    AX,1     ;★无必要
  107:            DEC    AX     ;★无必要
  108:            JL    BE10
  109: BE2:
  110:             CALL    BE1     ;★合并后,无需调用
  111:            JC    BEG00     ;★另作分支
  112:           CALL    BE3     ;★也无必要调用
  113:             JMP    BEG00
    现改为:
  107: BE1:              ;原为DEC AX分支处理
  108:              INC    DX     ;原161子程式作主流程
  109:            ADD    CX,DX
  110:          ADD    CX,DX
  111:            INC    CX
  112:              ADD    DI,BUFX
  113:          CMP    DI,BX
  114:            JLE    BE11
  115: ;          CALL    BE01     ;本子程式重写如下:
  116:            CMP    BYTE PTR[SI+1],1
  117:             JNE    BE1A
  118:            INC    BYTE PTR[SI+1]
  119: BE1A:
  120:            SUB    DI,BX
  121:            JC    BEG00     ;原111
  122:            …          ;原BE3 程式
  …
    又 125条三个指令也是分支错误,白白浪费。
  120: BE14:
  121:           LODSW
  122:             CMP    AH,1FH
  123:            JGE    BE141
  124:          LOOP    BE14
  125:            POP    DI     ;★可以省略
  126:              POP    CX     ;★可以省略
  127:          MOV    SI,DI     ;★可以省略
  128:            JMP    BE142     ;★可以省略
  129: BE141:
  130:              POP    DI
  131:            POP    CX
  132:          MOV    SI,DI    ;127移到此
  133:            JNZ    BE142     ;128移到此
  134:              …

第四节  定案包装

一、手册:

    手册写作本来与程式写作无关,但由于一般程式师都不知道手册的重要性,往往程式写得极佳,而市场口碑却不良,以致惨遭滑铁泸之败。
    实际上,当今市场的趋势,都倾向于萤幕提示,以致于手册仅具辅助作用,帮助使用者理解各种功能的发挥而已。
    问题就出在这里,一个功能的介绍、说明,与该功能应用的发挥,完全是不同的层次。「萤幕提示」经常由程式师自行制作,而程式师对文字概念的应用及理解能力,往往并不太高明,其结果可想而知。
    手册应该有专人写作,这种人既要对文字概念应用裕如,又要充份�解电脑的功能。难的是,培养一个程式师,了不起三个月到半年,而一个能达意的作家,起码需要三至五年。遗憾的是,一般电脑公司没有这种眼光,以为写程式需要技术,手册则随便找人应付了事。
    手册的重要性,并非仅止于此,一个有价值的程式,一定有周详的计划,有制作的蓝图。这种计划及蓝图,经过文字概念上的整理,应该就是手册本身。换句话说,有良好规划的程式,必然是先有手册作为蓝图,再根据手册制作程式。

二、版本:

    程式完成以后,除非一些特殊的原因,只要有实用价值,必然需要不断改进、强化。
    这一来就面临版本更新的问题,程式师在制作之初,必须事先考虑周全。不要希望一次把程式写得尽善美,完整无缺,不仅那是不可能的梦想,也是自找麻烦。
    任何一个人,即使是不世天才,也不可能经历人间所有的事件。而程式所需要适应的范围,则是动态的、随着人的知识及经验不断增长。因此,一个崭新的程式一旦问世,就成为人世间的新生事物,人的经验扩展后,新的需求即接踵而至。刚刚完成的程式,在完成的那一�,就已成为过去式。
    所以在程式规划时,必须高瞻远瞩,考虑得越是周全,程式的生命力越是旺盛。同时,在另一方面,程式必须交到使用者手中,才有实际的价值。是以如何在周全的规划,和尽快的完成工作之间,作有效的斟酌取舍,则是个难题。
    解决的方法之一,就是利用「版本」观念,将产品分为数个时期。这样,不仅产品可以很快地交到使用者手中,而且使用者可以提供其应用经验的回馈,更有利的,是程式得以不断地增长、成熟、完善。
    有了版本的观念,还需要对版本的制作有明确的计划,每一个版本的档案维护,修订更正,都要有专人负责。否则,当已经上市的版本还需要修改,而新的版本业已开始设计,若是一个不小心,分不清档案属于哪个版本时,其后果之不堪,将非局外人所能领会的了。

三、包装:

    此处所提的「包装」,不是商业上所谓的如何将产品美化伪装起来。而是指一个程式交到使用者手中时,应该具备哪些必备的,哪些选用的「配备程式」。
    一般大型的应用程式,经常提供很多片磁盘,要先执行一个很复杂的「初始化」程式,才能使用。如果采用组合语言制作,其目的本就是为了节省空间。空间小了,应该可以避免这种多余的手续。
    这就是包装所要考虑的问题,比如说,在我们的"聚珍整合系统"中,附有如下一些配备程式及手册:
  1,功能、操作提示或手册:
    1-1 sm.hlp:在功能提示态下,说明各功能、操作方式及注意事项。
    1-2 smvqoq.exe:聚珍整合系统操作手册阅览程式
        smvqo1.dat--smvqod.dat :操作手册资料档。
  2,smjooh.exe:繁、简体档互转程式
    smjooh.tab:繁、简体转换对照表。
  3,smjopa.exe:本系统与park文书档资料互转用。
  4,smjob5.exe:为转换其他系统生成的文书档资料用。
  5,smjib5.exe:转换dbase iii 资料档。
    这些程式及档案,都要放在同一片磁盘中,不仅为了方便省事,也可降低成本。
    在我们的经验中,这些工作说来容易,做来却大费周章。唯有在事先做好妥善的规划,最后才能省时省事,达到理想的预期效果。
    仅以萤幕提示为例,由于资料所占空间太大,就导致了极大的困难。如果事先有准备,将资料作适当的压缩,显然会省却不少麻烦。
    此外,手册的印刷,磁盘的复制,所有一切应行考虑的,都要事先想清楚。要知道,一个应用软件,其成本完全在开发及最后的包装过程,为了成功,代价是必须先付出的。

评论

此博客中的热门博文

【转】VxWorks中的地址映射

在运用嵌入式系统VxWorks和MPC860进行通信系统设计开发时,会遇到一个映射地址不能访问的问题。 缺省情况下,VxWorks系统已经进行了如下地址的映射:   memory地址、bcsr(Board Control and Status)地址、PC_BASE_ADRS(PCMCIA)地址、Internal Memory地址、rom(Flach memory)地址等,但是当你的硬件开发中要加上别的外设时,如(falsh、dsp、FPGA等),对这些外设的访问也是通过地址形式进行读写,如果你没有加相应的地址映射,那么是无法访问这些外设的。   和VxWorks缺省地址映射类似,你也可以进行相应的地址映射。   如下是地址映射原理及实现:   1、 地址映射结构 在Tornado\target\h\vmLib.h文件中 typedef struct phys_mem_desc { void *virtualAddr; void *physicalAddr; UINT len; UINT initialStateMask; /* mask parameter to vmStateSet */ UINT initialState; /* state parameter to vmStateSet */ } PHYS_MEM_DESC; virtualAddr:你要映射的虚拟地址 physicalAddr:硬件设计时定义的实际物理地址 len;要进行映射的地址长度 initialStateMask:可以初始化的地址状态: 有如下状态: #define VM_STATE_MASK_VALID 0x03 #define VM_STATE_MASK_WRITABLE 0x0c #define VM_STATE_MASK_CACHEABLE 0x30 #define VM_STATE_MASK_MEM_COHERENCY 0x40 #define VM_STATE_MASK_GUARDED 0x80 不同的CPU芯片类型还有其特殊状态 initialState:实际初始化的地址状态: 有如下状态: #define VM_STATE_VALID 0x01 #define VM_STATE_VALID_NOT 0x00 #define VM_STATE_WRITA

【转】cs8900网卡的移植至基于linux2.6内核的s3c2410平台

cs8900网卡的移植至基于linux2.6内核的s3c2410平台(转) 2008-03-11 20:58 硬件环境:SBC-2410X开发板(CPU:S3C2410X) 内核版本:2.6.11.1 运行环境:Debian2.6.8 交叉编译环境:gcc-3.3.4-glibc-2.3.3 第一部分 网卡CS8900A驱动程序的移植 一、从网上将Linux内核源代码下载到本机上,并将其解压: #tar jxf linux-2.6.11.1.tar.bz2 二、打开内核顶层目录中的Makefile文件,这个文件中需要修改的内容包括以下两个方面。 (1)指定目标平台。 移植前:         ARCH?= $(SUBARCH) 移植后: ARCH            :=arm (2)指定交叉编译器。 移植前: CROSS_COMPILE ?= 移植后: CROSS_COMPILE   :=/opt/crosstool/arm-s3c2410-linux-gnu/gcc-3.3.4-glibc-2.3.3/bin/arm-s3c2410-linux-gnu- 注:这里假设编译器就放在本机的那个目录下。 三、添加驱动程序源代码,这涉及到以下几个方面。(1)、从网上下载了cs8900.c和cs8900.h两个针对2.6.7的内核的驱动程序源代码,将其放在drivers/net/arm/目录下面。 #cp cs8900.c ./drivers/net/arm/ #cp cs8900.h ./drivers/net/arm/ 并在cs8900_probe()函数中,memset (&priv,0,sizeof (cs8900_t));函数之后添加如下两条语句: __raw_writel(0x2211d110,S3C2410_BWSCON); __raw_writel(0x1f7c,S3C2410_BANKCON3); 注:其原因在"第二部分"解释。 (2)、修改drivers/net/arm/目录下的Kconfig文件,在最后添加如下内容: Config ARM_CS8900    tristate "CS8900 support" depends on NET_ETHERNET && A

【转】多迷人Gtkmm啊

前边已经说过用glade设计界面然后动态装载,接下来再来看看怎么改变程序的皮肤(主题)     首先从 http://art.gnome.org/themes/gtk2 下载喜欢的主题,从压缩包里提取gtk-2.0文件夹让它和我们下边代码生成的可执行文件放在同一个目录下,这里我下载的的 http://art.gnome.org/download/themes/gtk2/1317/GTK2-CillopMidnite.tar.gz     然后用glade设计界面,命名为main.glade,一会让它和我们下边代码生成的可执行程序放在同一个目录下边     然后开始写代码如下: //main.cc #include <gtkmm.h> #include <libglademm/xml.h> int main(int argc, char *argv[]) {     Gtk::Main kit(argc,argv);         Gtk::Window *pWnd;        gtk_rc_parse("E:\\theme-viewer\\themes\\gtk-2.0\\gtkrc");       Glib::RefPtr<Gnome::Glade::Xml> refXml;     try     {         refXml = Gnome::Glade::Xml::create("main.glade");     }     catch(const Gnome::Glade::XmlError& ex)     {         Gtk::MessageDialog dialog("Load glade file failed!", false,       \                                   Gtk::MESSAGE_ERROR, Gtk::BUTTONS_OK);         dialog.run();               return 1;     }         refXml->get_widget("main", pWnd);     if(pW