lecture2

レジスタのあるマシンへのコンパイラ

　　前回は、スタックマシンにコンパイルする方法を解説した。今回は、実際のマシン、MIPS R5000へコンパイルすることにする。スタックマシンではコンパイラが作り安いマシンであるが、実際のマシンではレジスタがあり、これらを使ったコードを生成しなくてはならない。

MIPSプロセッサ

R5000については他の講義で学習していると思うが、簡単に解説しておく。

レジスタの構成：プロセッサには、汎用レジスタが３２個、浮動小数点レジスタが３２個あるが、コンパイラでは、以下のレジスタのみを使い、その使い方を限定する。$0は常に０のレジスタである。このプロセッサの規則では、$2は関数の帰り値、$29($sp)はスタックポインタ、$31はコール命令で関数の戻り番地を格納するのに用いられる。$4-$7の４つのレジスタは、４つまでの引数を格納するのに用いる。$8から$11まではコンパイラの作業に用いるレジスタである。

ロード命令：　lw dst, offset(reg) reg+offsetのメモリの1word(32bit)を内容を、dstのレジスタに格納する。

ストア命令：　sw src, offset(reg) reg+offsetへ、srcの1wordの内容を格納する。

即値ロード命令：　li dst,int intの数値を、dstにセットする。

レジスタ間移動命令：　move dst,src　srcのレジスタの内容をdstにコピーする。

演算命令：　addu dst,src1,src2 src1,src2のレジスタの内容を加算し、dstにセットする。このほかに、減算subu, 乗算mulなどがある。

比較演算命令：　sgt dst,src1,src2 レジスタsrc1の値がsrc2よりも大きい場合には、1,それ以外の場合には0をdstにセットする。このほかに、sltやseq命令がある。

条件分岐命令：　beq src1,src2,label レジスタsrc1の値とsrc2の内容が等しい場合にlabelに分岐する。ここでは、条件分岐命令はこの命令のみを用いる。

分岐命令：　b label labelに分岐する。

関数呼び出し命令：　jal labelに、labelに分岐し、次の命令のアドレス（戻り番地）を$31に書きこむ。

レジスタ分岐命令：　jr reg　レジスタregにある番地に飛ぶ。関数のreturnに用いる。

関数の呼び出し規則

　スタックマシンではコンパイラに都合が良いように呼び出し規則を考えたが、実際のマシンでは呼び出し規則は決められており、命令を組み合わせて行わなくてはならない。命令としては、次のように使う。

呼び出し側では、jal 命令を用いる。

　　jal foo

ラベルfooにjumpした時には、$31に戻り番地が入る。従って、関数の先頭ではこの$31をフレームのどこかにとっておかなくてはならない。関数から戻るときに、この戻り番地をとりだし、元に戻る。

　　foo: sw $31, フレームのどこか

　　　　　... 本体 ....

lw $31, 格納したところ

　　　　　 jr $31

また、このプロセッサの規則では４個までの引数はレジスタ$4-$7に入れて渡すことになっている。これ以上の引数がある場合には、スタックに積んで渡すが、ここでは4個までの引数のみにすることにする。他の関数を呼び出さない場合には、レジスタ上においておいても良いが、他の関数をさらに呼び出すときには、このレジスタをつかわなくてはならないので、通常は関数の先頭でスタック上に保存しておく。

　さて、フレームの構造は図のようにする。

引数の保存領域は、呼び出し側の関数のフレームに取る。これは４個以上の引数があった場合に連続した領域にとるためにこのようにしてある。ここでは、４wordの固定の領域である。

次に、局所変数の領域がとられる。

レジスタには数に限りがあるのでレジスタが足りなくなったり、関数呼び出しがある場合には、レジスタの退避領域に保存しておく。レジスタは他の関数でも使うので、関数呼び出しの前には必要なレジスタの値は保存しておかなくてはならない。

関数の戻り番地も保存しておく。

スタックマシンの場合には、フレームポインターを使ったが、フレームのサイズはかわらないので、フレームポインターが必要なくなっていることに注意。

　さて、x = foo(1,2)と関数呼び出しをするコードは、以下のようになる。

　　lw $4, 1

lw $5, 2

jal foo

sw $2,xのアドレス

関数の本体は、

　　foo: subu $sp,$sp,フレームサイズ　；　関数フレームの確保

　　　　 sw $31,戻り番地の退避領域

　　　　 ... 引数の保存　...

... 本体　....

move $2, 関数の返り値

　　　　 lw $31,戻り番地の退避領域

　　　　 addu $sp,$sp,フレームサイズ　；関数フレームの開放

　　　　 jr $31

となる。

コンパイラの中間コード

　一般的に、コンパイラはコンパイラが作り安いように中間コードを設計し、構文解析によって得られた構文木を中間コードに変換する。ここで最適化などの解析を行い、最終的にマシンコードに変換する。中間コードを適当に設計することによって、実際のマシンから独立したものになり、いろいろなマシンに対応できるようにもなる。

　tiny Cのターゲットとして考える中間コードは、以下のコードである。

LOADI r, n ：整数nを変数rにnをセット。

LOADA r, n ：n番目の引数を変数rにセットする。

LOADL r, n ：n番目の局所変数を変数rにセットする。

STOREA r, n ：変数rの値をn番目の引数に格納する。

STOREL r, n ：変数ｒの値をn番目の局所に格納する。

ADD　r,r1,r2 ：変数r1,r2を加算し、結果をrに格納する。

SUB r,r1,r2 ：変数r1,r2を減算し、結果をrに格納する。

MUL r,r1,r2 ：変数r1,r2を乗算し、結果をrに格納する。

GT r,r1,r2：r1とr2して比較し、＞ならrに１、それ以外は０をセットする。

LT　r,r1,r2：r1とr2して比較し、＜ならrに１、それ以外は０をセットする。

BEQ0 r, L ：rが 0だったら,ラベルＬに分岐する。

JUMP　Ｌ : ラベルLにジャンプする。

CALL　r, e : 関数エントリeを関数呼び出しをし、結果をrにセットする。

ARG r,n: ｒをn番目の引数とする。

RET　ｒ：変数rを返り値として、関数呼び出しから帰る。

PRINTLN　r, s: sのformatで、printlnを実行する。

LABEL 　Ｌ：　ラベルＬを示す。

なお、このようにop dst,src1,src2というような形式のコードを、四つ組と呼ばれる。このほかに、命令に近い形に表現するRTL(Register Transfer Language)をいう形式もある。変数rといっているのは、いわゆる局所変数ではなく、レジスタが無限にあるとして考えた時の仮想的なレジスタというべきものである。コード生成のフェーズにおいて、実際のレジスタが割り当てられる。

中間コードへの変換

　さて、構文木を変換することを考える。Lispからは離れて、これからは文と式を区別考えることにする(Lispでは、式と文の区別がなく、文でも値が必要であったが、これからは通常のＣと同じように、式と文は区別する)。関数のコンパイルする関数compileFuncDefはスタックマシンのものとほとんど同じである。だだし、本体はblockのはずなので、compileBlockを呼び出している。compileBlockでは、compileStatementを呼び出している。compileStatementでは、if文やwhile文、return文などの処理を呼び出している。制御文などで、分岐命令のコードを出すのはスタックマシンの場合とほとんど同じである。

　式のコンパイルは、compileExpressionで行う。この関数では、呼び出す側でターゲットとなる変数を作って、これを引数にして呼び出している。文のtoplevelから呼び出され、値を必要としない場合には、ターゲットを-1としている。変数を作るのは、tmp_counterを使って新しい変数の番号を生成する。式のコンパイルは以下のような手順である。

式が数字であれば、その数字をターゲットにセットするLOADIコードを出す。

式は変数であれば、その値をロードする命令を出す。

式が演算であれば、左辺と右辺に対する変数を作って、それをターゲットにコンパイルし、ターゲットに演算をするコードを出す。

中間コードからマシンコードの生成

　実際のコンパイラでは、この中間コードについて様々な最適化をし、最後にこれをマシンコード（アセンブリ言語）を出力する。マシンコードに変換するために最低限必要なのは、コンパイラで作り出した変数（仮想レジスタ）に実際のレジスタを割り当てる作業（register allocation）である。レジスタ割り当てには、実際のレジスタにどの変数が割り当てられているかを示すtmpRegStateという配列と変数がレジスタになくレジスタ退避領域にある変数を示すtmpRegSaveという配列を用いている。tmpRegStateは$8-$11のレジスタ、tmpRegSaveは退避領域に対応している。以下の関数を用意した。

initTmpReg()　レジスタ割り当ての初期化,関数の最初で行う。

getReg(r) 変数rに実際のレジスタを割り当て、そのレジスタ番号を返す。

useReg(r) 変数rに割り当てられているレジスタ番号を返す。もしも、退避領域にあるのであれば、その変数をレジスタに復帰させ、そのレジスタ番号を返す。

freeReg(r) レジスタrを開放する。

saveTmpRegs() レジスタに割り当てられている変数すべてを退避領域に格納する。

これを使ってたとえば、ADD　r, r1, r2の中間コードについては以下のようにしてコードを生成する。

r1,r2について、useRegで現在割り当てられているレジスタを求める。これをR1,R2とする。

R1、R2をfreeRegで開放する。

getRegでrにレジスタを割り当てる。これをRとする。

addu R,R1,R2のコードを生成する。

なお、中間コードの生成では変数は一回しか使われないようにしている。従って、使ってしまえば、開放してよい。しかし、実際のコンパイラではこのような条件は必ずしも成立しないことがあるので、レジスタの開放はこの命令以降、レジスタが使われないことを確かめなくてはならない。

　CALL命令では、saveTmpRegsで現在使われているレジスタを退避させなくてはならないことに注意。

コンパイラと実行

　さて、web上にあるプログラムをコンパイルするとコンパイラtiny_ccができる。tiny_ccは、これまでと同じく標準入力から呼んで、コンパイルの結果のコードを標準出力に出力するようになっている。例えば、プログラムfoo.cをコンパイルして、コードfoo.iを作るには、

　% tiny_cc < foo.c > foo.ｓ

とすればよい。printlnはライブラリ関数なので、println.cにある。実行ファイルをつくるには、これをリンクして、コンパイルする。

　% cc foo.s println.c

　% a.out

とすれば、実行できる。

演習課題８：

　これまでのtiny Cのコンパイラでは大域変数は配列宣言を処理していない。配列宣言と配列参照を処理できるように拡張して、以下のプログラム sample.c（課題6のプログラムsample3.c）をコンパイルしなさい。提出は、拡張、修正したところのみでよい。

ヒント：

まずは,適当なプログラムを作ってみて、-Sのオプションを付けてコンパイルして、どのようなコード変換されるかを調べること。

Cの大域的な宣言 int a[10]は、.common a,40のようにコンパイルされている

要素の参照は、... = a[i]は、例えば、以下のようにコンパイルされる。

lw $8,iのアドレス、

sll $8,$8,2

la $9,a

addu $8,$8,$9

lw $8,($8)

最終課題レポート（予告）：

　これまで、取り上げてきたLisp(tiny C)のインタプリタ、スタックマシンのコンパイラ、MIPSのコンパイラのいずれか１つについて、工夫を加え、提供するテストプログラムを用いて実行時間を測定し、どのような工夫をしたか、どの位性能が向上したかについて、レポートを提出しなさい。