Next Previous Contents

4. 移植程式與編譯程式

4.1 gcc自行定義的符號

只要執行gcc時,附加 -v這個參數,就能找出你所用的這版gcc,自動幫你定義了什麼符號。例如,我的機器看起來會像這樣:

$ echo 'main(){printf("hello world\n");}' | gcc -E -v -
Reading specs from /usr/lib/gcc-lib/i486-box-linux/2.7.2/specs
gcc version 2.7.2
 /usr/lib/gcc-lib/i486-box-linux/2.7.2/cpp -lang-c -v -undef
-D__GNUC__=2 -D__GNUC_MINOR__=7 -D__ELF__ -Dunix -Di386 -Dlinux
-D__ELF__ -D__unix__ -D__i386__ -D__linux__ -D__unix -D__i386
-D__linux -Asystem(unix) -Asystem(posix) -Acpu(i386)
-Amachine(i386) -D__i486__ -

假若你正在寫的程式碼會用到一些Linux獨有的特性,那麼把那些無法移植的程式碼,以條件式編譯的前置命令封括起來,可是個不錯的主意呢!如下所示︰

#ifdef __linux__
/* ... funky stuff ... */
#endif /* linux */

__linux__就可以達成目的;看仔細一點,不是linux喔。儘管linux也有定義,畢竟,這個仍然不是POSIX的標準。

4.2 線上求助說明

gcc編譯器參數的說明文件是gcc info page(在Emacs內,按下C-h i,然後選‘gcc’的選項)。要是弄不出來,不是賣你CD-ROM的人沒把這個東東壓給你,不然就是你現在用的是舊版的。遇到這種情況,最好的方法是移動尊臀到archive ftp://prep.ai.mit.edu/pub/gnu或是它的mirrors站台,去把gcc的原始檔案抓回家,重新烹飪一番。

gcc manual page(gcc.1) 可以說是已經過時了,要是你吃飽了撐著沒事幹硬是想看,它就會告訴你說別無聊了。

旗正飄飄 

在命令列上執行gcc時,只要在它的屁股後面加上-On的選項,就能讓gcc乖乖的替你生出最佳編碼的機器碼。這裡的n是一個可有可無的小整數,不同版本的gcc,n的意義與其正確的功效都不一樣,不過,典型的範圍是從0(不要雞婆,我不要最佳編碼。)變化到2(最佳編碼要多一點。),再昇級到3(最佳編碼要再多一點,多一點)。

gcc在其內部會將這些數字轉譯成一系列的-f-m的選項。執行gcc時帶上旗號-v-Q,你就能很清楚的看出每一種等級的-O是對應到那些選項。好比說,就-O2來講,我的gcc告訴會我說:

enabled: -fdefer-pop -fcse-follow-jumps -fcse-skip-blocks
-fexpensive-optimizations
         -fthread-jumps -fpeephole -fforce-mem -ffunction-cse -finline
         -fcaller-saves -fpcc-struct-return -frerun-cse-after-loop
         -fcommon -fgnu-linker -m80387 -mhard-float -mno-soft-float
         -mno-386 -m486 -mieee-fp -mfp-ret-in-387

要是你用的最佳編碼等級高於你的編譯器所能支援的(e.g. -O6),那麼它的效果就跟你用你的編譯器所能提供的最高等級的效果是一樣的。說實在的,發行出去的gcc程式碼,用在編譯時竟是如此處理這等問題,真的不是什麼好的構想。日後若是有更進步的最佳編碼方法具體整合到新的版本裡,而你(或是你的users)還是試著這樣做的話,可能就會發現gcc會中斷你的程式了。

從gcc 2.7.0昇級到2.7.2的users應該注意一點,使用-O2時會有一個bug。更糟糕的是,強度折減參數(strength reduction)居然沒有用!要是你喜歡重新編譯gcc的話,是有那麼一個修正的版本可以更正這項錯誤;不然的話,一定要確定每次編譯時都有加上-fno-strength-reduce喔!

11/12/97譯

有個性的微處理器

有一些-m的旗號十分有用處,但是卻無法藉由各種等級的-O打開來使用。這之中最重要的有是-m386-m486這兩種,用來告訴gcc該把正在編譯的程式碼視作專為386或是486機器所寫的。不論是用哪一種-m來編譯程式碼,都可以在彼此的機器上執行,-m486編譯出來的碼會比較大,不過拿來在386的機器上跑也不會比較慢就是了。

目前尚無-mpentium或是-m586的旗號。Linus建議我們可以用-m486 -malign-loops=2 -malign-jumps=2 -malign-functions=2來得到最佳編碼的486程式碼,這樣做正好就可以避免alignment(Pentium並不需要)有過大的gaps發生。Michael Meissner說:

我的第六感告訴我,-mno-strength-reduce(嘿!要曉得我可不是在談強度折減參數的bug呀,那已經是另外一個爭論的戰場了。)一樣也可以在x86的機器上產生較快的程式碼,這是因為x86的機器對暫存器有著不可磨滅的饑渴在,而且GCC's method of grouping registers into spill registers vs. other registers doesn't help either。傳統上,強度折減的結果會使得編譯器去利用加法暫存器以加法運算來取代乘法運算。事實上,我在懷疑-fcaller-saves可能也只是個漏洞也說不定。
而我的第七感則再度的告訴我說,-fomit-frame-pointer可能會也可能不會有任何的賺頭。從這點來看,就是意謂著有另一個暫存器可以用來處理記憶體分配的問題。另方面,若純粹從x86的機器在轉換它的指令集成為機器碼的方法上來看,便意謂著堆疊所用到的記憶體空間要比frame所用到的還要來得多;換句話說,Icache對程式碼而言並沒有實質上的幫助,若是閣下用了-fomit-frame-pointer的話,同時也是告訴編譯器在每次呼叫函數之後,就必須修正堆疊的指標;然而,就frame來講,若呼叫的次數不多的話,則允許堆疊暫時堆積起來。

有關這方面主題的最後一段話仍是來自於Linus:

要注意的是,如果你想要得到最佳狀況的執行效能,可千萬別相信我的話。無論如何,一定要進行測試。gcc編譯器還有許多的參數可用,其中可能就有一種最特別的組合,可以給你最佳編碼的結果。

11/14/97譯 5/15/98修正

Internal compiler error: cc1 got fatal signal 11

Signal 11是指 SIGSEGV,或者 ‘segmentation violation’。通常這是指 說gcc對自己所用的指標感到困惑,而且還嘗試著把資料寫入不屬於它的記憶體裡。所以,這可能是一個gcc的bug。 然而,大體而言,gcc是一支經過嚴密測試且可靠度良好的軟體佳作。它也用了大量複雜的資料結構與驚人的指標數量。簡言之,若是要評選本世紀最挑惕與最一絲不茍的RAM測試程式,gcc絕對可以一摘后冠。假如你無法重新複製這隻bug---當你重新開始編譯時,錯誤的訊息並沒有一直出現在同一個地方---那幾乎可以確定,是你的硬體本身有問題(CPU,記憶體,主機板或是快取記憶體).千萬不要因為你的電腦可以通過開機程序的測試、或是Windows可以跑得很順、或者其它什麼的,就回過頭來大肆宣傳說這是gcc的一個bug;你所做的這些測試動作,通常沒有什麼實際上的價值,這是很合理的結論。另外,也不要因為編譯核心時,總是停留在‘make zImage’的階段,就要大罵這是gcc的bug---當然它會停在那兒啊!做‘make zImage’時,需要編譯的檔案可能就超過200檔案;我們正在研擬一個替代的方案。

如果你可以重覆產生這個bug,而且(最好是這樣啦!)可以寫一個短小的程式來展示這隻bug的話,你就可以把它做成bug報告,然後email給FSF,或者是linux-gcc通信論壇。你可以去參考gcc的說明文件,看看有什麼詳細的資訊,是他們所需要的。

4.3 移植能力

據報,近日來許多正面的消息指出,若是有某件東東到現在都還沒移植到Linux上去,那麼可以肯定的是,它一定一點價值也沒有。:-)

嗯!正經一點。一般而言,原始碼只需要做一些局部的修改,就可以克服Linux 100%與POSIX相容的特質。如果你做了任何的修改,而將此部份傳回給原作者,會是很有建設性的舉動。這樣日後就只需要用到‘make’,就能得到一個可執行的檔案了。

BSD教徒 (有 bsd_ioctldaemon<sgtty.h>)

編譯程式時,可以配合-I/usr/include/bsd與連結-lbsd的程式庫。(例如:在你的Makefile檔內,把-I/usr/include/bsd加到CFLAGS那一行;把-lbsd加到LDFLAGS那一行)。如果你真的那麼想要BSD型態的信號行為,也需要再加上-D__USE_BSD_SIGNAL了。那是因為當你用了-I/usr/include/bsd與含括了標頭檔<signal.h>之後,make時就會自動加入了。

失落的封印(SIGBUS, SIGEMT, SIGIOT, SIGTRAP, SIGSYS etc)

Linux與POSIX是完全相容的。不過,有些信號並不是POSIX定義的---ISO/IEC 9945-1:1990 (IEEE Std 1003.1-1990), paragraph B.3.3.1.1 sez:

“在POSIX.1中省略了SIGBUS、SIGEMT、SIGIOT、SIGTRAP與SIGSYS信號,那是因為它們的行為與實作的方式息息相關,而且也無法進行適當的分類。確認實作方式後,便可以發送這些信號,可是必須以文件說明它們是在什麼樣的環境底下發送出來的,以及指出任何與它們的發展相關的限制。”

想要修正這個問題,最簡單也是最笨的方法就是用SIGUNUSED重新定義這些信號。正確的方法應該是以條件式的編譯#ifdef來處理這些問題才對:

#ifdef SIGSYS
/* ... non-posix SIGSYS code here .... */
#endif

11/15/97譯 5/22/98修正

K & R

gcc是一個與ANSI相容的編譯器;奇怪的是,目前大多數的程式碼都不符合ANSI所定的標準。如果你熱愛ANSI,喜歡用ANSI提供的標準來撰寫C程式,似乎除了加上-traditional的旗號之外,就沒有其它什麼可以多談的了。There is a certain amount of finer-grained control over which varieties of brain damage to emulate;請自行查閱gcc info page。

要注意的是,儘管你用了-traditional來改變語言的特性,它的效果也僅侷限於gcc所能夠接受的範圍。例如, -traditional會打開-fwritable-strings,使得字串常數移至資料記憶體空間內(從程式碼記憶體空間移出來,這個地方是不能任意寫入的)。這樣做會讓程式碼的記憶體空間無形中增加的。

前置處理器的符號卯上函數原型宣告

最常見的問題是,如眾所皆知,Linux中有許多常用的函數都定義成巨集存放在標頭檔內,此時若有相似的函數原型宣告出現在程式碼內,前置處理器會拒絕進行語法分析的前置作業。常見的有atoi()atol()

sprintf()

在大部份的Unix系統上,sprintf(string, fmt, ...)傳回的是string的指標,然而,這方面Linux(遵循ANSI)傳回的卻是放入string內的字元數目.進行移植時,尤其是針對SunOS,需有警覺的心。

fcntl 與相關的函數;FD_*家族的定義到底擺在哪裡?

就在<sys/time.h>裡頭。 為了真正的原型宣告,當你用了fcntl,可能你也想含括標頭檔<unistd.h>進來。

一般而言,函數的manual page會在SYNOPSIS章節內列出需要的標頭檔

select()的計時---程式執行時會處於忙碌-等待的狀態

很久很久以前,,select()的計時參數只有唯讀的性而已。即使到了最近,manual pages仍然有下面這段的警告:

select()應該是藉由修正時間的數值(如果有的話),再傳回自原始計時開始後所剩餘的時間。未來的版本可能會使這項功能實現。因此,就目前而言,若以為呼叫select()之後,計時指標仍然不會被修正過,可是一種非常不明智的想法喔!

未來就在我們的眼前了!至少,在這兒你絕對可以看到。函數select()傳回的,是扣除等待尚未到達的資料所耗費的時間後,其剩餘的時間數值。如果在計時結束時,都沒有資料傳送進來,計時引數便會設為0;如果接著還有任何的select(),以同樣的計時structure來呼叫,那麼select()便會立刻結束。

若要修正這項問題,只要每次呼叫select()前,都把計時數值放到計時 structure內,就沒有問題了。把下面的程式碼,

      struct timeval timeout;
      timeout.tv_sec = 1; timeout.tv_usec = 0;
      while (some_condition)
            select(n,readfds,writefds,exceptfds,&timeout); 
改成,
      struct timeval timeout;
      while (some_condition) {
            timeout.tv_sec = 1; timeout.tv_usec = 0;
            select(n,readfds,writefds,exceptfds,&timeout);
      }

這個問題,在有些版本的Mosaic裡是相當著名的,只要一次的等待,Mosaic就掛在那裡了。Mosaic的螢幕右上角,是不是有個圓圓的、會旋轉的地球動畫。那顆球轉得愈快,就表示資料從網路上傳送過來的速率愈慢!

產生中斷的系統呼叫

特徵:

當一支程式以Ctrl-Z中止、然後再重新執行時—或者是其它可以產生Ctrl-C中斷信號的情況,如子程序的終結等—系統就會抱怨說"interrupted system call"或是"write: unknown error",或者諸如此類的訊息。

問題點:

POSIX的系統檢查信號的次數,比起一些舊版的Unix是要多那麼一點。如果是Linux,可能就會執行signal handlers了—

就其它的作業系統而言,你需要的可能就是下面這些系統呼叫了: creat(), close(), getmsg(), putmsg(), msgrcv(), msgsnd(), recv(), send(), wait(), waitpid(), wait3(), tcdrain(), sigpause(), semop() to this list.

在系統呼叫期間,若有一信號(那支程式本身應準備好handler因應了)產生,handler就會被呼叫。當handler將控制權轉移回系統呼叫時,它會偵測出它已經產生中斷,而且傳回值會立刻設定成-1,而errno設定成EINTR。程式並沒有想到會發生這種事,所以就掛了。

有兩種修正的方法可以選擇:

(1) 對每個你自行安裝的signal handler,都須在sigaction的旗號加上SA_RESTART。例如,把下列的程式,

  signal (sig_nr, my_signal_handler);
改成,
  signal (sig_nr, my_signal_handler);
  { struct sigaction sa;
    sigaction (sig_nr, (struct sigaction *)0, &sa);
#ifdef SA_RESTART
    sa.sa_flags |= SA_RESTART;
#endif
#ifdef SA_INTERRUPT
    sa.sa_flags &= ~ SA_INTERRUPT;
#endif
    sigaction (sig_nr, &sa, (struct sigaction *)0);
  }

要注意的是,當這部份的變更大量應用到系統呼叫之後,呼叫read()write()ioctl()select()pause()connect()時,你仍然得自行檢查EINTR。如下所示:

(2) 你自己得很明確地檢查EINTR

這裡有兩個針對read()ioctl()的例子。

原始的程式片段,使用read()

int result;
while (len > 0) { 
  result = read(fd,buffer,len);
  if (result < 0) break;
  buffer += result; len -= result;
}
修改成,
int result;
while (len > 0) { 
  result = read(fd,buffer,len);
  if (result < 0) { if (errno != EINTR) break; }
  else { buffer += result; len -= result; }
}
原始的程式片段,使用ioctl()

int result;
result = ioctl(fd,cmd,addr);
修改成,
int result;
do { result = ioctl(fd,cmd,addr); }
while ((result == -1) && (errno == EINTR));

注意一點,有些版本的BSD Unix,其內定的行為是重新執行系統呼叫。若要讓系統呼叫中斷,得使用 SV_INTERRUPTSA_INTERRUPT旗號。

可以寫入的字串

gcc對其users總懷抱著樂觀的想法,相信當他們打算讓某個字串當作常數來用時---那它就真的只是字串常數而已。因此,這種字串常數會儲存在程式碼的記憶體區段內。這塊區域可以page到磁碟機的image上,避免耗掉swap的記憶體空間,而且任何嘗試寫入的舉動都會造成分頁的錯誤(segmentation fault)。這可是一種特色呢!

對老舊一點的程式而言,這可能會產生一個問題。例如,呼叫mktemp(),傳遞的引數(arguments)是字串常數。 mktemp()會嘗試著在*適當的位置*重新寫入它的引數。

修正的方法不外乎(a)以-fwritable-strings編譯,迫使gcc將此常數置放在資料記憶體空間內;或者(b)將侵犯地權的部份重新改寫,配置一個不為常數的字串,在呼叫前,先以strcpy()將資料拷貝進去。

為什麼呼叫execl()會失敗?

那是因為你呼叫的方式不對。execl的第一個引數是你想要執行的程式名.第二個與接續的引數會變成你所呼叫的程式的argv陣列。記住:傳統上,argv[0]是只有當程式沒有帶著引數執行時,才會有設定值。所以囉,你應該這樣寫:

execl("/bin/ls","ls",NULL);
而不是只有,
execl("/bin/ls", NULL);

執行程式而不帶任何引數,可解釋成是一種邀請函,目的是把此程式的動態程式庫獨立的特性印出來。至少,a.out是這樣的。就ELF而言。事情就不是這樣了.

(如果你想得知此程式庫的資訊,有一些更簡單的介面可用;參考動態載入那一章節,或是ldd的manual page。)

11/16/97譯 6/2/98修正


Next Previous Contents