SYSCALL(2) | Linux Programmer's Manual | SYSCALL(2) |
名前¶
syscall - 間接システムコール
書式¶
#define _GNU_SOURCE /* feature_test_macros(7) 参照 */ #include <unistd.h> #include <sys/syscall.h> /* SYS_xxx の定義用 */ long syscall(long number, ...);
説明¶
syscall() は、システムコールを起動する小さなライブラリ関数で、 number で指定されたアセンブリ言語インターフェースのシステムコールを、指定された引き数をつけて実行する。 syscall() が役に立つのは、例えば C ライブラリにラッパー関数が存在しないシステムコールを呼び出したい場合である。
syscall() は、システムコールを行う前に CPU レジスターを保存し、システムコールから返った際にレジスターを復元し、エラーが発生した場合はシステムコールが返したエラーコードを errno(3) に格納する。
システムコールのシンボル定数は、ヘッダーファイル <sys/syscall.h> に書かれている。
返り値¶
返り値は呼び出されたシステムコールによって定義される。 一般に、返り値 0 は成功を表す。 -1 はエラーを表し、エラーコードは errno に入れられる。
注意¶
syscall() は 4BSD で最初に登場した。
アーキテクチャー固有の要件¶
各アーキテクチャーの ABI には、 システムコールの引き数のカーネルへの渡し方に関する独自の要件がある。 (ほとんどのシステムコールのように) glibc ラッパー関数があるシステムコールでは、 glibc が詳細を処理し、アーキテクチャーに応じた方法で引き数が適切なレジスターにコピーされる。 しかし、 システムコールを呼び出すのに syscall() を使う場合には、 呼び出し側でアーキテクチャー依存の詳細を処理しなければならない場合がある。 これはいくつかの 32 ビットアーキテクチャーでは非常によくあることだ。
例えば、ARM アーキテクチャーの Embedded ABI (EABI) では、 (long long などの) 64 ビット値は偶数番地のレジスターのペアに境界があっていなければならない。したがって、 glibc が提供するラッパー関数ではなく syscall() を使う場合には、 readahead() システムコールは ARM アーキテクチャーの EABI では以下のようにして起動されることになる。
syscall(SYS_readahead, fd, 0,
(unsigned int) (offset >> 32),
(unsigned int) (offset & 0xFFFFFFFF),
count);
オフセット引き数は 64 ビットで、最初の引き数 (fd) は r0 で渡されるので、呼び出し側では手動で 64 ビット値を分割して境界を合わせて、 64 ビット値が r2/r3 レジスターペアで渡されるようにしなければならない。このため、 r1 (2 番目の引数 0) としてダミー値を挿入している。
同様のことが、 MIPS の O32 ABI、 PowerPC の 32 ビット ABI や Xtensa でも起こりうる。
次のシステムコールに影響がある: fadvise64_64(2), ftruncate64(2), posix_fadvise(2), pread64(2), pwrite64(2), readahead(2), sync_file_range(2), truncate64(2)
アーキテクチャー毎の呼び出し規約¶
各アーキテクチャーには、それぞれ独自のシステムコール起動方法とカーネルへの引き数の渡し方がある。 各種のアーキテクチャーの詳細を以下の 2 つの表にまとめる。
最初の表は、 カーネルモードに遷移するのに使用される命令、 システムコール番号を示すのに使用されるレジスター、 システムコールの結果を返すのに使用されるレジスターの一覧である (なお、 ここに載っているカーネルモードに遷移するのに使用される命令は、 カーネルモードに遷移する最速や最善の方法でない場合もあるので、 vdso(7) を参照する必要があるかもしれない)。
arch/ABI | instruction | syscall # | retval | Notes |
arm/OABI | swi NR | - | a1 | NR はシステムコール番号 |
arm/EABI | swi 0x0 | r7 | r0 | |
arm64 | svc #0 | x8 | x0 | |
blackfin | excpt 0x0 | P0 | R0 | |
i386 | int $0x80 | eax | eax | |
ia64 | break 0x100000 | r15 | r8 | 下記参照 |
mips | syscall | v0 | v0 | 下記参照 |
parisc | ble 0x100(%sr2, %r0) | r20 | r28 | |
s390 | svc 0 | r1 | r2 | 下記参照 |
s390 | svc 0 | r1 | r2 | 下記参照 |
sparc/32 | t 0x10 | g1 | o0 | |
sparc/64 | t 0x6d | g1 | o0 | |
x86_64 | syscall | rax | rax |
s390 と s390x では、 NR (システムコール番号) が 256 未満の場合 "svc NR" で NR が直接渡される場合がある。
少ないがいくつかのアーキテクチャーでは、 システムコールの失敗を示す単純な真偽値がレジスターを使って通知される。この用途に ia64 は r10 を使用し、 mips は a3 を使用する。
2 つ目の表は、システムコールの引き数を渡すのに使用されるレジスターの一覧である。
arch/ABI | arg1 | arg2 | arg3 | arg4 | arg5 | arg6 | arg7 | 備考 |
arm/OABI | a1 | a2 | a3 | a4 | v1 | v2 | v3 | |
arm/EABI | r0 | r1 | r2 | r3 | r4 | r5 | r6 | |
arm64 | x0 | x1 | x2 | x3 | x4 | x5 | - | |
blackfin | R0 | R1 | R2 | R3 | R4 | R5 | - | |
i386 | ebx | ecx | edx | esi | edi | ebp | - | |
ia64 | out0 | out1 | out2 | out3 | out4 | out5 | - | |
mips/o32 | a0 | a1 | a2 | a3 | - | - | - | 下記参照 |
mips/n32,64 | a0 | a1 | a2 | a3 | a4 | a5 | - | |
parisc | r26 | r25 | r24 | r23 | r22 | r21 | - | |
s390 | r2 | r3 | r4 | r5 | r6 | r7 | - | |
s390x | r2 | r3 | r4 | r5 | r6 | r7 | - | |
sparc/32 | o0 | o1 | o2 | o3 | o4 | o5 | - | |
sparc/64 | o0 | o1 | o2 | o3 | o4 | o5 | - | |
x86_64 | rdi | rsi | rdx | r10 | r8 | r9 | - |
mips/o32 のシステムコールの規約では、 ユーザースタックに引き数を 5 個から 8 個渡す。
これらの表にはすべての呼び出し規約が記載されているわけではない点に注意すること — アーキテクチャーによっては、ここに記載されていない他のレジスターが見境なく上書きされる場合もある。
例¶
#define _GNU_SOURCE #include <unistd.h> #include <sys/syscall.h> #include <sys/types.h> #include <signal.h> int main(int argc, char *argv[]) {
pid_t tid;
tid = syscall(SYS_gettid);
tid = syscall(SYS_tgkill, getpid(), tid, SIGHUP); }
関連項目¶
この文書について¶
この man ページは Linux man-pages プロジェクトのリリース 3.79 の一部 である。プロジェクトの説明とバグ報告に関する情報は http://www.kernel.org/doc/man-pages/ に書かれている。
2015-01-22 | Linux |