[笨叔点滴9] GNU GCC扩展2

“ 饭店老板算了算饭钱笑着说：小姑凉，一共201块，算你200

小花想了想问道：那我问一下，如果是204块的话，老师你会怎么算？

老板楞了一下：也算你200

小花点点头，那麻烦你再给我一听可乐

老板：？？？

”

虽然是个笑话，但是现在国人聪明的人太多，像笨叔这么笨的人已经很少见了。

昨天不少小伙伴问笨叔，为啥没有笨9，直接笨10了？

哈哈，这是小秘密

本次点滴，我们继续GNU GCC扩展吧！

01 GCC扩展吧

—

5)可变参数宏

在GNU C语言中，宏可以接受可变数目的参数，这个主要运用在输出函数里。

#define pr_debug(fmt, ...)\

dynamic_pr_debug(fmt, ##__VA_ARGS__)

“...”代表一个可以变化的参数表，__VA_ARGS__是编译器保留字段，预处理时把参数传递给宏。当宏的调用展开时，实际参数就传递给dynamic_pr_debug函数了。

6)函数属性

GNU C语言允许声明函数属性（Function Attribute）、变量属性（Variable Attribute）和类型属性（Type Attribute），以便编译器进行特定方面的优化和更仔细的代码检查。特殊属性语法格式为：

__attribute__((attribute-list))

GNU C语言里定义的函数属性有很多，如noreturn、format以及const等。另外还可以定义一些和处理器体系结构相关的函数属性，如ARM体系结构中可以定义interrupt、isr等属性，有兴趣的读者可以参阅GCC的相关文档。

下面是Linux内核中使用format属性的一个例子。

int libcfs_debug_msg(structlibcfs_debug_msg_data *msgdata,

const char*format1, ...)

__attribute__ ((format (printf, 2, 3)));

libcfs_debug_msg()函数里声明了一个format函数属性，它会告诉编译器按照printf的参数表的格式规则对该函数参数进行检查。数字2表示第2个参数为格式化字符串，数字3表示参数“...”里的第一个参数在函数参数总数中排在第几个。

noreturn属性通知编译器，该函数从不返回值。这让编译器消除不必要的警告信息。比如die函数，这函数不会返回。

void__attribute__((noreturn)) die(void);

const属性会让编译器只调用该函数一次，以后再调用时只需要返回第一次结果就可以了，从而提高效率。

static inline u32__attribute_const__ read_cpuid_cachetype(void)

{

return read_cpuid(CTR_EL0);

}

Linux还有其他一些函数属性，定义在compiler-gcc.h文件中。

#define __pure __attribute__((pure))

#define __aligned(x) __attribute__((aligned(x)))

#define __printf(a, b) __attribute__((format(printf, a, b)))

#define __scanf(a, b) __attribute__((format(scanf, a, b)))

#define noinline __attribute__((noinline))

#define __attribute_const__ __attribute__((__const__))

#define __maybe_unused __attribute__((unused))

#define __always_unused __attribute__((unused))

7)变量属性和类型属性

变量属性可以对变量或结构体成员进行属性设置，类型属性常见的属性有alignment、packed和sections等。

alignment属性规定变量或者结构体成员的最小对齐格式，以字节为单位。

struct qib_user_info {

__u32 spu_userversion;

__u64 spu_base_info;

} __aligned(8);

这个例子中，编译器以8字节对齐的方式来分配qib_user_info这个数据结构。

packed属性可以使变量或者结构体成员使用最小的对齐方式，对变量是以字节对齐，对域（field）是以位对齐的。

struct test

{

char a;

int x[2] __attribute__ ((packed));

};

x成员使用了packed属性，它会存储在变量a后面，所以这个结构体一共占用9个字节。

8)内建函数

GNU C语言提供一系列内建函数进行优化，这些内建函数以“_builtin_”作为函数名前缀。下面介绍一些Linux内核常用的内建函数。

__builtin_constant_p(x)：判断x是否在编译时就可以确定为常量。如果x为常量，该函数返回1，否则返回0。

#define __swab16(x) \

(__builtin_constant_p((__u16)(x)) ? \

___constant_swab16(x) : \

__fswab16(x))

__builtin_expect(exp, c)：这里意思是exp==c的概率很大，用来引导GCC编译器进行条件分支预测。开发人员知道最可能执行哪个分支，将最有可能执行的分支告诉编译器，让编译器优化指令序列，使指令尽可能地顺序执行，从而提高CPU预取指令的正确率。

#define LIKELY(x)__builtin_expect(!!(x), 1) //x很可能为真

#define UNLIKELY(x)__builtin_expect(!!(x), 0) //x很可能为假

__builtin_prefetch(const void *addr, int rw, int locality)：主动进行数据预取，在使用地址addr的值之前就把其值加载到cache中了，减少读取的延迟，从而提高性能。该函数可以接受三个参数，第一个参数addr表示要预取数据的地址；第二个参数rw表示读写属性，1表示可写，0表示只读；第三个参数locality表示数据在cache中的时间局部性，其中0表示读取完addr的之后不用保留在cache中，而1~3表示时间局部性逐渐增强。如下面的prefetch()和prefetchw()函数的实现。

#define prefetch(x)__builtin_prefetch(x)

#define prefetchw(x)__builtin_prefetch(x,1)

下面是使用prefetch()函数来优化的一个例子。

void __init__free_pages_bootmem(struct page *page, unsigned int order)

{

unsigned int nr_pages = 1 << order;

struct page *p = page;

unsigned int loop;

prefetchw(p);

for (loop = 0; loop < (nr_pages - 1); loop++, p++) {

prefetchw(p + 1);

__ClearPageReserved(p);