《C陷阱与缺陷》——第三章(语义陷阱)

x33g5p2x  于2021-11-21 转载在 其他  
字(2.9k)|赞(0)|评价(0)|浏览(221)

一、指针与数组

C语言中数组值得注意的地方有以下两点:
1.C语言中只有一维数组,而且数组的大小必须在编译期就作为一个常数确定下来。然而,C语言中数组的元素可以是任何类型的对象,当然也可以是一个数组。这样,”仿真“出一个多维数组就不是一件难事。
(注:C99标准允许变长数组(VLA)。GCC编译器中实现了变长数组,但细节与C99标准不完全一致。)
2.对于一个数组,我们只能够做两件事:确定数组大小,以及获得指向该数组下标为0的元素的指针。其他有关数组的操作,实际上都是通过指针进行的。

给指针加上一个整数,如p+1,则p指向下一内存中的数据,而给指针的二进制表示(指针指向的地址)加上同样的整数,实际上是将p指向的地址+1,效果不一样。

如果两个指针指向的是同一个数组中的元素,我们可以把这两个指针相减。若两个指针指向的是不同数组中的元素,即使它们指向的地址在内存中位置正好间隔一个数组元素的整数倍,所得的结果仍然无法保证其正确性。

数组命除了被用作sizeof的参数这一情况外,其他所有情况下数组命都代表指向数组a中下标为0的元素的指针。

二维数组遍历代码如下:

int i[12][31];
  int (*p)[31];

for (p = i; p < &i[12]; p++)
{
    int *dp;
    for(dp = *p; dp < &(*p)[31]; dp++)
    {
        *dp = 0;
    }
}

二、非数组指针

在使用内存分配函数(malloc)的时候,需要注意的是,如果分配字符串空间,一定要注意’\0’字符,该字符在使用strlen函数求字符串长度的时候会被忽略。使用malloc函数对应的内存用完要使用free函数释放内存。
示例代码如下:

char *r;
  char s[] = "Hello";
  char t[] = "World!";

  r = malloc(strlen(s) + strlen(t) + 1);

if (r != NULL)
{
    strcpy(r, s);
    strcat(r, t);
}
   printf("%s\n", r );
   free(r);

三、作为参数的数组声明

C语言会自动将作为参数的数组声明转换为相应的指针声明。
例子1:

int strlen(char s[])
{
}

与下面的写法完全相同

int strlen(char* s)
{
}

指针并不是所有情况下都指向数组首地址。
例子2:

extern char* hello;

extern char hello[];

前者只声明了一个字符型指针,而后者声明了字符数组,二者代表的概念不一样。

四、避免“举隅法”

”举隅法“是文学修辞上的手段,以隐喻表示代指物与被指物的相互关系。《牛津英语词典》对”举隅法“(synecdoche)的解释是:以含义更宽泛的词语来代替含义相对较窄的词语,或者相反。

C语言中的一个常见陷阱:混淆指针与指针所指向的数据。
复制指针并不同时复制指针所指向的数据,它们指向的空间相同,而两个数组才指向的是两块不同的空间。

五、空指针并非空字符串

C语言中将一个整数转换为一个指针,最后得到的结果取决于具体的C编译器实现。存在一个特殊情况0,编译器保证由0转换而来的指针不等于任何有效指针。不能使用空指针所指向的内存中存储的内容。

char *p;
// p = (char*)3;
// p = NULL;
    p = (char*)0;
    printf("%s\n", p);  //未定义行为
// printf("%d\n", p); //打印出具体数字

六、边界计算与不对称边界

此处存在”栏杆错误“,也常被称为”差一错误“(off-by-one error)
避免”差一错误“的两个通用原则:
1.首先考虑最简单情况下的特例,然后将得到的结果外推
2.仔细计算边界,绝不掉以轻心

例子1:

static char buffer[N];
static char *bufptr;
char* clearbuffer(char* source);
void bufferwrite(char* source, int len)
{
    char* data = source;

    while (len > 0)
    {
// if (N - (&buffer[N] - bufptr) < N)
// {
// *bufptr++ = *data++;
// len--;
// }
// else
// {
// bufptr = clearbuffer(buffer);
// }
        if (bufptr == &buffer[N])
        {
            int l = sizeof(buffer);
            bufptr = clearbuffer(buffer);
        }
        else
        {
            int k, rem;
            rem = N - (bufptr - buffer);
            k = len > rem? rem:len;
            memcpy(bufptr, data, k);
            bufptr += k;
            data += k;
            len -= k;
        }
    }
}
char* clearbuffer(char* source)
{
    memset(source, 0, N);
    return source;
}

七、求值顺序

C语言中只有”&&“、”||“、”? :“、”,“四个运算符,存在规定的求值顺序。
”&&“运算符和”||“运算符首先对左操作数求值,只在需要时才对右操作数求值。

运算符”? :“有三个操作数:在a?b:c中,操作数a首先被求值,根据a的值再求操作数b或者操作数c的值。

逗号操作符首先对左操作符求值,然后该值被”丢弃“,再对右操作数求值。
(注:分隔函数参数的逗号并非逗号运算符。例如,x和y在函数f(x,y)中的求值顺序是未定义的,而在函数g((x,y))中是确定的,先求x后求y。在后一个例子中,函数g只有一个参数,这个参数的值是这样求到的,先求x的值,然后x的值被”抛弃“,接着求y的值。)

C语言中其他所有运算符对其操作数求值的顺序是未定义的,特别地,赋值运算符并不保证任何求值顺序。

八、运算符&& || 和!

C语言中有两类逻辑运算符,某些时候可以互换:按位运算符& |和~。以及逻辑运算符&& ||和!。
逻辑运算符&&和||在左侧操作数的值能够确定最终结果时根本不会对右侧操作数求值。运算符&左右两边的操作数都必须被求值。

九、整数溢出

C语言中存在两类整数运算,有符号运算与无符号运算。在无符号运算中,没有所谓的”溢出“一说。所有无符号运算都是以2的n次方为模,这里n是结果中的位数。如果超出表示范围,则从0开始继续运算。
如果算术运算符的一个操作数是有符号整数,另一个操作数是无符号整数,那么有符号整数会被转换成无符号整数,”溢出“也不可能发生。
当两个操作数都是有符号整数时,”溢出“就有可能发生,而且”溢出“的结果是未定义的。

十、为函数main提供返回值

函数如果未显示声明返回类型,那么函数返回类型的默认类型是整型。
main函数的返回值在不使用的情况下无关紧要,如果返回值表示函数是否执行成功,则需要明确具体的返回值,不能不写返回值,否则有可能系统会判断函数执行失败。

相关文章