python输出内容,然后用C将其读出

python脚本: a.py

# coding =utf-8
import os,sys,time,glob,traceback,gc,re,string,stringgrep
import time,socket,random,unittest

reload(sys)
sys.setdefaultencoding("utf-8")
os.system("echo 3900/48412 line\(44.7\) Branch\(43.9%\)>out.txt"

C 代码

#include <stdio.h>
#include <stdlib.h>
int main()
{
    char CoverageOut[128] = {0};
    system("python2.7.exe a.py");
    FILE *pFile = fopen("out.txt", "r");
    if (NULL == pFile)
    {
        printf("failed to open out.txt\n");
        return 0;
    }
    fread(CoverageOut, 1024, 1, pFile);
    printf("Coverage Out is %s\n", CoverageOut);
    if (pFile)
    {
        fclose(pFile);
    }
    return 0;
}

alarm 函数的应用

linux代码段

#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
static void sig_alarm(int sigNo)
{
    printf("in sig_alarm, paraIn = %d\n", sigNo);
    system("date");   //注意退出时,打印的时间间隔
    return;
}

int main(void)
{
    signal(SIGALARM, sig_alarm); //注册函数,时间到则调用此函数
    system("data"); //程序启动时,先打印一个基准时间
    printf("alarm(4) = %d\n", alarm(4)); //如果没有下面的sleep(1)和alarm(8)两行代码,则过4秒打印并跳过pause()继续执行
    sleep(1);  //这个时间被统计进alarm()延时中,需要加上sleep值
    alarm(8); //如果同时开启alarm(4) 和alarm(8),则以长的时间为准
    pause();//在C语言中,如果没有alarm()语句,则会一直卡在这里
    printf("print before end ...\n"); // 在9秒之后,继续从pause的地方执行
}
在这个场景中,如果所注册的 sig_alarm函数中,调用了exit(0)函数,则程序提前退出。同样如果同时调用多个alarm()函数,则以时间最长的为准。

最能体现代码执行时序的例子:

#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
#include <signal.h>
void handler() {  printf("hello!\n");
void main()
{
    int i = 0;
    signal(SIGALRM,handler);
    alarm(3);
    for (i = 1; i < 5; i ++)
    { printf("sleep %d ...\n", i); sleep(1);}
}

编译动态链接库,示例项目

a.c:  int a= 1;
b.c:  int b = 1;
c.c : int c = 1;
main.c:
#include <stdio.h>
extern int a;
extern int b;
extern int c;
int main()
{
    printf("a=%d b=%d c=%d\n", a, b, c);
    return 0;
}
第一步:编译动态库
     gcc -shared -fpic a.c b.c c.c
     gcc -shared -fpic -o libprog.so  a.o b.o c.o
   或者将两行合并成一行写
     gcc -shared -fpic a.c b.c c.c -o libprog.so
 第二步,编译可执行文件
    gcc main.c -o main -L./   ./libprog.so  ==>>运行成功
    gcc main.c -o main -L./   libprog.so  ==>>运行失败???
另外,链接关键字 -fpic 换成 -fPIC 同样运行成功,具体原理看过,没完全理解,现在又忘了
其它写法,能编译成功,但是运行失败:
    gcc main.c -o main -L ./ -lprog ==>>多标准的写法,运行不了</stdio.h>

C语言解析CSV的正确打开方式

char *pBuff = NULL;
char fileBuff[4*1024*1024] = {0};
FILE *fp = fopen("./a.csv", "r");
//以字符为单位:1,最多读取4*1024*1024个长度
ret = fread(fileBuff, 1, 4*1024*1024, fp);
pBuff = strtok(fileBuff, "\t");  //将csv copy出来,它是以tab间隔的,所以要以"\t"来分割
pBuff = strtok(fileBuff, ","); //csv原文件是以逗号间隔的,所以要以","来分割
pBuff = strtok(fileBuff, "\r\n"); //csv原文件一般包含多列,最后一列肯定要以换行符来结束
if (pBuff)
{
    strcpy(yourBuff, pBuff);
    printf("yourBuff is : %s\n", yourBuff);
}
else
{  //一般都包含多行,所以需要在一个循环中处理
    break;
}
而且第一个元素需要从总buffer中读取,后续所有的strtok操作,第一个参数都是NULL.

gcc 中的 weak 关键字

1、当没有遇到“强”函数时的效果

aa.c:
#include <stdio.h>
__attribute__((weak)) void fun1(int a)
{
    printf("a=%d\n", a);
}
int main()
{
    fun1(3);
    return 0;
}

此时,执行: gcc aa.c -o a.out ; ./a.out
得到的输出是a=3

2、当遇到“强”函数时,立即失效,被别人代替

bb.c:
#include <stdio.h>
void fun1(int a)
{
    printf("new a=%d\n",a*3);
}

此时执行: gcc aa.c bb.c -o a.out; ./a.out
得到的输出是 new a=9

栈,调试 https://blog.csdn.net/hh012938/article/details/78375458

1、backtrace 
一些内存检测工具如Valgrind,调试工具如GDB,可以查看程序运行时函数调用的堆栈信息,有时候在分析程序时要获得堆栈信息,借助于backtrace是很有帮助的,其原型如下:
#include <execinfo.h>
int backtrace(void **buffer, int size); 
char **backtrace_symbols(void *const *buffer, int size);
void backtrace_symbols_fd(void *const *buffer, int size, int fd);
头文件“execinfo.h”提供了三个相关的函数,简单的说,backtrace函数用于获取堆栈的地址信息, backtrace_symbols函数把堆栈地址翻译成我们易识别的字符串, backtrace_symbols_fd函数则把字符串堆栈信息输出到文件中


backtrace:该函数用于获取当前线程的函数调用堆栈,获取的信息将存放在buffer中,buffer是一个二级指针,可以当作指针数组来用,数组中的元素类型是void*,即从堆栈中获取的返回地址,每一个堆栈框架stack frame有一个返回地址,参数 size 用来指定buffer中可以保存void* 元素的最大值,函数返回值是buffer中实际获取的void*指针个数,最大不超过参数size的大小。 
backtrace_symbols:该函数把从backtrace函数获取的信息buffer转化为一个字符串数组char**,每个字符串包含了相对于buffer中对应元素的可打印信息,包括函数名、函数的偏移地址和实际的返回地址,size指定了该数组中的元素个数,可以是backtrace函数的返回值,也可以小于这个值。需要注意的是,backtrace_symbols的返回值调用了malloc以分配存储空间,为了防止内存泄露,我们要手动调用free来释放这块内存。 
backtrace_symbols_fd:该函数与backtrace_symbols 函数功能类似,不同的是,这个函数直接把结果输出到文件描述符为fd的文件中,且没有调用malloc。 
在使用以上三个函数时,还需要注意一下几点: 
(1)如果使用的是GCC编译链接的话,建议加上“-rdynamic”参数,这个参数的意思是告诉ELF连接器添加“-export-dynamic”标记,这样所有的符号信息symbols就会添加到动态符号表中,以便查看完整的堆栈信息。 
(2)static函数不会导出符号信息symbols,在backtrace中无效。 
(3)某些编译器的优化选项对获取正确的函数调用堆栈有干扰,内联函数没有堆栈框架,删除框架指针也会导致无法正确解析堆栈内容。
下面是一个简单的例子

//backtrace_ex.cpp
#include <stdio.h>
#include <stdlib.h>
#include <execinfo.h> 
void my_backtrace()
{
    void *buffer[100] = { NULL };
    char **trace = NULL;
    int size = backtrace(buffer, 100);
    trace = backtrace_symbols(buffer, size);
    if (NULL == trace) {
        return;
    }
    for (int i = 0; i < size; ++i) {
        printf("%s\n", trace[i]);
    }
    free(trace);
    printf("----------done----------\n");
}
void func2()
{     my_backtrace(); 
} 
void func()
{     func2();
} 
int main()
{     func();     return 0;
}
编译执行上面的文件
g++ backtrace_ex.cpp
./a.out
./a.out() [0x400811]
./a.out() [0x400baf]
./a.out() [0x400bba]
./a.out() [0x400bc5]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf5) [0x7f2473cf5ec5]
./a.out() [0x400709]
----------done----------

咦!堆栈信息虽然打出来了,但是函数调用栈并不是很明确,原因是少了“-rdynamic”参数,重新编译执行如下:
g++ -rdynamic backtrace_ex.cpp
./a.out
./a.out(_Z12my_backtracev+0x44) [0x400b11]
./a.out(_Z5func2v+0x9) [0x400eaf]
./a.out(_Z4funcv+0x9) [0x400eba]
./a.out(main+0x9) [0x400ec5]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf5) [0x7f006bdfbec5]
./a.out() [0x400a09]
----------done----------
加了“-rdynamic”参数后就很好了,我们可以看到函数名称,由于不同的平台、编译器有不同的编译规则,所以用backtrace解析出来的函数名形式是不同的,以“./a.out(_Z4funcv+0x9) [0x400eba]”为例说明,重点在于圆括号中的内容,“_Z”是个函数名开始标识符,后面的“4”表示函数名长度,接着便是真正的函数名“func”,后面的“v”表示函数参数类型为void,随后的“+0x9”是偏移地址。虽然有一定的编译规则,但可读性还不是很好,我们可以用下面介绍的方法demangle来解析这些符号

2、demangle 
demangle即符号重组,函数原型如下:
#include <cxxabi.h>
char* __cxa_demangle(const char* __mangled_name,
                     char* __output_buffer,
                     size_t* __length,
                     int* __status);

cxxabi.h是一个C++函数运行时库,要用g++编译链接,gcc会有问题。__mangled_name即原符号信息,是个字符串,以空字符结尾,__output_buffer用来保存符号重组后的信息,长度为__length,__status表示demangle结果,为0时表示成功,返回值指向符号重组后的字符串首地址,字符串以空字符结尾。 
我们使用demangle来改进上面的例子:(把my_backtrace替换为my_backtrace2)
void my_backtrace2()
{
    void *buffer[100] = { NULL };
    char **trace = NULL;
    int size = backtrace(buffer, 100);
    trace = backtrace_symbols(buffer, size);
    if (NULL == trace) {
        return;
    }
    size_t name_size = 100;
    char *name = (char*)malloc(name_size);
    for (int i = 0; i < size; ++i) {
        char *begin_name = 0;
        char *begin_offset = 0;
        char *end_offset = 0;
        for (char *p = trace[i]; *p; ++p) { // 利用了符号信息的格式
            if (*p == '(') { // 左括号
                begin_name = p;
            }
            else if (*p == '+' && begin_name) { // 地址偏移符号
                begin_offset = p;
            }
            else if (*p == ')' && begin_offset) { // 右括号
                end_offset = p;
                break;
            }
        }
        if (begin_name && begin_offset && end_offset ) {
            *begin_name++ = '\0';
            *begin_offset++ = '\0';
            *end_offset = '\0';
            int status = -4; // 0 -1 -2 -3
            char *ret = abi::__cxa_demangle(begin_name, name, &name_size, &status);
            if (0 == status) {
                name = ret;
                printf("%s:%s+%s\n", trace[i], name, begin_offset);
            }
            else {
                printf("%s:%s()+%s\n", trace[i], begin_name, begin_offset);
            }
        }
        else {
            printf("%s\n", trace[i]);
        }
    }
    free(name);
    free(trace);
    printf("----------done----------\n");
}
结果如下:
g++ -rdynamic backtrace_ex.cpp
./a.out
./a.out:my_backtrace2()+0x44
./a.out:func2()+0x9
./a.out:func()+0x9
./a.out:main()+0x9
/lib/x86_64-linux-gnu/libc.so.6:__libc_start_main()+0xf5
./a.out() [0x400a09]
----------done----------
可以看出来,demangle后函数名已清晰地显示出来了,没有那些奇奇怪怪的符号了。

C 语言正则表达式

1、先上一段代码

#include <stdio.h>
#include <sys/types.h>
#include <regex.h>
#include <memory.h>
#include <stdlib.h>

int main(){
    char *bematch = "hhhericchd@gmail.com";
    char *pattern = "h{3,10}(.*)@.{5}.(.*)";
    char errbuf[1024];
    char match[100];
    regex_t reg;
    int err,nm = 10;
    regmatch_t pmatch[nm];

    if(regcomp(®,pattern,REG_EXTENDED) < 0){
        regerror(err,®,errbuf,sizeof(errbuf));
        printf("err:%s\n",errbuf);
    }

    err = regexec(®,bematch,nm,pmatch,0);

    if (err == REG_NOMATCH){
        printf("no match\n");
            exit(-1);
    }
    else if(err) {
        regerror(err,®,errbuf,sizeof(errbuf));
        printf("err:%s\n",errbuf);
        exit(-1);
    }

    for(int i=0;i<10 && pmatch[i].rm_so!=-1;i++) {
        int len = pmatch[i].rm_eo-pmatch[i].rm_so;
        if(len) {
            memset(match,'\0',sizeof(match));
            memcpy(match,bematch+pmatch[i].rm_so,len);
            printf("%s\n",match);
        }
    }
    return 0;
}

2、编译运行效果

[Administrator.WINDOWS-LGJ801D] ➤ gcc regExp.c -o ppc
[Administrator.WINDOWS-LGJ801D] ➤ ./ppc
hhhericchd@gmail.com
ericchd
com

3、代码理解及验证

A、重复字符匹配

char *pattern = "h{3,10}(.*)@.{5}.(.*)";
显然是核心,这是一个正则表达式语法.
h{3,10} ==>>表示至少有三个'h'重复,最多10个,以此为开始标记,第11个'h'将被看作普通字符

将 char *bematch = "hhhericchd@gmail.com"; 改为两个'h'开头:"hhericchd@gmail.com"
重新编译运行:
[Administrator.WINDOWS-LGJ801D] ➤ gcc regExp.c -o ppc && ./ppc.exe
no match


再改为5个'h'开头"hhhhhericchd@gmail.com":
[Administrator.WINDOWS-LGJ801D] ➤ gcc regExp.c -o ppc && ./ppc.exe
hhhhhericchd@gmail.com
ericchd
com

再改为10个以上连续'h'开头:"hhhhhhhhhhhhhhhhericchd@gmail.com"
[Administrator.WINDOWS-LGJ801D] ➤ gcc regExp.c -o ppc && ./ppc
hhhhhhhhhhhhhhhhericchd@gmail.com
hhhhhhericchd
com

B、指定个数字符,不作为匹配输出

显然,输出中 ".gmail." 被 ".{5}." 取代

C、输出匹配的内容规则

[0] 表示全匹配字符串
[1] 表示第一个 "(.*)" 匹配成功的内容
[2] 表示第二个 "(.*)" 匹配成功的内容
"尤其注意:
    必须用括号括起来的,才能作为子匹配项。
"

但是有一个神奇的事情,空格的字符串长度竟然为0

D、加戏,增加多场景匹配

一个神奇的事情,空格的字符串长度竟然为0
    char *bematch  = "hhhhhhhhhhhhhhhhericchd@gmail.com";
    char *bematch2 = "hhhhhhhhhhhericchd @gmail.com";
    char *bematch3 = "hhhhhhericchd  @gmail.com";
    char *pattern = "h{3,10}(.*)([ ]*)@.{5}.(.*)";
想要匹配'@'、' @'、'  @'即任意空格和'@'连接的情况,第三个将输出也改一下:
    for(int i=0;i<10 && pmatch[i].rm_so!=-1;i++) {
        int len = pmatch[i].rm_eo-pmatch[i].rm_so;
//        if(len) {
            memset(match,'\0',sizeof(match));
            memcpy(match,bematch+pmatch[i].rm_so,len);
            printf( "match %d: %s\n",i , match);
//        }
    }
则编译运行效果如下:

[Administrator.WINDOWS-LGJ801D] ➤ gcc regExp.c -o ppc && ./ppc
match 0: hhhhhhhhhhhhhhhhericchd@gmail.com
match 1: hhhhhhericchd
match 3: com
match 0: hhhhhhhhhhhhhhhhericchd@gmail
match 1: hhhhhheri
match 3: ail
match 0: hhhhhhhhhhhhhhhhericchd@g
match 1: hhhhhhhhh
match 2:
match 3: d@g

4、在经历了一段时间项目经验后,认识更全面,经验更老道一点

1、排除空格,高风险地方

比如有如下脚本:
  [root]$ ssh 127.0.0.1 -l userName -p 2222
要提取出 `ip / userName / 2222`这三个关键字,可以这样写
char *pattern = "ssh[ ]{1,}(.*)[ ]{1,}-l[ ]{1,}(.*)[ ]{1,}-p[ ]{1,}(.*)[ ]{0,}";
讲解:[ ]{1,} ==>> 表示它后面至少有一个空格,可能有多个
     (.*)    ==>> 是最终
     [ ]{0,} ==>> 最后的一个,是为了清除空格,不被(.*)匹配上
     但是这种写法有缺陷,某些时候,不知道为什么最后的空格没有清除掉,被匹配进最后一个项里面

改进写法:
   char *pattern = "ssh[ ]{1,}([^ ]+)[ ]{1,}-l[ ]{1,}(.*)[ ]{1,}-p[ ]{1,}([^ ]+)";
讲解:用 `([^ ]+)` 代替`(.*)`,可完美避开空格,尤其是最后一项,可以不用考虑末尾的空格影响

带上小括号的,就是将被匹配上的内容,唯一例外就是全字符,就是如果匹配
成功,全字符将被告放入匹配数组 match[0],其它依次放入
match[1]/match[2]

2、开关匹配情况

如:
  [root]$ status on
  [root]$ status off
两种情况都应该被匹配上,正确写法是
char *pattern = "status[ ]{1,}(on|off)[ ]{0,}";
这样 match[0]为全字符,match[1]为 on 或者 off

5、其它人的总结,如下内容不全正确,可以批判接受

字 符 意 义 示 例
* 任意长度的字符串。 a* 表示: 空字符串、aaaa、a…
? 长度为0或者1的字符串。 a? 表示: 空字符串和a。
+ 长度为一个或者多个的字符串。 a+表示:a、aa、aaaaaa…
. 任意字符。 a. 表示:a后跟任意字符。
{} 代表上一规则重复数目
{1,1,s}包含一组匹配花括号,里面有两个数字和一个字符,表示在指定次数范围内找到字符。 
a{3}表示:三个a、
a{1,3}表示:一个到三个a、
a{3,} 表示:大于等于三个a、
{3,7,a}表示在3到7次重复范围内匹配字符a。
[] 集合,代表方括号中任意一个字符。 
[ab] 表示:a或者b都可以
[a-z] 表示:从a到z的字符。
() 组,代表一组字符。 (ab){2}表示:abab。
a/b 同时满足。 a/b表示:字符串a后跟字符串b才能满足要求。
a|b 并列,代表符合a或者符合b都可以,this|that表示: 字符串this或者字符串that都满足要求。
^ 如果放在开头表示代表该规则必须在字符串的开头,其他位置代表字符本身。
  如果放在[]中的开头表示对该集合取反,其他位置代表字符本身。
^a表示:a必须在字符串的开头
[^a]表示:除了a以外的其他字符。
$ 如果放在最后表示该规则必须放在最后,其他位置代表字符本身。 a$表示:a必须在字符串最后。
/:s 正则表达式用 /:s 表示空格。 a/:sb 匹配 a b。
  ==>>根据本人实践,/:s代表空格失败,直接采用[ ]表示空格是成功的
/:a 正则表达式用 /:a 表示字符与数字。 a/:a 匹配 ab、a6 等。
/:c 正则表达式用 /:c 仅表示字符。 a/:c 匹配 ac等,不匹配a1等。
/:p 正则表达式用 /:p 表示可打印字符。
/:D 正则表达式用 /:d 仅表示数字。 a/:c 匹配 a1等,不匹配ac等。
/:x00 正则表达式用 /:x00 表示ASCII字符。
/:r 正则表达式用 /:r 表示回车。
/:N 正则表达式用 /:d 表示换行。

C/C++ 中的单子节对齐问题

有两种方式:
1、pragma
2、__attribute__((packed))
一般为了阅读方便,代码美观,会这样处理:
#define MPACK __attribute__((packed))
typedef struct
{
    char c;
    int i;
}MPACK myStruct;
  这样就实现了单子节对齐

编译静态库和动态库

编译静态库

#正常情况下,就直接将 object 文件链接一起编译生成可执行程序就行了
gcc -c funTest.c
gcc -o testMain testMain.c funTest.o //库文件形式下
gcc -c funTest.c //编译生成funa.o
ar -rsv libfunTest.a funTest.o //ar指令, 编译生成静态库文件
gcc -o testMain testMain.c -L./ -lfunTest //链接静态库文件,生成可执行文件

动态链接库的编译与使用

// 动态库编译生成
gcc -o libtest.so -fPIC -shared funa.c
gcc -o testMain testMain.c ./libtest.so //直接指定动态库位置

C 语言彩色打印

彩色定义

#define NONE "\033[m"
#define RED "\033[0;32;31m"
#define LIGHT_RED "\033[1;31m"
#define GREEN "\033[0;32;32m"
#define LIGHT_GREEN "\033[1;32m"
#define BLUE "\033[0;32;34m"
#define LIGHT_BLUE "\033[1;34m"
#define DARY_GRAY "\033[1;30m"
#define CYAN "\033[0;36m"
#define LIGHT_CYAN "\033[1;36m"
#define PURPLE "\033[0;35m"
#define LIGHT_PURPLE "\033[1;35m"
#define BROWN "\033[0;33m"
#define YELLOW "\033[1;33m"
#define LIGHT_GRAY "\033[0;37m"
#define WHITE "\033[1;37m"

简单应用示例

#include <stdio.h>
#define RED    "\033[0;32;31m"
#define NONE   "\033[m"
#define YELLOW "\033[1;33m"
int main()
{
    printf(RED" the red!\n"NONE);
    printf(YELLOW" the yello!\n"NONE);
    return 0;
}

对 printf 参数进行封装

printf(YELLOW" he is %d years old!\n"NONE, 99);

用法用法:
char buff[512]={0};
sprintf(buff,"this is a print content,num=%d", 99);
colorPrint(YELLOW, buff);

最后封装

typedef enum {
    eRED,
    eLIGHT_RED,
    ...
    eLIGHT_GRAY,
    eWHITE,
}eColor;
int colorPrint(eColor color, const char *format, ...)
{
    char content[512 + 1] = {0};
    va_list argptr;
    memset((char *)&argptr, 0, sizeof(va_list));
    va_start(argptr, format);
    vsnprintf(content, 512, format, argptr);
    va_end(argptr);
    if (eRED == color)
    {
        printf(RED "%s" END, content);
    }
    else if(eLIGHT_RED == color)
    {
        printf(LIGHT_RED "%s" END, content);
    }
    ...
    else if (eWHITE == color)
    {
        printf(WHITE "%s" END, content);
    }
    else
    {
        printf("%s", content);
    }
    return 0;
}
用法:
colorPrint(eRED, "myname:%s,age:%d",name, 99);

怎样输出百分号:‘%’

int main()
{
    printf("%%%s%%\n","xx");
    return 0;
}

C 语言中调用shell语句(linux C)

1、亲自编写的代码

#define ERROR_CODE (1<<8)
void test()
{
    char cmdBuff[512] = {0};
    sprintf(cmdBuff, "grep -rni %d ${PWD%%KEY*}/KEY/file.c || exit 1");
    if (ERROR_CODE ==system(cmdBuf))
    {
        return 1;
    }
    return 0;
}

int ret =  system("exit 1");
则 ret=(1<<8),0x100,256

int ret =  system("exit 2");
则 ret=(2<<8),0x200,512

int ret =  system("exit 3");
则 ret=(1<<8),0x300,768

但是126、127有特殊用途,一般不返回这两个值

2、转链接

https://blog.csdn.net/linluan33/article/details/8097916

编程小技巧:二进制的使用,尤其适合做标准

int parse(int paraIn)
{
  switch(paraIn)
  {
      case 0b0001:
          break;
      case 0b0010:
          break;
      case 0b1011:
          break;
      default:
          break;
  }
    return 0;
}
    备案/许可证编号为:沪ICP备20016505号