libcurl教程（转） - suiyingjie

/**  *	@brief libcurl接收到数据时的回调函数  *  *	将接收到的数据保存到本地文件中，同时显示在控制台上。  *
 *	@param [in] buffer 接收到的数据所在缓冲区
 *	@param [in] size 数据长度
 *	@param [in] nmemb 数据片数量
 *	@param [in/out] 用户自定义指针
 *	@return 获取的数据长度
 */ 
size_t process_data(void *buffer, size_t size, size_t nmemb, void *user_p) { 	FILE *fp = (FILE *)user_p; 	size_t return_size = fwrite(buffer, size, nmemb, fp); 	cout << (char *)buffer << endl;

	return return_size; }
 
 int main(int argc, char **argv) { 	// 初始化libcurl 	CURLcode return_code; 	return_code = curl_global_init(CURL_GLOBAL_WIN32); 	if (CURLE_OK != return_code) 	{ 		cerr << "init libcurl failed." << endl; 		return -1; 	}

 	// 获取easy handle 	CURL *easy_handle = curl_easy_init();
	if (NULL == easy_handle)
	{
		cerr << "get a easy handle failed." << endl;
                  curl_global_cleanup();

		return -1;
	}
 	FILE *fp = fopen("data.html", "ab+");	//  	// 设置easy handle属性 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://blog.csdn.net/JGood);
	curl_easy_setopt(easy_handle, CURLOPT_WRITEFUNCTION, &process_data);
	curl_easy_setopt(easy_handle, CURLOPT_WRITEDATA, fp);

 	// 执行数据请求 	curl_easy_perform(easy_handle);	
 	// 释放资源 
	fclose(fp);
	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0;
}

多线程问题

首先一个基本原则就是：绝对不应该在线程之间共享同一个libcurl handle，不管是easy handle还是multi handle（将在下文中介绍）。一个线程每次只能使用一个handle。

libcurl是线程安全的，但有两点例外：信号(signals)和SSL/TLS handler。信号用于超时失效名字解析(timing out name resolves)。libcurl依赖其他的库来支持SSL/STL，所以用多线程的方式访问HTTPS或FTPS的URL时，应该满足这些库对多线程操作的一些要求。详细可以参考：

OpenSSL: http://www.openssl.org/docs/crypto/threads.html#DESCRIPTION

GnuTLS: http://www.gnu.org/software/gnutls/manual/html_node/Multi_002dthreaded-applications.html

NSS: 宣称是多线程安全的。

什么时候libcurl无法正常工作

传输失败总是有原因的。你可能错误的设置了一些libcurl的属性或者没有正确的理解某些属性的含义，或者是远程主机返回一些无法被正确解析的内容。

这里有一个黄金法则来处理这些问题：将CURLOPT_VERBOSE属性设置为1，libcurl会输出通信过程中的一些细节。如果使用的是http协议，请求头/响应头也会被输出。将CURLOPT_HEADER设为1，这些头信息将出现在消息的内容中。

当然不可否认的是，libcurl还存在bug。当你在使用libcurl的过程中发现bug时，希望能够提交给我们，好让我们能够修复这些bug。你在提交bug时，请同时提供详细的信息：通过CURLOPT_VERBOSE属性跟踪到的协议信息、libcurl版本、libcurl的客户代码、操作系统名称、版本、编译器名称、版本等等。

如果你对相关的协议了解越多，在使用libcurl时，就越不容易犯错。

上传数据到远程站点

libcurl提供协议无关的方式进行数据传输。所以上传一个文件到FTP服务器，跟向HTTP服务器提交一个PUT请求的操作方式是类似的：

1. 创建easy handle或者重用先前创建的easy handle。

2. 设置CURLOPT_URL属性。

3. 编写回调函数。在执行上传的时候，libcurl通过回调函数读取要上传的数据。（如果要从远程服务器下载数据，可以通过回调来保存接收到的数据。）回调函数的原型如下：

size_t function(char *bufptr, size_t size, size_t nitems, void *userp);

bufptr指针表示缓冲区，用于保存要上传的数据，size * nitems是缓冲区数据的长度，userp是一个用户自定义指针，libcurl不对该指针作任何操作，它只是简单的传递该指针。可以使用该指针在应用程序与libcurl之间传递信息。

4. 注册回调函数，设置自定义指针。语法如下：

// 注册回调函数 curl_easy_setopt(easy_handle, CURLOPT_READFUNCTION, read_function);  // 设置自定义指针 curl_easy_setopt(easy_handle, CURLOPT_READDATA, &filedata);

5. 告诉libcurl，执行的是上传操作。

curl_easy_setopt(easy_handle, CURLOPT_UPLOAD, 1L);

有些协议在没有预先知道上传文件大小的情况下，可能无法正确判断上传是否结束，所以最好预先使用CURLOPT_INFILESIZE_LARGE属性：告诉它要上传文件的大小：

/* in this example, file_size must be an curl_off_t variable */ curl_easy_setopt(easy_handle, CURLOPT_INFILESIZE_LARGE, file_size);

6. 调用curl_easy_perform。

接下来，libcurl将会完成剩下的所有工作。在上传文件过程中，libcurl会不断调用先前设置的回调函数，用于将要上传的数据读入到缓冲区，并执行上传。

下面的例子演示如何将文件上传到FTP服务器。笔者使用的是IIS自带的FTP服务，同时在FTP上设置了可写权限。

/**
 *	@brief 读取数据的回调。
 */ size_t read_data(void *buffer, size_t size, size_t nmemb, void *user_p) { 	return fread(buffer, size, nmemb, (FILE *)user_p); } 
 int main(int argc, char **argv) { 	// 初始化libcurl 	CURLcode code;
	code = curl_global_init(CURL_GLOBAL_WIN32); 	if (code != CURLE_OK) 	{ 		cerr << "init libcurl failed." << endl; 		return -1; 	} 
 	FILE *fp = fopen("a.html", "rb"); 	if (NULL == fp) 	{
		cout << "can't open file." << endl; 		curl_global_cleanup(); 		return -1; 	}

 	// 获取文件大小 	fseek(fp, 0, 2);
	int file_size = ftell(fp); 	rewind(fp); 
 	// 获取easy handle 
	CURL *easy_handle = NULL; 	easy_handle = curl_easy_init(); 	if (NULL == easy_handle) 	{ 		cerr << "get a easy handle failed." << endl; 		fclose(fp); 		curl_global_cleanup(); 		return -1;
	}

 	// 设置eash handle属性 	curl_easy_setopt(easy_handle, CURLOPT_URL, ftp://127.0.0.1/upload.html); 	curl_easy_setopt(easy_handle, CURLOPT_UPLOAD, 1L); 	curl_easy_setopt(easy_handle, CURLOPT_READFUNCTION, &read_data); 	curl_easy_setopt(easy_handle, CURLOPT_READDATA, fp); 	curl_easy_setopt(easy_handle, CURLOPT_INFILESIZE_LARGE, file_size); 
 	// 执行上传操作 	code = curl_easy_perform(easy_handle); 	if (code == CURLE_OK) 	{ 		cout << "upload successfully." << endl; 	}

 	// 释放资源 	fclose(fp);
	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0; }

关于密码

客户端向服务器发送请求时，许多协议都要求提供用户名与密码。libcurl提供了多种方式来设置它们。

一些协议支持在URL中直接指定用户名和密码，类似于： protocol://user:[email protected]/path/。libcurl能正确的识别这种URL中的用户名与密码并执行相应的操作。如果你提供的用户名和密码中有特殊字符，首先应该对其进行URL编码。

也可以通过CURLOPT_USERPWD属性来设置用户名与密码。参数是格式如 “user:password ”的字符串：

curl_easy_setopt(easy_handle, CURLOPT_USERPWD, "user_name:password");

（下面这几段文字我理解地模模糊糊）有时候在访问代理服务器的时候，可能时时要求提供用户名和密码进行用户身份验证。这种情况下，libcurl提供了另一个属性CURLOPT_PROXYUSERPWD：

curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD, "user_name:password");

在UNIX平台下，访问FTP的用户名和密码可能会被保存在$HOME/.netrc文件中。libcurl支持直接从这个文件中获取用户名与密码：

curl_easy_setopt(easy_handle, CURLOPT_NETRC, 1L);

在使用SSL时，可能需要提供一个私钥用于数据安全传输，通过CURLOPT_KEYPASSWD来设置私钥：

curl_easy_setopt(easy_handle, CURLOPT_KEYPASSWD, "keypassword");

HTTP验证

上一章介绍了如何在libcurl中，对需要身份验证的URL设置用户名与密码。在使用HTTP协议时，客户端有很多种方式向服务器提供验证信息。默认的HTTP验证方法是"Basic”，它将用户名与密码以明文的方式、经Base64编码后保存在HTTP请求头中，发往服务器。当然这不太安全。

当前版本的libcurl支持的验证方法有：basic, Digest, NTLM, Negotiate, GSS-Negotiate and SPNEGO。（译者感叹：搞Web这么多年，尽然不知道这些Http的验证方式，实在惭愧。）可以通过CURLOPT_HTTPAUTH属性来设置具体的验证方式：

curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH, CURLAUTH_DIGEST);

向代理服务器发送验证信息时，可以通过CURLOPT_PROXYAUTH设置验证方式：

curl_easy_setopt(easy_handle, CURLOPT_PROXYAUTH, CURLAUTH_NTLM);

也可以同时设置多种验证方式（通过按位与），使用‘CURLAUTH_ANY‘将允许libcurl可以选择任何它所支持的验证方式。通过CURLOPT_HTTPAUTH或CURLOPT_PROXYAUTH属性设置的多种验证方式，libcurl会在运行时选择一种它认为是最好的方式与服务器通信：

curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,  CURLAUTH_DIGEST|CURLAUTH_BASIC); 
// curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,  CURLAUTH_ANY);

HTTP Post

这一章介绍如何使用libcurl以Post方式向HTTP服务器提交数据。

方法一，也是最简单的方式，就像html中使用<form>标签提交数据一样，只需向libcurl提供一个包含数据的字符串即可。下面是笔者学习过程中的一个demo程序：

int main(int argc, char **argv) { 	code = curl_global_init(CURL_GLOBAL_WIN32); 	CURL *easy_handle = curl_easy_init(); 
 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx); 	// 单个域post 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDS, "name=jgood&address=hangzhou");
	code = curl_easy_perform(easy_handle);
 	curl_easy_cleanup(easy_handle);
	curl_global_cleanup();

 	return 0; }

在asp.net Web服务器上跟踪调试，得到客户程序提交上来的数据，下面是截图：

上面的代码够简单吧~_~ 有时候，我们需要提交一些二进制数据到HTTP服务器，使用方法一就不行了，因为方法一中实际提交的是一个字符串，字符串遇到/0就表示结束了。所以在上传二进制数据的时候，必须明确的告诉libcurl要提交的数据的长度。在上传二进制数据的时候，还应该设置提交的Content-Type头信息。下面的示例代码：

int main(int argc, char **argv) { 	curl_global_init(CURL_GLOBAL_WIN32);
	CURL *easy_handle = curl_easy_init();

 	// 上传二进制数据 	char data[] = { 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 0 }; 	curl_slist *http_headers = NULL; 	http_headers = curl_slist_append(http_headers, "Content-Type: text/xml");
 	curl_easy_setopt(easy_handle, CURLOPT_HTTPHEADER, http_headers);
	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx); 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDS, data); 	curl_easy_setopt(easy_handle, CURLOPT_POSTFIELDSIZE, sizeof(data)); 
 	curl_easy_perform(easy_handle); 
 	curl_slist_free_all(http_headers); 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup();

 	return 0; }

在asp.net Web服务器上跟踪调试，得到客户程序提交上来的二进制数据，下面是截图：

上面介绍的两种方式，可以完成大部分的HTTP POST操作。但上面的两种方式都不支持multi-part formposts。Multi-part formposts被认为是提交二进制数据(或大量数据)的更好方法，可以在RFC1867, RFC2388中找到他们的定义。何为Multi-part？其实，就我理解，就是在Post提交的时候，有不同的数据单元，每个单元有自己的名称与内容，内容可以是文本的，也可以是二进制的。同时，每个数据单元都可以有自己的消息头，MIME类型，这些数据单元组成一个链表，提交到HTTP服务器。libcurl提供了方便的api用于支持multi-part formposts。使用curl_formadd函数，可以添加不同的数据数据单元，然后提交到服务器。下面是一个multi-part formposts的例子（更详细的使用，请参考： http://curl.haxx.se/libcurl/c/curl_formadd.html ）：

int main() {

curl_global_init(CURL_GLOBAL_WIN32);
CURL *easy_handle = curl_easy_init();

	// 使用multi-parts form post 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx);
	curl_httppost *post = NULL;
	curl_httppost *last = NULL;	
 	// 文本数据 	curl_formadd(&post, &last, CURLFORM_COPYNAME, "name", CURLFORM_COPYCONTENTS, "JGood", CURLFORM_END);
	curl_formadd(&post, &last, CURLFORM_COPYNAME, "address", CURLFORM_COPYCONTENTS, "HangZhou", CURLFORM_END);
 	// 文本文件中的数据 	curl_formadd(&post, &last, CURLFORM_COPYNAME, "file", CURLFORM_FILECONTENT, "ReadMe.txt", CURLFORM_END); 	curl_easy_setopt(easy_handle, CURLOPT_HTTPPOST, post); 	curl_easy_perform(easy_handle);
 	curl_formfree(post); 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup(); 
 	return 0; }

最后要说明的是，所有在easy handle上设置的属性都是”sticky”的，什么意思？就是说在easy handle上设置的属性都将被保存，即使执行完curl_easy_perform之后，这些属性值仍然存在。通过将CURLOPT_HTTPGET设为1可以使easy handle回到最原始的状态：

curl_easy_setopt(easy_handle, CURLOPT_HTTPGET, 1L);

显示进度

libcurl支持通信过程中的进度控制。通过将CURLOPT_NOPROCESS设置为0开启进度支持。该选项默认值为1。对大多数应用程序，我们需要提供一个进度显示回调。libcurl会不定期的将当前传输的进度通过回调函数告诉你的程序。回调函数的原型如下：

int progress_callback(void *clientp, double dltotal, double dlnow, double ultotal, double ulnow);

通过CURLOPT_PROGRESSFUNCTION注册该回调函数。参数clientp是一个用户自定义指针，应用程序通过CURLOPT_PROCESSDATA属性将该自定义指定传递给libcurl。libcurl对该参数不作任何处理，只是简单将其传递给回调函数。

在C++中使用libcurl

在C++中使用libcurl跟在C语言中没有任何区别，只有一个地方要注意：回调函数不能是类的非静态成员函数。例如：

class AClass {       static size_t write_data(void *ptr, size_t size, size_t nmemb, void *ourpointer)       {         /* do what you want with the data */      }  }

代理

什么是代理？Merrian-Webster的解释是：一个通过验证的用户扮演另一个用户。今天，代理已经被广泛的使用。许多公司提供网络代理服务器，允许员工的网络客户端访问、下载文件。代理服务器处理这些用户的请求。

libcurl支持SOCKS和HTTP代理。使用代理，libcurl会把用户输入的URL提交给代理服务器，而不是直接根据URL去访问远程资源。

当前版本的libcurl并不支持SOCKS代理的所有功能。

对于HTTP代理来说，即使请求的URL不是一个合法的HTTP URL（比方你提供了一个ftp的url），它仍然会先被提交到HTTP代理。

代理选项

CURLOPT_PROXY属性用于设置libcurl使用的代理服务器地址：

curl_easy_setopt(easy_handle, CURLOPT_PROXY, "proxy-host.com:8080");

可以把主机名与端口号分开设置：

curl_easy_setopt(easy_handle, CURLOPT_PROXY, "proxy-host.com");  curl_easy_setopt(easy_handle, CURLOPT_PROXYPORT, "8080");  // 端口号是用字符串还是整数？？

有些代理服务器要求用户通过验证之后才允许接受其请求，此时应该先提供验证信息：

curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD, "user:password");

还要告诉libcurl使用的代理类型（如果没有提供，libcurl会认为是HTTP代理）：

curl_easy_setopt(easy_handle, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS4);

环境变量

对于有些协议，libcurl会自动检测并使用一些环境变量，并根据这些环境变量来确定要使用的代理服务器。这些环境变量的名称格式一般是"[protocol]_proxy"（注意小写）。例如输入一个HTTP的URL，那么名称为"http_proxy"的环境变量就会被检测是否存在，如果存在，libcurl会使用该环境变量指定的代理。相同的规则也适用于FTP。

这些环境变量的值的格式必须是这样的："[protocol://][user:password@]machine[:port]"。libcurl会忽略掉[protocol://]，如果没有提供端口号，libcurl使用该协议的默认端口。

有两个比较特殊的环境变量：'all_proxy'与'no_proxy'。如果一个URL所对应的协议，它的环境变量没有设置，那么'all_proxy'指定的代理将被使用。'no_proxy'则指定了一个不应被使用的代理主机的列表。例如：no_proxy的值是'192.168.1.10'，即使存在http_proxy，它的值也是'192.168.1.10'，'192.168.1.10'也不会被作为代理。no_proxy=”*”表示不允许使用任何代理。

显式地将CURLOPT_PROXY属性设置为空，可以禁止libcurl检查并使用环境变量来使用代理。

SSL和代理

SSL为点到点通信提供安全保障。它包含一些强壮的加密措施和其他安全检测，这使得上面讲到的代理方式不适用于SSL。除非代理服务器提供专用通道，对进出该代理服务器的数据不作任何检测或禁止。通过HTTP代理服务器打开SSL连接，意味着代理服务器要直接连接到目标主机的指定端口。因为代理服务器对在专用通道上传输的数据的类型毫无所知，所以它往往会使某些机制失效，如缓存机制。许多组织只允许在443端口上创建这种类型的数据通道。

代理通道(Tunneling Through Proxy)

正如上面讲到的，要使SSL工作必须在代理服务器创建专用数据通道，通常专用通道只被限制应用于HTTPS。通过HTTP代理在应用程序与目标之间创建一个专用数据通道，应该预防在该专有通道上执行非HTTP的操作，如进行FTP上传或执行FTP命令。代理服务器管理员应该禁止非法的操作。

通过CURLOPT_HTTPPROXYTUNNEL属性来告诉libcurl使用代理通道：

curl_easy_setopt(easy_handle, CURLOPT_HTTPPROXYTUNNEL, 1L);

有时候你想通过代理通道执行平常的HTTP操作，而实际上却可能使你不经过代理服务器而直接与远程主机进行交互。libcurl不会代替这种新引入的行为。

自动配置代理

许多浏览器支持自动配置代理，例如NetScape。libcurl并不支持这些。

持久化的好处(Persistence Is The Way to Happiness)

当需要发送多次请求时，应该重复使用easy handle。

每次执行完curl_easy_perform，licurl会继续保持与服务器的连接。接下来的请求可以使用这个连接而不必创建新的连接（如果目标主机是同一个的话）。这样可以减少网络开销。
即使连接被释放了，libcurl也会缓存这些连接的会话信息，这样下次再连接到目标主机上时，就可以使用这些信息，从而减少重新连接所需的时间。

FTP连接可能会被保存较长的时间。因为客户端要与FTP服务器进行频繁的命令交互。对于有访问人数上限的FTP服务器，保持一个长连接，可以使你不需要排除等待，就直接可以与FTP服务器通信。

libcurl会缓存DNS的解析结果。

在今后的libcurl版本中，还会添加一些特性来提高数据通信的效率。
每个easy handle都会保存最近使用的几个连接，以备重用。默认是5个。可以通过CURLOPT_MAXCONNECTS属性来设置保存连接的数量。

如果你不想重用连接，将CURLOPT_FRESH_CONNECT属性设置为1。这样每次提交请求时，libcurl都会先关闭以前创建的连接，然后重新创建一个新的连接。也可以将CURLOPT_FORBID_REUSE设置为1，这样每次执行完请求，连接就会马上关闭。

libcurl使用的HTTP消息头

当使用libcurl发送http请求时，它会自动添加一些http头。我们可以通过CURLOPT_HTTPHEADER属性手动替换、添加或删除相应的HTTP消息头。

Host

http1.1（大部分http1.0)版本都要求客户端请求提供这个信息头。

Pragma

"no-cache"。表示不要缓冲数据。

Accept

"*/*"。表示允许接收任何类型的数据。

Expect

以POST的方式向HTTP服务器提交请求时，libcurl会设置该消息头为"100-continue"，它要求服务器在正式处理该请求之前，返回一个"OK"消息。如果POST的数据很小，libcurl可能不会设置该消息头。

自定义选项

当前越来越多的协议都构建在HTTP协议之上（如：soap），这主要归功于HTTP的可靠性，以及被广泛使用的代理支持（可以穿透大部分防火墙）。这些协议的使用方式与传统HTTP可能有很大的不同。对此，libcurl作了很好的支持。

自定义请求方式(CustomRequest)

HTTP支持GET, HEAD或者POST提交请求。可以设置CURLOPT_CUSTOMREQUEST来设置自定义的请求方式，libcurl默认以GET方式提交请求：

curl_easy_setopt(easy_handle, CURLOPT_CUSTOMREQUEST, "MYOWNREQUEST");

修改消息头

HTTP协议提供了消息头，请求消息头用于告诉服务器如何处理请求；响应消息头则告诉浏览器如何处理接收到的数据。在libcurl中，你可以自由的添加这些消息头：

struct curl_slist *headers=NULL; /* init to NULL is important */ headers = curl_slist_append(headers, "Hey-server-hey: how are you?"); headers = curl_slist_append(headers, "X-silly-content: yes"); /* pass our list of custom made headers */ curl_easy_setopt(easyhandle, CURLOPT_HTTPHEADER, headers); curl_easy_perform(easyhandle); /* transfer http */ curl_slist_free_all(headers); /* free the header list */

对于已经存在的消息头，可以重新设置它的值：

headers = curl_slist_append(headers, "Accept: Agent-007");   headers = curl_slist_append(headers, "Host: munged.host.line");

删除消息头

对于一个已经存在的消息头，设置它的内容为空，libcurl在发送请求时就不会同时提交该消息头：

headers = curl_slist_append(headers, "Accept:");

强制分块传输(Enforcing chunked transfer-encoding)

（这段文字理解可能有误码）以非GET的方式提交HTTP请求时，如果设置了自定义的消息头”Transfer-Encoding:chunked”，libcurl会分块提交数据，即使要上传的数据量已经知道。在上传数据大小未知的情况下，libcurl自动采用分块上传数据。（译者注：非GET方式提交请求，提交的数据量往往比较大。）

HTTP版本

每一次http请求，都包含一个表示当前使用http版本的消息头。libcurl默认使用HTTP 1.1。可以通过CURLOPT_HTTP_VERSION属性来设置具体的版本号：

curl_easy_setopt(easy_handle, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_0);

FTP自定义命令

并不是所以的协议都像HTTP那样，通过消息头来告诉服务器如何处理请求。对于FTP，你就要使用另外的方式来处理。

发送自定义的命令到ftp服务器，意味着你发送的命令必须是能被ftp服务器理解的命令（FTP协议中定义的命令，参考rfc959）。

下面是一个简单的例子，在文件传输操作操作之前删除指定文件：

headers = curl_slist_append(headers, "DELE file-to-remove");
/* pass the list of custom commands to the handle */ 
curl_easy_setopt(easyhandle, CURLOPT_QUOTE, headers);
// curl_easy_setopt(easyhandle, CURLOPT_POSTQUOTE, headers); // 在数据传输之后操行删除操作

curl_easy_perform(easyhandle); /* transfer ftp data! */ curl_slist_free_all(headers); /* free the header list */

FTP服务器执行命令的顺序，同这些命令被添加到列表中顺序是一致的。发往服务器的命令列表中，只要有一个命令执行失败，ftp服务器就会返回一个错误代码，此时libcurl将直接返回CURLE_QUOTE_ERROR，不再执行剩余的FTP命令。

将CURLOPT_HEADER设置为1，libcurl获取目标文件的信息，并以HTTP消息头的样式来输出消息头。

FTP自定义CUSTOMREQUEST

使用CURLOPT_CUSTOMREQUEST属性，可以向FTP服务器发送命令。"NLST"是ftp默认的列出文件列表的命令。下面的代码用于列出FTP服务器上的文件列表：

int main(int argc, char **argv) { 	curl_global_init(CURL_GLOBAL_WIN32);
	CURL *easy_handle = curl_easy_init(); 	curl_easy_setopt(easy_handle, CURLOPT_URL, "ftp://127.0.0.1/"); 	curl_easy_setopt(easy_handle, CURLOPT_CUSTOMREQUEST, "NLST");

	curl_easy_perform(easy_handle);
 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup(); 
 	return 0;
}

Cookies Without Chocolate Chips

cookie是一个键值对的集合，HTTP服务器发给客户端的cookie，客户端提交请求的时候，也会将cookie发送到服务器。服务器可以根据cookie来跟踪用户的会话信息。cookie有过期时间，超时后cookie就会失效。cookie有域名和路径限制，cookie只能发给指定域名和路径的HTTP服务器。

cookie以消息头”Set-Cookie”的形式从HTTP服务器发送到客户端；客户端发以消息头”Cookie”的形式将Cookie提交到HTTP服务器。为了对这些东西有个直观的概念，下图是FireFox中，使用Firebug跟踪到的cookie消息头：

在libcurl中，可以通过CURLOPT_COOKIE属性来设置发往服务器的cookie：

curl_easy_setopt(easy_handle, CURLOPT_COOKIE, "name1=var1; name2=var2;");

下面的例子演示了如何使用libcurl发送cookie信息给HTTP服务器，代码非常的简单：

int main(int argc, char **argv) { 	curl_global_init(CURL_GLOBAL_WIN32); 	CURL *easy_handle = curl_easy_init(); 
 	curl_easy_setopt(easy_handle, CURLOPT_URL, http://localhost:2210/Default.aspx); 	curl_easy_setopt(easy_handle, CURLOPT_COOKIE, "name=JGood; address=HangZhou"); 
 	curl_easy_perform(easy_handle);

 	curl_easy_cleanup(easy_handle); 	curl_global_cleanup(); 
 	return 0; }

下图是在ASP.NET Web服务器上调试时跟踪到的Cookie数据：

在实在的应用场景中，你可能需要保存服务器发送给你的cookie，并在接下来的请求中，把这些cookie一并发往服务器。所以，可以把上次从服务器收到的所有响应头信息保存到文本文件中，当下次需要向服务器发送请求时，通过CURLOPT_COOKIEFILE属性告诉libcurl从该文件中读取cookie信息。
设置CURLOPT_COOKIEFILE属性意味着激活libcurl的cookie parser。在cookie parser被激活之前，libcurl忽略所以之前接收到的cookie信息。cookie parser被激活之后，cookie信息将被保存内存中，在接下来的请求中，libcurl会自动将这些cookie信息添加到消息头里，你的应用程序不需要做任何事件。大多数情况下，这已经足够了。需要注意的是，通过CURLOPT_COOKIEFILE属性来激活cookie parser，给CURLOPT_COOKIEFILE属性设置的一个保存cookie信息的文本文件路径，可能并不需要在磁盘上物理存在。
如果你需要使用NetScape或者FireFox浏览器的cookie文件，你只要用这些浏览器的cookie文件的路径来初始化CURLOPT_COOKIEFILE属性，libcurl会自动分析cookie文件，并在接下来的请求过程中使用这些cookie信息。
libcurl甚至能够把接收到的cookie信息保存成能被Netscape/Mozilla的浏览器所识别的cookie文件。通过把这些称为cookie-jar。通过设置CURLOPT_COOKIEJAR选项，在调用curl_easy_cleanup释放easy handle的时候，所有的这些cookie信息都会保存到cookie-jar文件中。这就使得cookie信息能在不同的easy handle甚至在浏览器之间实现共享。

FTP Peculiarities We Need

在使用FTP协议进行数据传输的时候，需要创建两个连接。第一个连接用于传输控制命令，另一个连接用于传输数据。（关于FTP的通信过程，请参考这篇文章： http://www.wangjia.net/bo-blog/post/698/）。 FTP通信需要创建两个连接这个事实往往被很多人忽略。根据第二个连接的发起方是谁，可以分为主动模式与被动模式。libcurl对此都提供了支持。libcurl默认使用被动模式，因为被动模式可以方便的穿透防火墙，NAT等问题。在被动模式下，libcurl要求ftp服务器打开一个新的端口监听，然后libcurl连接该端口用于数据传输。如果使用主动模式，程序必须告诉FTP服务器你监听的IP与端口，通过设置CURLOPT_FTPPORT属性来完成。

上面介绍的easy interface以同步的方式进行数据传输，curl_easy_perform会一直阻塞到数据传输完毕后返回，且一次操作只能发送一次请求，如果要同时发送多个请求，必须使用多线程。
而multi interface以一种简单的、非阻塞的方式进行传输，它允许在一个线程中，同时提交多个相同类型的请求。在使用multi interface之前，你应该掌握easy interface的基本使用。因为multi interface是建立在easy interface基础之上的，它只是简单的将多个easy handler添加到一个multi stack，而后同时传输而已。
使用multi interface很简单，首先使用curl_multi_init()函数创建一个multi handler，然后使用curl_easy_init()创建一个或多个easy handler，并按照上面几章介绍的接口正常的设置相关的属性，然后通过curl_multi_add_handler将这些easy handler添加到multi handler，最后调用curl_multi_perform进行数据传输。
curl_multi_perform是异步的、非阻塞的函数。如果它返回CURLM_CALL_MULTI_PERFORM，表示数据通信正在进行。

通过select()来操作multi interface将会使工作变得简单（译者注：其实每个easy handler在低层就是一个socket，通过select()来管理这些socket，在有数据可读/可写/异常的时候，通知应用程序）。在调用select()函数之前，应该使用curl_multi_fdset来初始化fd_set变量。

select()函数返回时，说明受管理的低层socket可以操作相应的操作（接收数据或发送数据，或者连接已经断开），此时应该马上调用curl_multi_perform，libcurl将会执行相应操作。使用select()时，应该设置一个较短的超时时间。在调用select()之前，造成不要忘记通过curl_multi_fdset来初始化fd_set，因为每次操作，fd_set中的文件描述符可能都不一样。

如果你想中止multi stack中某一个easy handle的数据通信，可以调用curl_multi_remove_handle函数将其从multi stack中取出。千万另忘记释放掉easy handle（通过curl_easy_cleanup()函数）。

当multi stack中的一个eash handle完成数据传输的时候，同时运行的传输任务数量就会减少一个。当数量降到0的时候，说明所有的数据传输已经完成。

curl_multi_info_read用于获取当前已经完成的传输任务信息，它返回每一个easy handle的CURLcode状态码。可以根据这个状态码来判断每个easy handle传输是否成功。

下面的例子，演示了如何使用multi interface进行网页抓取：

int main(int argc, char **argv) { 	// 初始化 	curl_global_init(CURL_GLOBAL_WIN32); 	CURLM *multi_handle = NULL; 	CURL *easy_handle1 = NULL; 	CURL *easy_handle2 = NULL; 	 	extern size_t save_sina_page(void *buffer, size_t size, size_t count, void *user_p); 	extern size_t save_sohu_page(void *buffer, size_t size, size_t count, void *user_p); 	FILE *fp_sina = fopen("sina.html", "ab+"); 	FILE *fp_sohu = fopen("sohu.html", "ab+");  	multi_handle = curl_multi_init();  	// 设置easy handle 	easy_handle1 = curl_easy_init(); 	curl_easy_setopt(easy_handle1, CURLOPT_URL, "http://www.sina.com.cn"); 	curl_easy_setopt(easy_handle1, CURLOPT_WRITEFUNCTION, &save_sina_page); 	curl_easy_setopt(easy_handle1, CURLOPT_WRITEDATA, fp_sina);  	easy_handle2 = curl_easy_init(); 	curl_easy_setopt(easy_handle2, CURLOPT_URL, "http://www.sohu.com"); 	curl_easy_setopt(easy_handle2, CURLOPT_WRITEFUNCTION, &save_sohu_page); 	curl_easy_setopt(easy_handle2, CURLOPT_WRITEDATA, fp_sohu);  	// 添加到multi stack 	curl_multi_add_handle(multi_handle, easy_handle1); 	curl_multi_add_handle(multi_handle, easy_handle2);  	//  	int running_handle_count; 	while (CURLM_CALL_MULTI_PERFORM == curl_multi_perform(multi_handle, &running_handle_count)) 	{ 		cout << running_handle_count << endl; 	}  	while (running_handle_count) 	{ 		timeval tv; 		tv.tv_sec = 1; 		tv.tv_usec = 0;  		int max_fd; 		fd_set fd_read; 		fd_set fd_write; 		fd_set fd_except;  		FD_ZERO(&fd_read); 		FD_ZERO(&fd_write); 		FD_ZERO(&fd_except);  		curl_multi_fdset(multi_handle, &fd_read, &fd_write, &fd_except, &max_fd); 		int return_code = select(max_fd + 1, &fd_read, &fd_write, &fd_except, &tv); 		if (SOCKET_ERROR == return_code) 		{ 			cerr << "select error." << endl; 			break; 		} 		else 		{ 			while (CURLM_CALL_MULTI_PERFORM == curl_multi_perform(multi_handle, &running_handle_count)) 			{ 				cout << running_handle_count << endl; 			} 		} 	}  	// 释放资源 	fclose(fp_sina); 	fclose(fp_sohu); 	curl_easy_cleanup(easy_handle1); 	curl_easy_cleanup(easy_handle2); 	curl_multi_cleanup(multi_handle); 	curl_global_cleanup();  	return 0; }  size_t save_sina_page(void *buffer, size_t size, size_t count, void *user_p) { 	return fwrite(buffer, size, count, (FILE *)user_p); }  size_t save_sohu_page(void *buffer, size_t size, size_t count, void *user_p) { 	return fwrite(buffer, size, count, (FILE *)user_p); }

SSL, 证书，其他技巧

[ seeding, passwords, keys, certificates, ENGINE, ca certs ]

在easy handler之间共享数据

[fill in]