在socket编程中使用域名

在socket编程中使用域名

gethostbyname()函数:通过域名获取IP地址

客户端中直接使用IP地址会有很大的弊端,一旦IP地址变化(IP地址会经常变动),客户端软件就会出现错误。

而使用域名会方便很多,注册后的域名只要每年续费就永远属于自己的,更换IP地址时修改域名解析即可,不会影响软件的正常使用。

通过域名获取IP地址

域名仅仅是IP地址的一个助记符,目的是方便记忆,通过域名并不能找到目标计算机,通信之前必须要将域名域名转换成IP地址。

gethostbyname()函数原型为:

1
struct hostent *gethostbyname(const char *hostname)

hostname 为主机名,也就是域名。使用该函数时,只要传递域名字符串,就会返回域名对应的 IP 地址。返回的地址信息会装入 hostent 结构体,该结构体的定义如下:

1
2
3
4
5
6
7
struct hostent{
char *h_name; //official name
char **h_aliases; //alias list
int h_addrtype; //host address type
int h_length; //address lenght
char **h_addr_list; //address list
}

从该结构体可以看出,不只返回 IP 地址,还会附带其他信息,各位读者只需关注最后一个成员 h_addr_list。下面是对各成员的说明:

  • h_name:官方域名(Official domain name)。官方域名代表某一主页,但实际上一些著名公司的域名并未用官方域名注册。
  • h_aliases:别名,可以通过多个域名访问同一主机。同一 IP 地址可以绑定多个域名,因此除了当前域名还可以指定其他域名。
  • h_addrtype:gethostbyname() 不仅支持 IPv4,还支持 IPv6,可以通过此成员获取IP地址的地址族(地址类型)信息,IPv4 对应 AF_INET,IPv6 对应 AF_INET6。
  • h_length:保存IP地址长度。IPv4 的长度为 4 个字节,IPv6 的长度为 16 个字节。
  • h_addr_list:这是最重要的成员。通过该成员以整数形式保存域名对应的 IP 地址。对于用户较多的服务器,可能会分配多个 IP 地址给同一域名,利用多个服务器进行均衡负载。

hostent 结构体变量的组成如下图所示:

1
2
3
4
5
6
7
8
9
10
11
import socket

def get_remote_machine_info():
remote_host = 'www.baidu.com'
try:
print "IP address: %s" %socket.gethostbyname(remote_host)
except socket.error, err_msg:
print "%s:%s" %(remote_host,err_msg)

if __name__ == '__main__':
get_remote_machine_info()

getaddrinfo()函数

getaddrinfo()函数是现在用来替代gethostbyname()功能的函数,他具有更加强大的功能。

getaddrinfo()函数原型

1
2
3
4
5
int getaddrinfo(const char *restrict host, 
const char *restrict service,
const struct addrinfo *restrict hint,
struct addrinfo **restrict res);
返回值:若成功,返回0;若出错,返回非0错误码

现在python中用到的关于地址查询的函数几乎都可以用getaddrinfo。也就是说,如果你要想做一些与地址查询,主机名ip转换的操作,都可以用这个函数。

函数原型:socket.getaddrinfo(host, port[, family[, socktype[, proto[, flags]]]])

返回值:[(family, socktype, proto, canonname, sockaddr)]有元组组成的列表,元组里面包含5个元素,其中sockaddr是(host,port)

  • family: 表示socket使用的协议簇。常用的协议簇包括AF_UNIX(本机通信)/AF_INET(TCP/IP协议簇中的IPv4协议)/AF_INET6(TCP/IP协议簇中的IPv4协议)。在python的socket包中,用1表示AF_UNIX,2表示AF_INET,10表示AF_INET6。

  • sockettype:表示socket的类型。常见的socket类型包括SOCK_STREAM(TCP流)/SOCK_DGRAM(UDP数据报)/SOCK_RAW(原始套接字)。其中,SOCK_STREAM=1,SOCK_DGRAM=2,SOCK_RAW=3

  • proto:顾名思义,就是指定协议。套接口所用的协议。如调用者不想指定,可用0。常用的协议有,IPPROTO_TCP(=6)和IPPTOTO_UDP(=17),它们分别对应TCP传输协议、UDP传输协议。

  • 如:socket.getaddrinfo(‘www.baidu.com',80) –>

    [(2, 2, 17, ‘’, (‘180.97.33.108’, 80)), (2, 1, 6, ‘’, (‘180.97.33.108’, 80)), (2, 2, 17, ‘’, (‘180.97.33.107’, 80)), (2, 1, 6, ‘’, (‘180.97.33.107’, 80))]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
socket.getaddrinfo(host,  port, family=0, socktype=0, proto=0, flags=0)  
#根据给定的参数host/port,相应的转换成一个包含用于创建socket对象的五元组,
#参数host为域名,以字符串形式给出代表一个IPV4/IPV6地址或者None.
#参数port如果字符串形式就代表一个服务名,比如“http”"ftp""email"等,或者为数字,或者为None
#参数family为地主族,可以为AF_INET ,AF_INET6 ,AF_UNIX.
#参数socketype可以为SOCK_STREAM(TCP)或者SOCK_DGRAM(UDP)
#参数proto通常为0可以直接忽略
#参数flags为AI_*的组合,比如AI_NUMERICHOST,它会影响函数的返回值
#附注:给参数host,port传递None时建立在C基础,通过传递NULL。
#该函数返回一个五元组(family, socktype, proto, canonname, sockaddr),同时第五个参数sockaddr也是一个二元组(address, port)
# Echo server program
import socket
import sys

HOST = None # Symbolic name meaning all available interfaces
PORT = 50007 # Arbitrary non-privileged port
s = None
for res in socket.getaddrinfo(HOST, PORT, socket.AF_UNSPEC,
socket.SOCK_STREAM, 0, socket.AI_PASSIVE):
af, socktype, proto, canonname, sa = res
try:
#根据getaddrinfo()的返回信息初始化socket
s = socket.socket(af, socktype, proto)
except socket.error, err_msg:
print err_msg #回显异常信息
s = None
continue
try:
#sa是(host,port)的二元组
s.bind(sa)
#监听客户端请求
s.listen(1)
except socket.error, err_msg:
print err_msg
s.close()
s = None
continue
break
if s is None:
print 'could not open socket'
sys.exit(1)

conn, addr = s.accept()
print 'Connected by', addr

while 1:
data = conn.recv(1024)# 2)接受数据
if not data: break
conn.send(data)# 3)并返回2中接受到得数据
conn.close()



# Echo client program
import socket
import sys

HOST = 'daring.cwi.nl' # The remote host
PORT = 50007 # The same port as used by the server
s = None
for res in socket.getaddrinfo(HOST, PORT, socket.AF_UNSPEC, socket.SOCK_STREAM):
af, socktype, proto, canonname, sa = res
try:
s = socket.socket(af, socktype, proto)
except socket.error, msg:
s = None
continue
try:
s.connect(sa)
except socket.error, msg:
s.close()
s = None
continue
break
if s is None:
print 'could not open socket'
sys.exit(1)

s.sendall('Hello, world')# 1)发送数据
data = s.recv(1024)# 4)接受服务器回显的数据
s.close()
print 'Received', repr(data) #打印输出