处理URL字符串: 编码,解码和解析。

  • base64_decode — 对使用 MIME base64 编码的数据进行解码
  • base64_encode — 使用 MIME base64 对数据进行编码

设计此种编码是为了使二进制数据可以通过非纯 8-bit 的传输层传输,例如电子邮件的主体。

Base64-encoded 数据要比原始数据多占用 33% 左右的空间。
  • get_headers — 取得服务器响应一个 HTTP 请求所发送的所有标头

    如果将可选的 format 参数设为 1,则 get_headers() 会解析相应的信息并设定数组的键名。

    url = 'http://www.example.com';
      
    print_r(get_headers($url, 1));//format参数设置为1
    
    Array
    (
        [0] => HTTP/1.1 200 OK
        [Date] => Sat, 29 May 2004 12:28:14 GMT
        [Server] => Apache/1.3.27 (Unix)  (Red-Hat/Linux)
        [Last-Modified] => Wed, 08 Jan 2003 23:11:55 GMT
        [ETag] => "3f80f-1b6-3e1cb03b"
        [Accept-Ranges] => bytes
        [Content-Length] => 438
        [Connection] => close
        [Content-Type] => text/html
    )
    
  • get_meta_tags — 从一个文件中提取所有的 meta 标签 content 属性,返回一个数组

    打开 filename 逐行解析文件中的 <meta> 标签。解析工作将在 </head> 处停止。

    支持本地文件与url。

  • http_build_query — 生成 URL-encode 之后的请求字符串

    使用给出的关联(或下标)数组生成一个经过 URL-encode 的请求字符串。

    $data = array('foo'=>'bar',
            'baz'=>'boom',
            'cow'=>'milk',
            'php'=>'hypertext processor');
    
    echo http_build_query($data) . "\n";
    
    foo=bar&baz=boom&cow=milk&php=hypertext+processor
    
    
  • parse_url — 解析 URL,返回其组成部分

    parse_url( string $url[, int $component = -1] ) : mixed
    

    注意:本函数不是用来验证给定 URL 的合法性的,只是将其分解为下面列出的部分。不完整的 URL 也被接受,parse_url() 会尝试尽量正确地将其解析。

    指定 PHP_URL_SCHEME、 PHP_URL_HOST、 PHP_URL_PORT、 PHP_URL_USER、 PHP_URL_PASS、 PHP_URL_PATH、 PHP_URL_QUERY 或 PHP_URL_FRAGMENT 的其中一个来获取 URL 中指定的部分的 string。

    print_r(parse_url("http://www.9ong.com/aa/bb?a=b#id"));
    
    
    Array
    (
        [scheme] => http
        [host] => www.9ong.com
        [path] => /aa/bb
        [query] => a=b
        [fragment] => id
    )
    
    
  • urlencode — 编码 URL 字符串

    返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 » RFC3986 编码(参见 rawurlencode())不同。

  • urldecode — 解码已编码的 URL 字符串

    注意:超全局变量 $_GET 和 $_REQUEST 已经被解码了。对 $_GET 或 $_REQUEST 里的元素使用 urldecode() 将会导致不可预计和危险的结果。

  • rawurlencode — 按照 RFC 3986 对 URL 进行编码

    返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 » RFC 3986 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。

  • rawurldecode — 对已编码的 URL 字符串进行解码

    rawurldecode() 不会把加号(‘+’)解码为空格,而 urldecode() 可以。