PHP中urlencode()函数进行URL编码详解

U汉兰达LEncode:是指针对网页url中的普通话字符的一种编码转变形式,最广泛的就是Baidu、Google等寻觅引擎中输入粤语查询时候,生成经过Encode过的网页U昂CoraL。

在运用 ?id=”汉语”
传递中文参数时,出现了乱码,那是透过了一遍转码后的结果,个中,在 php
中,url
中是不得以平昔传输中文的,对于那一点,平素心存不满,不可能呀,哪个人让咱没一套技术方案吗,不知晓别的语言是或不是也出现那样的主题材料。

UavancierLEncode的点子相近有三种,一种是理念的依据GB2312的Encode(Baidu、Yisou等利用),另一种是基于UTF-8的Encode(谷歌、Yahoo等采取)。

对此英特网所说的在首页增添 header(“content-type:text/html;charset=utf-8″卡塔尔;
那样的代码,以至把数据库页面等等设置成
utf8 的缓慢解决方案根本对事情未有什么益处,始终传递过来的华语是乱码。

本工具分别达成二种方法的Encode与Decode:

尽管具有 04ie.com站点PHP  小编都以用的联结的 utf8
编码,但一直传递过去是乱码,后来测量检验了多少个浏览器,发掘 360
能够传递过去,而 IE 不行,后来再采用 $msg =
iconv(‘gbk’,’utf-8′,$_GET[“msg”]卡塔尔国;
进行改变,测量试验多少个浏览器后,超级多依然显得乱码的标题。

中文 -> GB2312的Encode -> %D6%D0%CE%C4

终极计算了某个,对于 GET[] 过去的值,url
中不得以一贯传输汉语,要是必定要传输的话,用 urlencode(State of Qatar方法来管理普通话。对于 POST[]  不清楚怎么样,近年来还未有曾做超过实际验。

中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87

再来PHP手册上查下urlencode(State of Qatar的施用:

HTML中的URLEncode:

编码为GB2312的html文件中: ->
浏览器自动转变为 ->

澳门新浦京电子游戏 ,小心:Firefox对GB2312的Encode的中文UMuranoL扶助倒霉,因为它暗许是UTF-8编码发送UPAJEROL的,不过ftp://合同能够,我试过了,小编觉着那应当算是Firefox三个bug。

编码为UTF-8的html文件中: ->
浏览器自动转变为 ->

urlencode(卡塔尔 本函数将字符串以 U哈弗L 编码。举个例子空格就能化为加号。Homepage 中
form 资料传送便是用 urlencode 编码后再送出

PHP中的URLEncode:

<?php 
//GB2312的Encode 
echo urlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.+ 
echo urldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_. 
echo rawurlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.%20 
echo rawurldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_. 
?>

除了“-_.”之外的享有非字母数字字符都将被替换到百分号“%”后跟两位十八进制数。

urlencode和rawurlencode的区分:urlencode将空格编码为加号“+”,rawurlencode将空格编码为加号“%20”。

假使要利用UTF-8的Encode,有二种办法:

一、将文件存为UTF-8文件,直接行使urlencode、rawurlencode就能够。

二、使用mb_convert_encoding函数:

<?php 
$url = 'http://s.jb51.net/中文.rar'; 
echo urlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n"; 
echo rawurlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n"; 
//http%3A%2F%2Fs.jb51.net%2F%E4%B8%AD%E6%96%87.rar 
?>

实例:

<?php 
function parseurl($url="") 
{ 
$url = rawurlencode(mb_convert_encoding($url, 'gb2312', 'utf-8')); 
$a = array("%3A", "%2F", "%40"); 
$b = array(":", "/", "@"); 
$url = str_replace($a, $b, $url); 
return $url; 
} 
$url="ftp://ud03:password@s.jb51.net/中文/中文.rar"; 
echo parseurl($url); 
//ftp://ud03:password@s.jb51.net/%D6%D0%CE%C4/%D6%D0%CE%C4.rar 
?>

原来这样,笔者说吗为何从form表单提交过来的就从不难点,然而url传递过来的就乱码

JavaScript中的URLEncode:

如:%E4%B8%AD%E6%96%87-_.%20%E4%B8%AD%E6%96%87-_.%20

encodeU揽胜I不对下列字符实行编码:“:”、“/”、“;”、“?”、“@”等特殊字符。

本工具分别完毕二种办法的Encode与Decode:

中文 -> GB2312的Encode -> %D6%D0%CE%C4

中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87

Html中的URLEncode:

编码为GB2312的html文件中:/粤语.rar -> 浏览器自动转变为 ->
/%D6%D0%CE%C4.rar

瞩目:Firefox对GB2312的Encode的汉语ULX570L扶助倒霉,因为它暗许是UTF-8编码发送UEvoqueL的,但是ftp://协议得以,小编试过了,作者感到这应该算是Firefox一个bug。

编码为UTF-8的html文件中:/普通话.rar -> 浏览器自动转变为 ->
/%E4%B8%AD%E6%96%87.rar

PHP中的URLEncode:

 代码如下

<?php
//GB2312的Encode
echo urlencode(“中文-_. “).”n”; //%D6%D0%CE%C4-_.+
echo urldecode(“%D6%D0%CE%C4-_. “).”n”; //中文-_.
echo rawurlencode(“中文-_. “).”n”; //%D6%D0%CE%C4-_.%20
echo rawurldecode(“%D6%D0%CE%C4-_. “).”n”; //中文-_.
?>

除了“-_.”之外的兼具非字母数字字符都将被改造来都百货分号“%”后跟两位十三进制数。

urlencode和rawurlencode的界别:urlencode将空格编码为加号“+”,rawurlencode将空格编码为加号“%20”。

只要要利用UTF-8的Encode,有二种艺术:

一、将文件存为UTF-8文件,直接采纳urlencode、rawurlencode就可以。

二、使用mb_convert_encoding函数:

 代码如下

<?php
$url = ‘/中文.rar’;
echo urlencode(mb_convert_encoding($url, ‘utf-8’, ‘gb2312’)).”n”;
echo rawurlencode(mb_convert_encoding($url, ‘utf-8’, ‘gb2312’)).”n”;
//http%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar
?>

实例: 

 代码如下

<?php
function parseurl($url=””)
{
$url = rawurlencode(mb_convert_encoding($url, ‘gb2312’, ‘utf-8’));
$a = array(“%3A”, “%2F”, “%40”);
$b = array(“:”, “/”, “@”);
$url = str_replace($a, $b, $url);
return $url;
}
$url=”ftp://ud03:password@s./中文/中文.rar”;
echo parseurl($url);
//ftp://ud03:password@s./%D6%D0%CE%C4/%D6%D0%CE%C4.rar
?>

JavaScript中的URLEncode:

如:%E4%B8%AD%E6%96%87-_.%20%E4%B8%AD%E6%96%87-_.%20

encodeU大切诺基I不对下列字符进行编码:“:”、“/”、“;”、“?”、“@”等特殊字符。

如:/%E4%B8%AD%E6%96%87.rarhttp%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar

简单来讲也只有用 urlencode(卡塔尔国方法来拍卖普通话了,在传递从前要先进行编码,传递过去过后再拓宽缓和就足以了,那么利用如下四个函数:编码:”.urlencode(‘中文’卡塔尔(قطر‎.”,解码:”.urldecode(‘中文’卡塔尔国.”,括号里的普通话正是传递的字符了。

如下:传递页面先举办04ie.com编码:td.php?id=”.urlencode(‘粤语’卡塔尔国.”,接纳页面举办解码就可以:urldecode(id卡塔尔.”。

新生附贰个函数

 代码如下

if
(preg_match(“/^([“.chr(228).”-“.chr(233).”]{1}
[“.chr(128).”-“.chr(191).”]{1}[“.chr(128).”-“.chr(191).”]{1})+$/”,$msg))
//如果$msg是UTF-8编码
{
$msg = iconv(“UTF-8″,”GB2312”,$msgState of Qatar; //将 $msg
由UTF-8编码转为GB2312编码
}

发表评论

电子邮件地址不会被公开。 必填项已用*标注