PHP中file_get_contents函数获取URL文件内容时,带BOM的utf-8,用json_decode() 返回null的问题。
网上有二种处理方法:
1、正则
if(preg_match('/^\xEF\xBB\xBF/',$data))??? //去除可能存在的BOM
{
??? $data=substr($data,3);
}
?
2、自动检测目录下文件并移除BOM
?<?php
if (isset($_GET['dir'])){ //config the basedir
$basedir=$_GET['dir'];
}else{
$basedir = '.';
}
$auto = 1;
checkdir($basedir);
function checkdir($basedir){
if ($dh = opendir($basedir)) {
while (($file = readdir($dh)) !== false) {
if ($file != '.' && $file != '..'){
if (!is_dir($basedir."/".$file)) {
echo "filename: $basedir/
$file ".checkBOM("$basedir/$file")." <br>";
}else{
$dirname = $basedir."/".
$file;
checkdir($dirname);
}
}
}
closedir($dh);
}
}
function checkBOM ($filename) {
global $auto;
$contents = file_get_contents($filename);
$charset[1] = substr($contents, 0, 1);
$charset[2] = substr($contents, 1, 1);
$charset[3] = substr($contents, 2, 1);
if (ord($charset[1]) == 239 && ord($charset[2]) == 187 &&
ord($charset[3]) == 191) {
if ($auto == 1) {
$rest = substr($contents, 3);
rewrite ($filename, $rest);
return ("<font color=red>BOM found,
automatically removed.</font>");
} else {
return ("<font color=red>BOM found.
</font>");
}
}
else return ("BOM Not Found.");
}
function rewrite ($filename, $data) {
$filenum = fopen($filename, "w");
flock($filenum, LOCK_EX);
fwrite($filenum, $data);
fclose($filenum);
}
?>
?
?本人参考上面二种方法,均无效。
于是把?file_get_contents得到的内容(浏览器上显示的)复制出来,并粘贴进Netbeans空白PHP文件中,发现我的BOM内容根本不至3个字符。。。
于是修改如下:
。。。。//类其他文件,不用理
?
??? public static function checkBOM($contents) {????????
??????? $j=0;
??????? for($i=0;$i<strlen($contents);$i++){
??????????? $charset = ord(substr($contents, $i, 1));
??????????? if($charset==239 || $charset==187 || $charset==191 ){
??????????????? $j++;
??????????? }
??????? }
??????? $contents = substr($contents, $j);
??????? return $contents;
??? }
。。。。//类其他文件,不用理
?
调用页:
$data = file_get_contents(fileURL);
$data = func::checkBOM($data);??? //去除可能存在的BOM
$data = json_decode($data, true);
这样就OK了