php 5的流讀取函數(shù)好像默認(rèn)編碼是UTF-8,以前在php 4里直接file_get_contents()讀取gb2312編碼的正常,到了5就亂碼了。網(wǎng)上的解決辦法說抓取后用iconv()轉(zhuǎn)碼??春笪揖陀X 得不對勁:一個(gè)是不一定編譯了iconv庫,更大的問題是編碼都跟流轉(zhuǎn)換的時(shí)候有關(guān)(如果用了iconv實(shí)際上php轉(zhuǎn)了兩次碼:流 -> UTF-8 -> GB2312):這不是白忙乎了嗎?
仔細(xì)看了下php的文檔(不知道大家都是怎么寫代碼的,其實(shí)文檔上很清楚啊),上面關(guān)于fopen()及file_get_contents()都 提到了“默認(rèn)是UTF-8,但是用戶可以用stream_default_encoding()或者用戶自定義上下文屬性改變編碼”(If unicode semantics are enabled, the default encoding of the read data is UTF-8. You can specify a different encoding by creating a custom context or by changing the default using stream_default_encoding().)。于是用stream_default_encoding(’gb2312′);測試:但是 faint的是,這個(gè)函數(shù)不存在?!似乎php 6才支持。不過天無絕人之路,還有“用戶自定義上下文屬性”可以用。
經(jīng)過更仔細(xì)的看文檔,最后解決了這個(gè)問題:
//設(shè)置流的編碼格式,這是文件流(file),如果是網(wǎng)絡(luò)訪問,file改成http
$opts = array('file' => array('encoding' => 'gb2312'));
$ctxt = stream_context_create($opts);
file_get_contents(文件名, FILE_TEXT, $ctxt);
更多信息請查看IT技術(shù)專欄