由於近年來搜尋引擎趨勢開始偏向於區域性,因此在 SEO 優化中有所謂〔網頁語言宣告須符合區域性〕以便於搜尋引擎辨識,因 UTF-8 多國語系的性質被認為難以辨識區域性,在 SEO 優化中受到不少批評。

然而,根本問題在於區域性資訊本來就不該由字符集來提供,meta 在區域宣告上有另一種方法:
<meta http-equiv="Content-Language" content="語系識別碼">

因此以 UTF-8 網頁而言,meta 的宣告至少要有兩行,才能解決 SEO 優化的區域性問題,例:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta http-equiv="Content-Language" content="zh-tw">
除比較特別的 zh 系列(台灣繁體 zh-tw,香港繁體 zh-hk,中國簡體 zh-cn,新加坡簡體 zh-sg),其他語系識別碼可參考相關連結。

相關連結:SEO Consultants Directory,META Language Tag
     中文資訊及資通術語標準網站,語言名稱代碼查詢
2010/09/21 15:16 2010/09/21 15:16
2010/09/21 15:16 

架在 Linux Server 上的 UTF-8 網頁以 IE 開啟沒有亂碼,改用 Firefox 開啟則會遇到狀況:
1. 左上角有亂碼
2. 特殊符號變成亂碼

這是因為 Apache 無法正常解讀 BOM,並且主機編碼設置可能有誤所引起,在主機無法變更設定的情況下,我們只好在網頁上作修正。

解決方法
1. 使用 Notepad++ 將網頁儲存成無 BOM 網頁可解決左上角亂碼的問題。
 (格式 > 編譯成 UTF-8 碼,檔首無 BOM)
2. 將網頁轉存為 PHP 網頁,開頭加上以下資訊可解決特殊符號變成亂碼的問題。

<? header("Content-Type:text/html; charset=utf-8"); ?>
2008/11/19 20:43 2008/11/19 20:43
2008/11/19 20:43 

UTF-8 在 Charset 的正確資料:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

很多人為了方便會將 utf-8 縮寫成 utf8:
<meta http-equiv="Content-Type" content="text/html; charset=utf8">

兩者在執行上並不會出現大問題,utf8 仍然可以被大部份瀏覽器正確解讀為 UTF-8 網頁,不過目前已知有個問題。無 BOM 的網頁上,後者將因為 Meta 語系標籤無法正確被辨識為 UTF-8 而造成網頁輸出亂碼。
2008/01/06 13:12 2008/01/06 13:12
2008/01/06 13:12 

只有網頁轉為 UTF-8 而資料庫沒有轉,當然是不行的啊。

首先要匯出 SQL 資料,以 MySQL 為例,登入 phpMyAdmin 後,按[輸出],在下載儲存的部份選 [zipped] ,再按[執行],會下載一個 zip 壓縮檔,解開後可以得到 localhost.sql 這個資料庫檔,同樣以記事本開啟,將它轉存為 UTF-8 檔,再將此 sql 檔匯入資料庫就完成了。

過程中要注意的是,請詳細檢查你的 sql 檔,如果你的資料庫是 BIG5 和 UTF-8 混合使用的話,在匯入資料庫前也請先確定資料統一轉為 UTF-8 才匯入,並且要細心查看中文字的字尾是否有問號,而且在寫入資料庫的中文字不可以有任何一個亂碼,不然會導致匯入中斷,都沒問題之後才能執行匯入動作以免引起大麻煩。

關於網站轉為 UTF-8 國際編碼的問題就差不多探討至此了。其實並不難,只要多一份細心就行了,另外備份是很重要的,如果你沒有十足把握的話。
2005/08/28 14:06 2005/08/28 14:06
2005/08/28 14:06 

不必每個檔案都轉 UTF-8,只要將 phpBB 的語系檔轉為 UTF-8 就可以了,不過一定要用 ALF 所設計的 ConvertZ 這個軟體轉 UTF-8,不然首頁會出現類似如下的錯誤訊息,而且也將無法登入後台管理:

Warning: Cannot modify header information - headers already sent by (output started at C:\webserver\myweb\phpbb\language\lang_english\lang_main.php:1) in C:\webserver\myweb\phpbb1\includes\page_header.php on line 470

Warning: Cannot modify header information - headers already sent by (output started at C:\webserver\myweb\phpbb\language\lang_english\lang_main.php:1) in C:\webserver\myweb\phpbb1\includes\page_header.php on line 476

Warning: Cannot modify header information - headers already sent by (output started at C:\webserver\myweb\phpbb\language\lang_english\lang_main.php:1) in C:\webserver\myweb\phpbb1\includes\page_header.php on line 477
遇到上述狀況的話,只要將你的編碼轉回 ANSI 再使用 ConvertZ 轉為 UTF-8 就解決了。

並且要修正語系檔裡的 lang_main.php 的
$lang['ENCODING'] = 'Big5';

改為
$lang['ENCODING'] = 'UTF-8';

參考資料:竹貓星球討論串
2005/08/28 13:38 2005/08/28 13:38
2005/08/28 13:38 

這個問題應該也是在轉換 UTF-8 網頁時經常會遇到的問題,
UTF-8 網頁只能讀取 UTF-8 CSS,
所以 CSS 也必須存成 UTF-8 才能正常運作。
2005/08/27 22:24 2005/08/27 22:24
2005/08/27 22:24 

[編輯] > [偏好設定]

在這裡不再選擇繁體中文而是選擇 UTF-8,以後開啟新網頁就不必重新設定了。
2005/08/27 18:34 2005/08/27 18:34
2005/08/27 18:34 

修改 META 宣告

首先用記事本開啟要轉換為 UTF-8 的網頁,在網頁的開頭附近找到這一段:

<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=BIG5">
<TITLE>標題</TITLE>

將 BIG5 改為 UTF-8 如下:

<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=utf-8">
<TITLE>標題</TITLE>

請注意宣告網頁編碼的 META 這一行一定要在宣告<title>標題</title>這一行上面(其他 META 留在下面沒關係),否則在 IE 逐行讀取時,會引起網頁編碼判斷錯誤。

※ 請注意,僅設定編碼為 UTF-8 而沒作以下動作的話,你的網頁將會變成亂碼。

將檔案存成 UTF-8

改好了之後選擇 [檔案] > [另存新檔],在[編碼]選 [UTF-8],[儲存]
請注意,若您的系統是 Windows 98 以下的筆記本可能沒有這樣的功能,那麼請改用 UltraEdit 等文本編輯軟體來轉換。

為求謹慎起見,一個檔一個檔修改我認為還是有必要的。
2005/08/27 18:06 2005/08/27 18:06
2005/08/27 18:06 

UTF-8 的兩大優點:
1. 可以同時顯示多國語言
2. 對於繁體中文字支援也比 BIG5 齊全

講到這裡就說來話長了。

BIG5碼由資策會於1984年制定,以儘量不使用控制碼範圍,並配合國人自製五大套裝軟體為宗旨,因此有 BIG5 之稱,專門用以處理繁體中文字碼。由於倚天中文系統當時在台灣、香港的佔有率幾乎達到 100%,所以倚天擴充字集可以說是成為 BIG-5 碼非正式標準。然而,微軟 Windows 3.1 上市時,很荒謬的未採用倚天擴充字集。由於微軟支援不足,加上標準制定太晚,導致 BIG5 缺字問題一直未解決,人名常用字如堃、煊等字都沒有收錄,一直以來廣為使用者所詬病。

另外,也解說一下 UTF-8 好了,1984年ISO的一些會員國發起第一份 UCS 草案,編號為 ISO/IEC 10646,之後於 1991 許多公司共同出資成立 Unicode Consortium 以制定 Unicode 標準為目標,Unicode編碼方式有很多種,目前最常用的 Unicode 編碼方式就是UTF-8 了。

總之,依現況而言,BIG5 變成一個標準很差卻佔有率高的 Local 編碼系統,而 UTF-8 則是標準嚴謹而佔有率低的國際編碼。孰優孰劣相較之下勝負立分.. UTF-8 可以讓你的網站繁體中文字更齊全並且更有國際觀。

UTF-8是有組織在管理的編碼,BIG5則是一放到爛的編碼。相比之下不是明顯多了嗎? 而且,現在 UTF-8 的網站愈來愈多了,這是無可避免的未來趨勢。你支持 UTF-8 嗎? 一起來支持 UTF-8 吧!!

BIG5... ? 讓它睡吧,反正一直以來也都在睡。

參考資料:Unicode Home Page
2005/08/27 00:49 2005/08/27 00:49
2005/08/27 00:49