在設計和開發一個多語言版本的網站前,需要考慮下列因素:
1、應用字符集的選擇
一個定位于不同語言國家的企業網站勢必需要提供多種語言版本的產品和銷售信息來滿足其世界各地使用不同語言的客戶和合作伙伴,其中包括法語、德語、意大利語、葡萄牙語、西班牙語、阿拉伯語等等。但有一個問題卻極易被網站設計者們所忽略。這就是網站的字符集設置問題。
一般我們使用的是簡體中文(GB2312)字符集,而對多語言網站來說,中文字符集卻可能會使你辛辛苦苦的努力功虧一簣。原因很簡單:就是這個毫不起眼的小小字符集在作怪。
計算機應用領域中存在著幾十種互不相同的字符集,而不同語言客戶在瀏覽不同語言網頁時,往往會因為相互間所使用字符集無法兼容而出現亂碼情況。我們在瀏覽國外一些網站時,往往也會出現為了能正常地看到網站上的信息而不得不在各種字符集之間來回切換的情況。
試想一下:如果一個網站提供了中,英,法,德等多種語言版本的內容,內容全之又全,設計美侖美奐。我們在中文編碼環境下瀏覽這些非中文版本的頁面覺得非常完美,現在一個法國客戶對你的產品發生了興趣,當他進到法語版面一看—亂碼多多,甚至可能整個版面都一塌里糊涂。你的網站再下大工夫又有什么意義呢?
所以對提供了多語言版本的網站來說,Unicode字符集應該是最理想的選擇。
它是一種雙字節編碼機制的字符集,不管是東方文字還是西方文字,在Unicode中一律用兩個字節來表示,因而至少可以定義65536個不同的字符,幾乎可以涵蓋世界上目前所有通用的語言的每一種字符。所以在設計和開發多語言網站時,一定要注意先把非中文頁面的字符集定義為“utf-8”格式,即:
√:
×:
這一步非常重要,原因在于若等頁面做好之后再更改字符集設置,可說是一件非常非常吃力不討好的工作,有時候甚至可能需要從頭再來,重新輸入網站的文字內容。
2、語言書寫習慣&導航結構
有些國家的語言書寫習慣是從右到左,例如許多中東地區所使用的阿拉伯語,波斯語和希伯來語等等。如果你的市場目標是這些語言的國家,那么在網站設計中就需要考慮這些特殊的語言書寫習慣。而且如果你在網站導航結構設計中使用的是一個豎直導航欄,這時候就應該把它放在右邊,而不是象我們習慣的那樣放在左邊了。
3、數據庫驅動型網站
對一個數據庫驅動型的網站,尤其是當客戶可以留言并向數據庫添加信息時,則應當考慮如何從技術上實現對不同語言數據信息的收集和檢索。
4、搜索引擎&市場推廣
對多語言網站來說,搜索引擎優化(SEO)確實是個大問題。而且還需要注意的是:并非所有的主流搜索引擎都會支持多語言網頁,這也就是為什么一個多語言的網站不一定被所有的主流搜索引擎收錄。當然Google不存在這樣的問題。
其次需要考慮,不同語言所面向的不同市場目標國家和客戶群體中習慣使用什么搜索引擎或門戶網站進行搜索? 就象我們習慣用土生土長的百度搜索一樣,在一些語言國家使用最為廣泛的可能仍然是其本國的搜索引擎或門戶網站。
最好的辦法是找一個專業的網站推廣公司來幫助進行市場調研。調研內容主要應包括:目標市場國家或地區對什么搜索引擎或門戶網站的使用率最高? 一些主要的門戶網站的用戶真實查詢率又是多少? 這一點尤為重要。就象我們常使用新浪、搜狐等大型國內門戶網站,但一般更多是為了使用其郵件服務。而查詢的話還是喜歡百度或Google一樣,你需要了解在這些人們青睞有加的門戶網站上,到底有多少人是奔查詢而來的。充分的市場考察才能做到有的放矢,從而保證最豐厚的投資回報。