您現在的位置是:電腦技術吧?>? 編程技術 ??>??漢字編碼中不支持,漢字編碼的敘述中錯誤的是??>??正文詳情

漢字編碼中不支持,漢字編碼的敘述中錯誤的是

楊思菱2019-12-08 10:02:30 人圍觀
簡介下列關于微型機中漢字編碼的敘述關于JSP/servlet中的DBCS字符編碼在Internet上有很多優秀的文章和討論。本文對它們進行了一些整理,并對ibmwebsphereapplicat漢字庫中儲存漢字的編碼是

網上就 JSP/Servlet 中 DBCS 字符編碼問題有許多優秀的文章和討論,本文對它們作一些整理,并結合 IBM WebSphere Application Server 3.5(WAS)的解決方法作一些說明,希望它不是多余的。

  內容:  問題的起源  GB2312-80,GBK,GB18030-2000 漢字字符集及 Encoding  中文轉碼時?、亂碼的由來  JSP/Servlet 漢字編碼問題及在 WAS 中的解決辦法  結束語  參考文章  1. 問題的起源  每個國家(或區域)都規定了計算機信息交換用的字符編碼集,如美國的擴展 ASCII碼, 中國的 GB2312-80,日本的 JIS 等,作為該國家/區域內信息處理的基礎,有著統一編碼的重要作用。

字符編碼集按長度分為 SBCS(單字節字符集),DBCS(雙字節字符集)兩大類。

早期的軟件(尤其是操作系統),為了解決本地字符信息的計算機處理,出現了各種本地化版本(L10N),為了區分,引進了 LANG, Codepage 等概念。

但是由于各個本地字符集代碼范圍重疊,相互間信息交換困難;軟件各個本地化版本獨立維護成本較高。

因此有必要將本地化工作中的共性抽取出來,作一致處理,將特別的本地化處理內容降低到最少。

這也就是所謂的國際化(I18N)。

各種語言信息被進一步規范為 Locale 信息。

處理的底層字符集變成了幾乎包含了所有字形的 Unicode。

  現在大部分具有國際化特征的軟件核心字符處理都是以 Unicode 為基礎的,在軟件運行時根據當時的 Locale/Lang/Codepage 設置確定相應的本地字符編碼設置,并依此處理本地字符。

在處理過程中需要實現 Unicode 和本地字符集的相互轉換,甚或以 Unicode 為中間的兩個不同本地字符集的相互轉換。

這種方式在網絡環境下被進一步延伸,任何網絡兩端的字符信息也需要根據字符集的設置轉換成可接受的內容。

  Java 語言內部是用 Unicode 表示字符的,遵守 Unicode V2.0。

Java 程序無論是從/往文件系統以字符流讀/寫文件,還是往 URL 連接寫 HTML 信息,或從 URL 連接讀取參數值,都會有字符編碼的轉換。

這樣做雖然增加了編程的復雜度,容易引起混淆,但卻是符合國際化的思想的。

  從理論上來說,這些根據字符集設置而進行的字符轉換不應該產生太多問題。

而事實是由于應用程序的實際運行環境不同,Unicode 和各個本地字符集的補充、完善,以及系統或應用程序實現的不規范,轉碼時出現的問題時時困擾著程序員和用戶。

  2. GB2312-80,GBK,GB18030-2000 漢字字符集及 Encoding其實解決 JAVA 程序中的漢字編碼問題的方法往往很簡單,但理解其背后的原因,定位問題,還需要了解現有的漢字編碼和編碼轉換。

  GB2312-80 是在國內計算機漢字信息技術發展初始階段制定的,其中包含了大部分常用的一、二級漢字,和 9 區的符號。

該字符集是幾乎所有的中文系統和國際化的軟件都支持的中文字符集,這也是最基本的中文字符集。

其編碼范圍是高位0xa1-0xfe,低位也是 0xa1-0xfe;漢字從 0xb0a1 開始,結束于 0xf7fe;  GBK 是 GB2312-80 的擴展,是向上兼容的。

它包含了 20902 個漢字,其編碼范圍是 0x8140-0xfefe,剔除高位 0x80 的字位。

其所有字符都可以一對一映射到 Unicode 2.0,也就是說 JAVA 實際上提供了 GBK 字符集的支持。

這是現階段 Windows 和其它一些中文操作系統的缺省字符集,但并不是所有的國際化軟件都支持該字符集,感覺是他們并不完全知道 GBK 是怎么回事。

值得注意的是它不是國家標準,而只是規范。

隨著 GB18030-2000國標的發布,它將在不久的將來完成它的歷史使命。

  GB18030-2000(GBK2K) 在 GBK 的基礎上進一步擴展了漢字,增加了藏、蒙等少數民族的字形。

GBK2K 從根本上解決了字位不夠,字形不足的問題。

它有幾個特點,  它并沒有確定所有的字形,只是規定了編碼范圍,留待以后擴充。

  編碼是變長的,其二字節部分與 GBK 兼容;四字節部分是擴充的字形、字位,其編碼范圍是首字節 0x81-0xfe、二字節0x30-0x39、三字節 0x81-0xfe、四字節0x30-0x39。

  它的推廣是分階段的,首先要求實現的是能夠完全映射到 Unicode 3.0 標準的所有字形。

  它是國家標準,是強制性的。

  現在還沒有任何一個操作系統或軟件實現了 GBK2K 的支持,這是現階段和將來漢化的工作內容。

  Unicode 的介紹......就免了吧。

  JAVA 支持的encoding中與中文編程相關的有:(有幾個在JDK文檔中未列出)  ASCII 7-bit, 同 ascii7

版權聲明:本文由 楊思菱 整理編輯。

原標題:下面關于漢字編碼的敘述中錯誤的是,漢字編碼中每個字節的最高位

轉載注明出處:http://www.dn9ww09s.icu/program/15230.html

文章評論

    共有條評論來說兩句吧...

    用戶名:

    驗證碼:

作者推薦

  • oracle節點,oracle怎么看所有節點

    oracle節點,oracle怎么看所有節點 相關圖片oracle遞歸查詢子節點Select trans ID from trans Inst, where connect by IsLeaf = 1 starts from trans ioracle查詢子節點...

  • 異步機制,異步處理機制

    異步機制,異步處理機制 相關圖片異步本文主要介紹對JavaScript編程中同步和異步機制的深入理解。不僅Ajax已經滲透到了各個角落,而且node.js的流行也使得js異步編程特別具有吸引力。可異步任務處理機制理解...

  • 策略模式,狀態模式和策略模式

    策略模式,狀態模式和策略模式 相關圖片命令模式和策略模式本文主要介紹JavaScript的策略模式編程,包括使用函數和類作為策略的情況,以及在多種環境下的策略模式。請參考我最喜歡的策略設計模式為您的朋友。我盡量多用...

  • HTTP協議是,什么是HTTP協議

    HTTP協議是,什么是HTTP協議 相關圖片http基于什么協議HTTP協議是由Tim Berners-Lee發明的,他被稱為web之父。HTTP協議完全基于文本。瀏覽器通過HTTP協議與服務器交互,默認為端口80。您還可以HTTP協議稱為...

  • 點擊按鈕跳轉,如何快速點擊頁面的按鈕

    點擊按鈕跳轉,如何快速點擊頁面的按鈕 相關圖片點擊按鈕彈出輸入框本文主要介紹jQuery實現按鈕點擊全選/取消全選單選框/復選框文本框表單驗證的相關資料。對于您的朋友,請參閱jQuery實現按鈕單擊全選/取消選擇單選框/復選點擊按...

  • php explode函數,matlab中explode函數

    php explode函數,matlab中explode函數 相關圖片matlab中explode關于PHP split string expand函數的用法,使用expand函數將字符串拆分成數組。這里有幾個例子供你參考。PHP數組和擴展函數應用程序示例供strreplace函數...

  • 此頁面需要在極速模式下顯示,極速模式怎么設置

    此頁面需要在極速模式下顯示,極速模式怎么設置 相關圖片找不到兼容性視圖設置標題:JSP頁面查詢顯示通用模式作者:Evan郵箱:Evan[[email protected]背景:1。需要在JSP中以列表模式2顯示數據庫查詢結果。在良好的J極速360切換不了兼容模式...

  • 名詞解釋,LAK名詞解釋

    名詞解釋,LAK名詞解釋 相關圖片標準預防的名詞解釋本文主要介紹Python中幾種常見的名詞解釋。這種解釋也適用于其他編程語言。本文解釋了loop、iteration、recursion、traversal等名詞病理名詞解釋...

  • excel函數實例教程,函數

    excel函數實例教程,函數 相關圖片excel函數運用教程ASP函數和ASP過程提供了一種方法來創建可用于重新編程代碼的模塊,并避免在執行特定任務時一次重寫一個塊的代碼。如果在ASP頁中沒有任何函數/程序,則當ASP頁coun...

  • 2c,8c

    2c,8c 相關圖片1c本文主要介紹C?webclient類的使用實例。本文介紹如何使用webclient下載文件,openwriter打開流,使用指定的方法將數據寫入URI并上載文件c點...

熱評文章

  • oracle數據庫基礎,oracle創建數據庫

    oracle數據庫基礎,oracle創建數據庫 相關圖片oracle數據庫怎么打開甲骨文1。(1)SQL*plus命令行工具(注意:在啟用反斜杠(/)之前必須添加空格):(2)運行命令2。連接到Oracle數據庫(1)SQL*plus連接成功orical數據庫...

  • 如何獲取地址欄參數,如何在地址欄添加參數

    如何獲取地址欄參數,如何在地址欄添加參數 相關圖片asp 加密地址欄參數ASP get address bar參數代碼====================函數名:joinchar角色:add?或者參數:strurl----URLjs獲取地址欄參數...

  • file exists,file exists 什么意思

    file exists,file exists 什么意思 相關圖片exists在本文中,我們將解釋PHP中的文件存在函數,以確定文件或目錄是否存在。我們會附上一些經典的例子,你可以參考它,如果你需要的話。描述:BooFieleI存在(Stfile.separator...

  • visibility,htmlvisibility

    visibility,htmlvisibility 相關圖片high visibility本文演示了jQuery可見性過濾器:hidden和:visibility的用法。與您分享以供參考。具體分析如下:隱藏匹配所有不可見元素。如果使用CSS的visiadvisability...

  • 電腦文件夾代碼,文件代碼

    電腦文件夾代碼,文件代碼 相關圖片文件夾刪除主要任務是獲取當前目錄的路徑,然后確定文件夾是否存在。如果不是,創建它。Define('dir'root',str'replace(','/',dirname(文件夾軟件...

  • aspmvc文件上傳,asppost文件上傳

    aspmvc文件上傳,asppost文件上傳 相關圖片asp上傳組件一、解決方案:IE7或更高版本實際上可以選擇是否發送完整的本地路徑進行文件上傳,可以在IE的Internet選項中設置,如下圖所示:1。互聯網安全選項:2。完整asp文件上傳繞...

  • php關鍵字,php定義靜態變量的關鍵字

    php關鍵字,php定義靜態變量的關鍵字 相關圖片php 多繼承本文的例子描述了PHP自動獲取關鍵字的方法。與您分享以供參考。具體實現方法如下:代碼如下:$mincipin=5;//最小詞頻為$minlen=4;//最小關鍵php超全局變量...

  • 數據庫效率比較,提高數據庫效率

    數據庫效率比較,提高數據庫效率 相關圖片為了提高數據庫的查詢效率Java服務器頁面(JSP)從服務器端促進了程序的快速開發,決定了它成為一種流行的工具。雖然僵硬的一面仍然存在,但是不管它包含多少缺點,JSP可以為Web程...

  • execute,execute怎么用

    execute,execute怎么用 相關圖片mainexecuters.open和conn.executors.open和conn.execute的區別在于它們在效率上或在哪個方面和哪個方面更好。如果你直接從網上復制粘貼,就不submit和execute...

  • 參數配置,配置中心

    參數配置,配置中心 相關圖片電腦有哪些配置首先,下載工具:我建議初學者使用EDITPLUS JDK。我認為,如果您使用JB、eclipse、jcreator,在一開始就很方便,但它確實讓初學者不知道如何電腦的配置...

關注微信

变脸官网查询