问题标签 [cjk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unicode - 多字节字符集中的换行控制字符
我有一些 Perl 代码可以将换行符和换行符转换为规范化形式。输入文本是日文,所以会有多字节字符。
是否仍然可以逐字节地进行这种转换(我认为目前可以),还是我必须检测字符集并启用 Unicode 支持?换句话说,流行的编码(Shift-JIS、EUC-JP、UTF-8、ISO-2022-JP)是否使用字节作为其字符集的一部分,可能会被误认为是 ASCII 控制字符?
我只需要 CR 和 LF 就可以工作。
更新:添加了 ISO-2022-JP。那是它的时髦转义序列看起来最麻烦的一个......
.net - 中文语言代码
我们正在将旧的 .net 1.1 网站更新到 2.0。本站目前支持中文(繁体)和中文(简体)
尝试使用以下代码检测语言和文化时出现运行时错误:zh-CHS(simified)和 zh-CHT(traditional):
请选择特定的文化,例如zh-CN、zh-HK、zh-TW、zh-MO、zh-SG。
来自:System.Globalization.CultureInfo.CreateSpecificCulture(字符串名称)
看来这些是过时的语言/文化代码。是否有人对我如何将这些语言映射到受支持的特定国家/文化有任何见解?
java - 如何用java将汉字保存到文件中?
我使用下面的代码将汉字保存到一个.txt文件中,但是当我用写字板打开它时,我无法阅读它。
我能做些什么 ?我知道如果我将汉字剪切并粘贴到写字板中,我可以将其保存为 .txt 文件。我如何在 Java 中做到这一点?
unicode - 带有汉字的文件如何知道每个字符使用多少字节?
我已阅读 Joel 的文章“每个软件开发人员绝对、肯定必须了解 Unicode 和字符集(没有借口!)”,但仍然不了解所有细节。一个例子将说明我的问题。看看下面这个文件:
(来源:yart.com.au)
我在二进制编辑器中打开了文件,仔细检查了第一个汉字旁边的三个 a 中的最后一个:
(来源:yart.com.au)
据乔尔说:
在 UTF-8 中,从 0 到 127 的每个代码点都存储在一个字节中。只有 128 及以上的代码点使用 2、3 存储,实际上最多 6 个字节。
小编也是这么说的:
- E6 (230) 高于代码点 128。
- 因此,我将以下字节解释为 2、3,实际上最多 6 个字节。
如果是这样,什么表明解释超过 2 个字节?E6 后面的字节如何表示?
我的汉字是按 2、3、4、5 还是 6 字节存储的?
javascript - 日语/汉字的编程技巧
我有一个想法,可以编写一些网络应用程序来帮助我和其他人更好地学习日语,因为我正在学习日语。
我的问题是该网站主要是英文的,所以它需要混合流利的日文字符,通常是平假名和片假名,但后来是汉字。我越来越接近实现这一目标;我发现页面和源文件需要是 unicode 和 utf-8 内容类型。
但是,我的问题出在实际编码中。我需要的是操作假名的文本字符串。一个例子是:
けす 我需要把那个动词转换成 te 形式的 けして。我更喜欢在 javascript 中执行此操作,因为这将有助于进行更多操作,但如果我必须进行 DB 调用并将所有内容保存在 DB 中。
我的问题不仅是如何用 javascript 来做,还有用其他语言做这些事情的一些技巧和策略。我希望更多地参与语言学习应用程序,但在这方面我迷失了。
sql-server - sql server 2005 xml更新查询汉字
我正在尝试用中文字符更新标签的值。但是它不添加中文字符。相反,它添加了“???” . 例如 update table set col.modify('replace value of (/tag/text())[1] with "我"') where .. 非常感谢任何帮助
谢谢本
mobile - 中国移动软件开发?
根据我的假设(),那里有数亿部中国手机(或品牌手机的克隆)。这些手机的固件和操作系统似乎是相同的。这些电话仅在设计上有所不同,并且可能是硬件。
我想知道这些手机是否有任何开发工具包或软件开发支持。这些手机中的操作系统和/或固件是什么?这些是开源的还是在线可用的?这些手机支持java吗?从哪里可以在线获取有关这些手机及其软件的更多信息?
提前非常感谢。
database - 允许控制使用中文文本
我正在监督一个 asp.old 网络应用程序的大修,以便将订单输入 .net。到目前为止很简单,项目发生了一个有趣的转变,我还需要确保它可以支持中文文本的数据输入。
我现在只是在看数据输入。
我遇到了一个问题,即在某些条件下,必须只允许以英语输入数据(当订单涉及中国以外的国家时),以及允许以中文等输入的其他条件(当订单仅限本地时)。
数据库目前是单字节存储。关于我如何适应这个的任何建议?目前的想法是 i) 为中文文本维护一个单独的多字节数据库。ii)。首页上的 Javascript 仅强制执行拉丁文本...
当然,我的时间表很短——我只写到 CJKV 的第 11 页。任何指导将不胜感激!谢谢。
encoding - 使用 Tcl 编码命令将繁体中文转换为简体中文
我支持一个用 Tcl 编写的网站,它以繁体中文 (big5) 显示数据。然后我们有一个 Java servlet,使用 mandarintools.com 的翻译代码,将页面请求翻译成简体中文。指定到翻译代码的转换是从 UTF-8 到 UTF-8S;Java 显然正确地将数据转换为 UTF-8。
Java 翻译代码可以工作,但速度很慢,而且由于该网站是用 Tcl 编写的,因此另一个列表中的某个人建议我尝试使用它。不幸的是,Tcl 不支持 UTF-8S,我一直无法弄清楚用什么翻译来代替它。我已经尝试过 gb2312、gb2312-raw、gb1988、euc-cn ......都导致乱码。我的假设是 Tcl 也正在转换为 UTF-8,尽管我已经尝试先从 big5 转换它并没有帮助。
我的测试代码如下所示:
我也试过
但这并没有改变什么。
有没有人有足够的经验来帮助我解决这个问题?
eclipse - 在eclipse控制台输出中显示汉字
我试图在eclipse控制台中以GB2312编码显示一些汉字。我意识到在运行对话框 -> 通用选项卡 -> 控制台编码中,我可以选择默认 CP1252 以外的其他编码。但是,如何添加其他编码,例如 GB2312?
谢谢。